🦸🏻#7: 从 Agentic AI 到 Physical AI
黄仁勋如何“逆向工作”,为世界创造未来 + 2025 年及以后值得关注的 AI 和机器人趋势
本周,发生了两件重要事件——一场 CES 主题演讲和一场与 CES 金融分析师的问答——黄仁勋在其中分享了他对未来的愿景。这显然是 Agentic AI 与机器人技术的结合,或者他称之为 Physical AI。在今天的 Agentic 系列节目中,我想重点关注黄仁勋对 Agentic AI 的看法、向物理智能的进展,以及我们应在这个转变过程中牢记的 actionable insights。他预测,在 10 年内,机器人可能会达到一个连怀疑论者都会惊讶的能力水平。正如黄仁勋所说,这是一个价值数百万美元的产业。我再次强烈建议观看他的整个 CES 演示(或者我应该说,表演?),你会看到未来。准备好了吗?让我们一起窥探未来。
黄仁勋
我逆向工作,我说,‘好的,英伟达需要做什么才能为世界实现那个未来?我需要做什么才能让世界实现它?’
黄仁勋,英伟达魅力四射、富有远见的首席执行官,在主题演讲中不惧展现一点笨拙,长期以来一直站在定义 AI 前沿的最前端。在他最近的 CES 演讲中,黄仁勋阐述了 AI 演进的变革性愿景——一个数字代理无缝执行复杂任务,以及物理 AI 系统从根本上重塑我们与现实世界互动方式的世界。
以下是他的 AI 演进路线图
- 感知 AI:现代机器学习的基础,系统被训练来解释和分析数据。
- 生成式 AI:当今的焦点——模型创建文本、图像和其他内容,正在改变游戏、营销和媒体等行业。
- Agentic AI:自主代理的兴起,能够管理工作流程、解决问题和提供洞察。
- 物理 AI:下一步——AI 系统获得实体化,在物理世界中操作和互动。
黄仁勋认为人形机器人是一个价值数十亿美元的产业,但没有可运行的 Agentic 系统是不可能实现的。所以,让我们仔细看看是什么让我们达到了这一点。
Agentic AI 时代
许多人在预测中宣布 2025 年是“代理之年”。黄仁勋也对此着迷,他将这些系统描述为“新数字劳动力”,能够对任务进行推理,将其分解为可操作的子任务,检索相关数据,并使用工具生成高质量结果。与传统软件系统不同,Agentic AI 能够适应动态上下文并自主或半自主运行,增强各行业的人类能力。
📨 如果您想直接在收件箱中收到我们的文章,请在此订阅
Agentic AI 的独特之处?
- 推理和适应性: 这些系统能够分解复杂问题,分析上下文因素,并动态地确定任务优先级。
- 多模态能力: 利用基础模型,它们整合语言、视觉和音频,处理来自多个来源和格式的信息。
- 工具和数据集成: Agentic AI 不仅仅处理静态输入;它还与工具交互,从数据库或网络检索信息,并合成洞察。
根据黄仁勋的说法,有哪些实际应用?
黄仁勋设想 Agentic AI 将无处不在,涵盖各行各业和各种用例。例如:
- 知识工作者:AI 研究助理简化了对学术期刊或财务报告等复杂文档的分析,将其转换为摘要或播客等易于访问的格式。
- 工业优化:代理监控制造或物流过程,识别低效率并提出改进建议。
- 软件安全:AI 代理持续扫描代码库中的漏洞,为开发人员提供实时反馈。
- 医疗保健和药物发现:虚拟实验室代理筛选数十亿种化合物,比以往更快、更经济地识别有前途的药物候选物。
这些例子突出了 Agentic AI 如何简化和改进通常依赖人力完成的任务。
“AI 的下一个前沿是 Physical AI”
虽然 Agentic AI 专注于数字任务,但下一个前沿在于 Physical AI。黄仁勋将 Physical AI 描述为能够理解现实世界并与之交互的系统。这一转变涉及开发能够理解物理动力学、空间关系和环境细微差别的 AI 模型——使它们能够在非结构化、现实世界环境中运行。
什么是 Physical AI?
Physical AI 建立在 Agentic 系统之上,但融入了对物理世界的理解。它要求模型掌握
- 几何和空间推理:理解三维空间以及物体在其中的相互作用。
- 物理动力学:控制现实世界运动和行为的重力、摩擦力和惯性等概念。
- 时间感知:预测并适应随时间变化的能力,例如不断变化的天气条件或物体轨迹。
Physical AI 是一个新概念吗?
是,也不是。机器人产业是一个成熟的产业,围绕着它有许多引人入胜的研究。你可能还记得,OpenAI 曾经也有一个机器人研究部门。早在 2019 年,它解决魔方的机器人手臂就登上了头条,展示了强化学习如何教会机器处理复杂的物理任务。这感觉就像一个变革性事物的开始——AI 和机器人技术的无缝融合。
但在 2021 年,OpenAI 静悄悄地退出了机器人领域。这个决定并非因为失败,而是战略性的转变。机器人技术需要硬件集成、资源密集型基础设施,以及解决模拟环境与现实世界之间顽固差距的方案。对于 OpenAI 来说,回报不值得付出这些努力。他们决定加倍投入像 GPT 这样的大型语言模型——在 2021 年,GPT-3 已经展现出巨大的潜力,能够产生更广泛的影响。
多亏了这个决定,我们现在有了 ChatGPT 和生成式 AI 的兴起,这使得 Agentic 系统提升到了一个全新的水平(正如你可能猜到的,代理也背负着惊人的发展历史)。
通过促成 Agentic AI 的这一飞跃,OpenAI 为其他人重新构想可能性奠定了基础。黄仁勋受到这一转变的启发,预见了由先进 AI 赋能的机器人技术的未来 = Physical AI。他逆向工作,看到了英伟达如何在将这一未来变为现实、构建工具和基础设施方面发挥关键作用。
“逆向工作”法
黄仁勋的“逆向工作”法始于将 AI 的未来设想为跨行业的基础层,其中 AI 代理和物理系统自主且智能地运行。从这个愿景出发,他确定了必要的元素——可扩展的架构、强大的训练系统以及英伟达必须开发以实现这一未来的工具。黄仁勋逆向工作,概述了三种关键计算机——对于现代 AI 和机器人系统至关重要的基本计算架构
- 训练计算机:设计用于处理训练 AI 模型所需的庞大数据和计算能力。这些计算机对于生成准确可靠的 AI 模型至关重要。
- 模拟和数字孪生计算机:能够创建数字孪生和模拟,提供一个虚拟环境,用于在实际部署之前测试和优化 AI 和机器人系统。
- 部署计算机:负责在实际应用中部署训练好的模型。示例包括汽车或机器人系统中的 AI 计算机,它们提供自主操作所需的计算能力。
为什么机器人现在变得如此重要?黄仁勋认为它们可能成为有史以来最大的计算机产业
全球劳动力人口正在下降,在一些制造业大国,这种下降尤为显著。对于这些国家来说,确保机器人成为其产业生产力不可或缺的一部分,已成为一项战略要务。由于劳动力没有可预见的增长,开发和部署先进机器人系统的紧迫性从未如此之高。
黄仁勋
一切会移动的东西都将是自主的。这是必然的结论。机器人没有限制。它很可能成为有史以来最大的计算机产业,原因是我们不需要比人更多的手机。但是,你知道,机器人,你可以制造任意数量。
机遇
- 行业特定 AI 代理:从医疗保健到物流,专业代理可以彻底改变工作流程和生产力。
- 机器人和自动化:Physical AI 有潜力改变制造业、仓储和自动运输等行业。
- 通用机器人:随着合成数据和模仿学习的进步,在非结构化环境中操作多功能人形机器人的梦想比以往任何时候都更接近。
英伟达的战略:构建一个产业,而不仅仅是产品
黄仁勋阐述的英伟达战略的一个决定性方面是,它致力于塑造和赋能整个行业——而不仅仅是创造个别产品。英伟达就像一辆内置 3D 打印机的坦克:在进步中永不停止,不断在计算和 AI 领域构建新的现实。随着每一次进步,英伟达重塑着格局,打造其他公司赖以创新的框架。其庞大的资源同时推动着硬件、软件和生态系统的进步,赋能各行业围绕其轨道发展和扩展。其战略的核心是一个生态系统,为开发者、研究人员和企业提供在英伟达基础上进行构建的工具,使其始终是创新的事实选择。
他们可能会也可能不会制造自己的机器人,英伟达将自己定位为在各行业扩展 Physical AI 的催化剂。
经济效益将如何实现?
正如黄仁勋所描述的,人形机器人技术经济学围绕着部署的便捷性、可扩展性以及利用规模经济展开
- 旧厂房部署优势:人形机器人脱颖而出,因为它可以在现有环境中(旧厂房)部署,而无需对基础设施进行重大更改。与通常需要定制设施(新厂房部署)的带轮或履带机器人不同,人形机器人可以无缝融入当前操作。这类似于智能手机的普及,因为它符合用户的现有生活方式(例如,放入口袋),所以不需要新的基础设施。
- 易于部署和可扩展性:人形机器人部署的简便性允许快速扩展。一旦它们被引入设施或操作中,就可以在各种环境中快速复制。这种可扩展性导致采用率提高,随着数量的增加,每单位成本降低。
- 规模经济和技术飞轮:随着人形机器人的部署规模扩大,规模经济开始发挥作用。大规模生产和部署所实现的成本效率推动了技术飞轮,加速了创新。这种循环——采用推动成本降低,从而导致进一步采用——确保了技术的持续改进和应用的扩展。
- 为行业提供定制解决方案:英伟达专注于赋能行业,而不是直接竞争。通过提供 AI 企业解决方案、Agentic AI 工具包以及模块化硬件/软件平台等工具,他们使汽车、机器人等多样化行业能够将 AI 整合到其运营中。这种适应性允许丰田、Waymo 和特斯拉等公司根据其特定需求定制英伟达的堆栈,从而增强自身的竞争优势。
- 加速创新:易于部署、扩展和飞轮效应的结合意味着人形机器人将看到快速发展。
英伟达预测,在 10 年内,这些机器人将达到连怀疑论者都会惊讶的能力水平。正如黄仁勋所说,这是一个价值数百万美元的产业。
长期博弈
英伟达在 Blackwell GPU 和 AI 模拟平台等基础技术方面的投资,旨在支持未来数十年的行业发展。这种长期视角确保了随着 AI 采用呈指数级增长,英伟达仍然不可或缺。通过将自身战略与更广泛的技术趋势保持一致,英伟达确保它不仅是 AI 革命的一部分,更是定义其方向的领导者。
你猜怎么着?2025 年 1 月,OpenAI 宣布重返机器人领域。Caitlin Kalinowski 分享了硬件工程师和机器人专家(具有自动驾驶汽车、无人机、轮式机器人、人形机器人和软体机器人等领域经验)的招聘信息。该团队旨在解决曾经导致 OpenAI 退出机器人领域的挑战,现在则利用多年的 AI 进步和更深入的行业洞察。这一转变突显了具身 AI 日益增长的潜力。
结论
那么,这给我们留下了什么?今年,AI 代理将迎来腾飞——从软件工程、数字营销和客户服务开始。但黄仁勋设想了一个 Agentic AI 和 Physical AI 融合的未来,以重塑从制造业到医疗保健的各个行业。对于许多人口下降的国家来说,依赖机器人对于维持生产力和经济增长至关重要。从自动驾驶汽车到工业机器人,AI 正在迅速成为未来产业的支柱。
这些数百万个新机器人和自动驾驶汽车将为支持数据中心带来数十亿美元的投资。AI 不再仅仅是一个工具;我们正在走向使用工具的代理和助手——一个高于计算堆栈的全新层。每个工厂都将拥有一个数字孪生,模拟操作以优化关键绩效指标,然后进行实际部署。黄仁勋的警告很明确:如果您的企业尚未利用 AI 助手,您就已经落后了。
OpenAI 重新关注机器人技术进一步强化了这一转变。他们的回归标志着具身智能正成为整个领域的优先事项,标志着 AI 演进向前迈出了关键一步。
📨 如果您想直接在收件箱中收到我们的文章,请在此订阅