大家还在讨论大模型、智能体这些概念的时候,一些科技公司的发布会已经开始提一个新词:Physical AI,中文叫物理AI,或者具身智能。

简单说,就是能到现实世界里干活的AI。
第一次听到这个说法,我也有点警惕。AI行业喜欢造新词,换汤不换药。但这次仔细看了看,感觉不太一样。不一样的地方不在于新概念,而在于AI的发展方向确实在变。AI的重点,正在从生成内容变成执行任务。
一、AI开始走出屏幕
过去两三年,我们大部分人用AI,都是在信息世界里。让AI写文章、改PPT、生成图片、帮忙写代码。这些事情做得再好,结果也还是停留在屏幕上,是一堆文字或一张图。
但现在开始变了。机器人、自动驾驶汽车、仓库里的搬运设备、工厂里的机械臂、医院里的辅助设备,这些领域的人开始尝试把AI接到真实世界里。
这一接,AI面对的麻烦就完全不一样了。它要开始处理:重力、摩擦力、速度快慢、东西会不会撞上、视线被挡住怎么办、材料软硬、温度高低、零件加工误差……这些都是现实世界才有的东西。
NVIDIA这家公司,近两年一直在推面向机器人和自动驾驶的Physical AI基础设施。他们做的事,本质上是同一个问题:让AI不只是看懂世界,还要能在世界里动起来。
二、在真实世界里犯错,代价很大
信息世界里有个最大的好处:试错成本很低。
文章写错了,改一下就行。代码运行报错,重新跑一遍就可以。图片生成得不好看,多点几次生成按钮就行。这些操作几乎不花钱,也不会有啥严重后果。
但现实世界完全不一样。
机器人在仓库里抓错了货,可能把货架碰倒,货物摔坏,设备也可能受损。自动驾驶汽车判断错了路况,可能撞车,人可能受伤。工厂里的一条生产线,因为AI出错停下来,停一小时就是几十万甚至上百万的损失。
所以物理AI最难的地方,不是让机器人看起来有多聪明,而是让它们能做到:稳定、安全、可靠、可控。能在真实环境里完成任务,不出错,或者出错时损失可控。
这也是为什么物理AI的发展速度,比生成式AI慢很多。生成式AI写错几个字没人会在意,但物理AI在实际工作中犯错,后果可能很严重。
三、传统自动化和物理AI不是一回事
很多人一听到物理AI,就觉得是机器人升级了。这个理解不准确。
传统的自动化解决的是什么事?是重复动作。比如工厂里一个机械臂,每天拧同一个螺丝,拧的位置、力度、路线全是提前设定好的。环境不能变,零件不能变,一变了它就不知道怎么办了。
物理AI想解决的是另一个问题:在会变化的环境里完成任务。
它需要具备几个能力:
听懂人的语言指令;
认出面前是什么东西;
判断当前的环境状况;
自己规划出动作步骤;
遇到意外情况能处理。
说白了,传统机器人是在执行写好的程序。物理AI是在理解具体的场景。这两者之间,差着一个数量级的难度。
四、从预测文字变成预测动作
过去几年,大模型能处理的东西一直在扩展:从能理解文字,到能理解图片,再到能理解视频。这每一步都不容易。
现在物理AI在往下一个阶段走:动作理解。
一个物理AI系统,不光要知道当前画面里发生了什么,还要能预测:
接下来几秒会发生什么?
我应该采取什么动作?
做什么动作才能完成目标?
这本质上是一次能力重心的转移:从预测下一个字是什么,变成预测下一个动作是什么。从回答问题,变成完成任务。从屏幕里的智能,变成现实世界里的智能。
这一点,是物理AI真正值得关注的核心。
五、2026年为什么被称为物理AI元年
很多人问,为什么是2026年?前几年不也有机器人做各种演示吗?
原因是,产业开始形成一个完整的闭环。以前很多机器人项目,更像是实验室里的演示。能走两步、抓个东西,拍个视频,但没法真正用在生产环境里。
现在不一样了。开始出现这样一个循环:
先在仿真环境里训练AI
然后部署到真实机器人上执行任务
执行过程中收集数据
数据回流用来改进模型
改进后的模型再次进入仿真训练

这个循环一旦跑起来,机器人就不再是一个硬件产品了。它变成了一个能持续学习、持续优化的生产节点。
所以“元年”这个词,不是说技术已经成熟了。元年的真正意思是:产业的整体结构开始成型了。有了训练环境,有了硬件载体,有了数据回流,有了优化闭环。这个结构比单个机器人的进步更重要。
六、普通人需要看懂什么
有人会问,物理AI跟我有什么关系?机器人又不会马上进我家。
最大的关系,不是机器人进家庭。而是这件事释放出一个明确的信号:未来最值钱的能力,不再是会用某个工具。
而是:看懂系统。
因为物理AI最终要解决的是系统问题。一个工厂要引入物理AI,你需要想清楚:
哪些生产环节适合交给AI做
哪些环节必须留给人来判断
数据怎么在机器和系统之间流动
遇到异常情况谁说了算
人和AI怎么配合干活
这些问题的答案,不是懂模型参数的人能回答的。真正能回答的,是懂这个行业、懂这个场景、懂整个业务流程怎么运转的人。
未来越来越值钱的人,不一定是最懂AI底层技术的人。而是最懂场景和系统的人。
七、三类人会获得新机会
按照这个逻辑,有三类人的机会在变大。
第一类:懂具体行业的人。比如在制造业干过十年的人,在物流行业管过仓库的人,在汽车行业做过生产管理的人,在医院里做过手术辅助的人,在农场管过种植的人。这些人手里有真实业务经验,知道哪个环节疼、哪个环节容易出问题。这些经验,恰恰是物理AI落地最需要的东西。
第二类:懂系统设计的人。物理AI不会独立工作。它需要跟业务流程对接,跟数据系统对接,跟组织里的人和岗位对接。能把这些东西串起来的人,比如产品经理、解决方案顾问、业务架构师,他们的重要性会持续上升。
第三类:懂认知传播的人。每一次大的技术变革,都会造成巨大的理解鸿沟。大部分人搞不清楚发生了什么,也搞不清楚跟自己有什么关系。这时候,真正有价值的内容,不是制造焦虑、标题党,而是能踏踏实实地帮助别人理解变化。未来的稀缺资源不是信息,而是判断力。能把判断力清晰地传递出去的人,永远有需求。
八、AI长出身体,人长出系统
过去两年,我们讨论AI,更多是讨论它怎么帮个人写得更好、画得更好。这是增强个人表达。
到了物理AI阶段,讨论的话题变了。AI正在从理解世界,走向介入世界。它不光是帮你想,也开始帮你做。
但越是这样,人的角色反而越重要。
因为有几个东西,必须由人来定:
AI负责执行,人负责定目标
AI负责行动,人负责定边界
AI负责优化效率,人负责承担责任
所以我对物理AI最核心的一个判断是:它不是让人退场,而是在逼人升级。升级成系统的设计者。
未来几年,一部分人会继续把AI当成聊天框,问一句答一句。另一部分人会把AI当成操作系统,调度各种能力完成任务。而物理AI,正是这个操作系统向现实世界延伸出去的那一步。
物理AI元年,真正值得关注的,不是机器人跳舞跳得多流畅,也不是哪家公司发布会讲得多热闹。
而是AI正在完成一次关键跨越:从理解世界,走向改造世界。
未来的竞争,也不会只发生在模型大小和算力高低上。而会发生场景、系统和现实世界的摩擦当中。
谁更懂场景,谁更懂系统,谁更懂真实世界怎么运转,谁就更有机会把AI变成自己增长的杠杆。
所以物理AI元年给我们的提醒,其实很简单:
AI正在长出身体。
而我们,也要开始长出系统。