机器人会跳舞,却捡不起一串钥匙

对话毫厘智能CEO郦可
100万辆车、50亿公里验证之后,他决定为Physical AI打下第一根地基。

“What I cannot create, I do not understand.”
我无法创造的,我就无法真正理解。
——理查德·费曼,1988
2026年1月,CES开幕第一天。
拉斯维加斯会展中心的具身智能展区人头攒动,来自全球的人形机器人依次登场,动作流畅得令人屏息。没有人注意到的是,这些机器人用的芯片来自消费电子,传感器借道汽车供应链,仿真平台从自动驾驶移植。
它们是用别人的零件拼出来的。
一个售价50万的人形机器人,能后空翻、会跳《科目三》,却捡不起掉在地上的一串钥匙。
而郦可脑海里挥之不去的,是另一个画面:如果底层芯片和大脑模型能做得足够好,一个能帮独居老人捡起掉在地上药片的机器人,就可能走进普通家庭。
两个画面之间,隔着一条鸿沟。那条鸿沟的名字叫“基础设施”。
这不是段子,是Physical AI行业正在发生的集体尴尬。当所有人都在谈论具身智能将重塑人类文明,一个反常识的现实浮出水面:这个万亿赛道,连属于自己的原生基础设施都还没有。结果就是:机器人惊艳于舞台,笨拙于生活。
“Physical AI需要拥有自己的‘英伟达’,但今天还没有。”「毫厘智能」董事长兼CEO郦可告诉36氪。这家成立三年的公司,已自研车规级高精度定位芯片、IMU模组和多源融合算法,在智能驾驶领域服务于头部整车企业,累计上车超100万套,覆盖行驶里程逾50亿公里——这不是实验室数据,是100万辆在城市峡谷、隧道、复杂路况里碾出来的50亿公里。
沙利文数据显示,2025年全球具身智能机器人市场规模升至54亿元,预计2030年将突破2000亿元。产业爆发前夜,郦可的判断是:构建Physical AI原生基础设施的时间窗口已经到了。
但首先需要回答一个更根本的问题——

1. 物理世界不是数字世界的投影
讨论Physical AI需要什么,必须回到一个第一性原理级别的问题:物理世界与数字世界的本质差异是什么?
- 数字世界是符号的世界。它的基本单位是比特,运作方式是逻辑,边界由人类定义。语言模型学习的是文本的统计结构——词与词之间的关系,概念与概念之间的逻辑。它掌握的是人类用来描述世界的符号系统。
- 物理世界是状态的世界。它的基本单位是能量与质量,运作方式是因果,边界由物理定律决定。光如何落在一个表面上,物体如何响应力,一个从未被相机捕捉过的角度看起来是什么样子——这些都无法从符号系统中推导出来,只能从物理世界本身学习。
这个差异,决定了为物理世界构建AI基础设施,不能从数字世界的方法论中简单移植。具身智能不是在“复用”汽车,是在“将就”汽车——将就出来的东西,撑不起万亿级的物理世界智能化变革。
郦可给出的答案是一个五层结构。在他看来,这五层并非技术堆叠,而是一个有机整体——任何一层的缺失,都会导致整个系统失效。
- 感知层是物理交互的起点。机器人的工作区域是全空间,比智能驾驶复杂百倍以上,视觉、触觉、姿态、位置、力控等各类感知信号的深度融合极其关键。感知一旦失真,世界模型随之崩塌。
- 计算层需要原生芯片。通用GPU或简单复用车载SoC显然并不够用,具身机器人需要搭载专门为物理交互设计,具备高性能、低功耗及高实时能力,并支持多传感器融合的原生芯片。
- 执行层的关键是算法从仿真到真实世界的无缝迁移。“机器人与物理世界打交道必须遵循一切物理规律,杯子很容易碎,牛奶打翻了怎么办。”
- 数据与仿真层,模拟器无法定义现实的全部,尤其是那些难以预知的“边缘情况(Edge Cases)”。本层的关键在于建立一套动态更新机制,将真实物理场景中的数据持续回流至模拟器,实时矫正仿真模型。通过这种“感知—训练—反馈”的迭代闭环,打破仿真与现实的边界,确保 AI 真正具备应对复杂物理世界的鲁棒性。
- 安全层贯穿始终。车规级只是起点。算法或硬件出错,可能造成人身伤害或工业场景巨额损失,容错空间几乎为零。
五个层次,缺一不可。
“智能驾驶需要看得越远越好,让车辆提前做好准备。机器人需要感知眼前的环境,与手边的东西打交道。”郦可说,“这是两种完全不同的物理交互哲学。”
这套五层架构并非毫厘智能的孤立判断。从产业实践到学术研究,越来越多独立的思考正在同一个结论上汇聚:Physical AI的感知、计算、数据、仿真、模型到执行,是一个不可拆分的有机整体。缺少任何一层,系统就无法真正理解物理世界。

2. 那次零下30度的异常,才是真正的起点
三年前的毫厘智能,没有急着冲进具身智能的赛道,而是先用三年时间在智能驾驶领域把方法论打磨成可以规模化验证的产品。
这套方法论叫“数据驱动、软硬结合”。但真正让它变成肌肉记忆的,不是寻常,而是一次刻骨铭心的异常。
2024年初,毫厘智能的IMU模组在某头部客户的冬季测试中出现间歇性定位漂移。团队排查了硬件设计、算法参数,两周没有找到根因。最终发现,问题出在一个极冷门的物理变量上:东北零下30度环境中,某元器件的温漂曲线与供应商标定数据存在微小偏差——这个偏差在实验室测试中永远不会暴露。
“那个月我们每天早上九点进会议室,凌晨两点出来,反复回灌实测数据到仿真平台,一条一条跑误差模型。”郦可回忆,“最后不是‘解决’了问题,是我们在那个项目里重塑了整个标定和验证流程。今天毫厘智能的测试标准里有一条——所有IMU模组必须经历-40℃到85℃的完整温变循环——就是从那次教训里长出来的。”
这不是一个技术故障被修复的故事,而是一个方法论被验证的故事:只有真实数据才能校准系统,仿真器永远算不出供应商手册里没写的偏差。
正是这种基因,让毫厘智能的产品在残酷的车规级市场中活了下来。
目前,毫厘智能自研的MOJANDA系列车规级高精度定位芯片,在严重遮挡场景下,定位精度较国际头部厂商u-blox同类产品提升约30%,首次定位时间缩短至秒级。SUMACO系列IMU模组在全温范围内零偏稳定性达到车规级顶尖水平。两大产品线已实现对国际厂商的国产替代,累计出货超100万套。
但在郦可看来,毫厘智能最深的护城河不是出货量,而是与头部客户共创中沉淀的方法论。
“越是资源雄厚的公司,越难做这种深度垂直整合。”郦可解释道。Physical AI原生基础设施需要芯片、硬件、模型作为一个闭环系统协同设计,大公司的组织逻辑天然倾向于模块化——不同部门负责不同层次,接口标准化,各自优化。这种方式在数字AI领域行之有效,在Physical AI领域却会产生致命的系统性缝隙。“我们从第一天起就把这三件事当成一件事来做,这是时间给的优势。”
更深一层的壁垒是认知。毫厘智能陪伴头部企业,共同走过了从规则时代到端到端、VLA乃至世界模型的全程演进。“客户投入大量资源用于AI学习,在芯片、操作系统、编译链上做深入布局,我们是其中的亲历者和共创者。这种认知,是买不来的。”
郦可有句被团队反复引用的话:“客户不是买我们的芯片,是买我们陪他们走过的那段‘弯路’。”

3. 每一张桌子都可能是智能体
形成一套行业基础设施,需要从大量实际项目中提炼需求的最大公约数。人形机器人、四足机器狗、割草机器人、低空飞行器——形态各异,但对感知、计算、数据、仿真等底层能力的需求是相同的。
水和电之所以成为基础设施,不是因为它们很重要,而是因为几乎所有人都需要它们,而单独提供的成本极高。Physical AI的底层能力,具有同样的结构性特征。
“这些共同数据需求就是基础设施的切入点。我们不会去做本体或者具体应用,而是提供底层的‘水电煤’。”郦可给出了三件要做的事情。
第一,构建数据底座。 Physical AI发展面临高质量数据极度稀缺的困境。毫厘智能将很快推出数据采集手套等产品,采集手部高精度动作、全身姿态、视觉等数据。“具身智能替代人,首先要学习人怎么动。”这些产品既是芯片设计和软件平台的养料来源,也可作为独立产品商业化,核心目标是构建“数据—模型—芯片”的正向飞轮。
第二,推出原生芯片。 基于采集的物理交互数据和对机器人场景的深度理解,推出native for Physical AI的感知与计算芯片。与车规级芯片不同,机器人芯片需要支持多传感器分布式部署、处理力触觉等柔性信号,还要具备低功耗、高精度同步能力——“这些在以往的车载场景里都是没有的。”
第三,平台与生态。 商业模式从卖硬件和算法解决方案,逐步扩展到仿真平台订阅、数据服务等多元化形式。从项目制共创开始,与头部客户共同迭代,等技术路线收敛再走向标准化产品和生态构建。
“当Physical AI时代真正到来,每一张桌子、每一个茶杯都可能是智能体,我们希望它们底层的感知和计算能力来自毫厘智能。”
这个愿景何时能落地?郦可给出明确判断:“2030年之前,Physical AI将完成从‘能用’到‘可靠’的跨越。以海量egocentric数据驱动的世界模型能力与基于数字AI Agent驱动的海量机器人计算图方法(GAP)两条曲线螺旋式上升,当两条曲线完成真正融合,就是拐点。”
而拐点的另一侧,是Physical AI真正“为每一个人而生”的可能。就像开篇那个画面——不是几十万的展台展品,是能走进普通人家的那台机器人。
当被问及如何定义“这件事成了”,郦可的回答很简单:
“有一天当大家谈论Physical AI基础设施时,会首先想到毫厘智能,然后是others。”
每一个基础设施时代的开端,都有一个时刻:技术已经存在,但还没有人知道它会改变什么。电力是这样,互联网是这样,GPU也是这样。
1988年,费曼在加州理工学院的黑板上写下那句话时,他已是量子电动力学的奠基人,路径积分的创立者。他用一生证明了自己真正理解物理学,却选择用这句话提醒所有人——理解的标准,永远是能否重新创造。
Physical AI的基础设施,需要的正是这种重建。它无法从任何既有领域移植而来,只能被重新定义。而那座底座上,刻着100万辆车用50亿公里写下的注脚。
当市场还在追逐具身智能本体时,毫厘智能选择做水下的冰山。这一定位意味着更长的研发周期,但也意味着一旦Physical AI爆发,其“芯片—硬件—模型”闭环将成为每一个玩家都绕不开的底座——而那座底座的可靠性,不是写在代码里,是刻在芯片晶体管和路上碾过的每一公里中。