首页 科技快讯 梅卡曼德邵天兰:“通用机器人”的吹牛竞赛与现实路径丨具身系列

梅卡曼德邵天兰:“通用机器人”的吹牛竞赛与现实路径丨具身系列

来源:晰数塔互联网快讯 时间:2025年02月13日 22:38



“太多人关注终局,更重要的是路径和速度。”

文丨程曼祺
编辑丨宋玮

这是《晚点 LatePost》 「具身智能对话」系列的第 9 篇。该系列将持续访谈智能机器人和自动驾驶产业链头部公司。往期文章见文末合集#具身智能对话。

AlphaGo 用神之一手战胜李世石的 7 个月后,围棋爱好者邵天兰从德国归国创业,成立梅卡曼德(Mech-Mind)机器人。

换算到 2023 年的 AI 热潮里,这是一个典型的技术 “少年天才”:清华本科毕业、德国慕尼黑工大机器人方向深造,在德国参与过机器人创业公司;回国创业时不过 27 岁,相当于 2023 年的 “95 后”。

而经过 8 年真实场景的摔打,拿过红杉、IDG、美团、启明、英特尔等头部机构融资的邵天兰现在说,“自己是搬砖的人”。

梅卡曼德的 3D 高精度相机和与之配合的感知、规划算法已进入上千个场景:既在金库码钱,也在砖厂搬砖,能检测汽车电池,也给浴缸钻孔,码放 5800 元一箱的五粮液。

他们的客户有上汽、蔚小理、丰田、宁德时代、美的、格力、富士康等,涵盖汽车、物流、金属加工、家电、3C、锂电、光伏等十几个不同行业。



梅卡曼德应用场景的部分例。

自 2020 年以来,据睿工业数据,梅卡曼德一直是中国 3D 视觉引导机器人市场第一名,市占率接近 40%。

2023 年的大语言模型带火了 AI 与机器人结合的 “具身智能” 赛道,通用机器人尤其是人形机器人领域诞生一批新公司,它们成立时就以更通用的前沿具身技术为目标。

已有数年工业、物流场景落地经验的邵天兰有观察这轮热潮的不同视角。

他看到机器人的一些进展被过分高估、Hype 弥漫行业,带来 “吹牛竞赛”:“创业公司必须不断夸张宣传,才能融到资;学界也要不断夸大工作效果才能发论文。”

不少人形机器人公司把工厂视为第一批试验场,邵天兰却认为,人形机器人和大量工业生产场景本质上就不契合:

“用多台人形机器人一起去抬一个几百公斤的工件,就像坐着光速飞船去拳打外星人。”

他认为通用的不是机器人本体本身,而是核心组件——这包括移动、操作、感知和任务理解与规划等基础能力,它们能快速组合成适应不同场景的不同形态机器人。

当被问及具身智能的终局价值分布,他说这个问题本身没那么重要:“太多人关注终局,而更重要的是路径和速度。”

在邵天兰经历的创业中,从 0 起步的公司,尤其是他们这类研发背景的年轻团队,需要专注自己的擅长,先找到第一个 PMF(产品-市场匹配),做出完成度足够高的产品,形成商业闭环:“一开始就讲宏大技术叙事,要直接登月的创业公司极少成功。”

机器人是一个热点潮起潮落的行业,邵天兰说梅卡曼德一直追求的事很简单:“让机器人用起来。”

从视频到实机展示、再到规模应用,每一步的 Gap 都很大

晚点:今年春晚,宇树人形机器人扭秧歌火出了圈。作为从业者,你怎么看这个表演?

邵天兰:我很喜欢这个节目,我认为宇树是足式机器人里进展最好的公司之一,敢在全国人民面前直播很不容易。

很多观众惊叹机器人能转手帕、扔手帕——不过这些反而和具身智能关系不大。宇树自己也发了花絮,转手帕是靠机器人手部定制的旋转机构,抛接手帕是通过线的收放。

真正值得关注的是多台机器人完成了踢腿等一连串动作,展现了很好的运动控制能力和稳定性。其实宇树自己并没有渲染抛手帕的技术,但大众会有一些自发的 hype(炒作夸大)。

晚点:现在机器人领域的 “hype” 有多大?

邵天兰:和七八年前的自动驾驶很像,现在很多机器人创业公司甚至部分学界研究者都会通过摆拍和剪辑做出看起来酷炫的视频,导致大众高估了实际进展。

视频里很多机器人已经能跑酷和自己做家务了,但到了线下展会和客户现场,机器人展示的任务往往简单很多,速度和成功率都不好,抖音上也能看到不少人去看机器人展会后大失所望的视频。

而且一些炒得很夸张的技术路线,比如一些很火的具身模型,没人能复现它所宣称的效果,这几乎是行业里公开的秘密。

从短镜头摆拍到一镜到底的长视频,到线下实机连续展示,再到在客户真实场景里小规模运行、大规模运行,最后到成功的商业化,每一步的 gap 都很大。

这种炒作的一个不良后果是 “吹牛竞赛”:创业公司必须不断比其他公司更夸张地宣传,才能融到资;甚至学术界也要不断夸大工作效果才能发论文。

晚点:你认为这两年,机器人和具身智能领域的实际进展是什么?

邵天兰:一是运动控制上,强化学习和仿真训练提升了四足、双足这种多关节复杂机械结构的运动性能和稳定性,机器人能更顺畅地行走甚至跳跃了。当然这离在现实环境长期、稳定运行还有很大提升空间。

二是 AI 大模型的发展:比如视觉语言多模态大模型与机器人结合,让机器人能初步理解指令、看懂图纸,完成多步骤复杂任务;而视觉语言动作模型(VLA,Visual-Language-Action Model)则让机器人能完成叠衣服等复杂操作,有了初步进展。

三是一些核心器件性能明显提升。包括我们自己做的高精度 3D 相机,以及机器人用的激光雷达、关节电机等。

四是产业链成本降低,比如入门级多指手的价格已降到数万元甚至更低。

晚点:为什么你把这叫多指手?不是 “灵巧手” 吗?

邵天兰:因为它现在还不 “灵巧”。目前仅中国就有十几家创业公司在做多指手,这个方向肯定会不断进步,但在机械结构、传感器、控制算法等方面都还比较初步,相比我们真的想要的 “灵巧”,进度条可能连 10% 都没走到。

这也是一种语言污染,等真正 “灵巧” 时再叫灵巧手也不迟,否则那时只能叫 “超级灵巧手”“究极灵巧手” 了。

晚点:那么通用机器人的整体 “进度条” 现在走到了哪儿?

邵天兰:整体成熟度类似十几年前的自动驾驶,大家开始看到曙光,但不意味着 3、5 年、乃至 10 年内就能完全实现。

因为完全通用的机器人几乎等价于 AGI:它能感知环境,能思考、有记忆,然后能自己做决策、完成一连串任务。机器人还有机械结构、传感器等硬件实体,它的实现难度会比软件层的 AGI 更大。

通用的不是机器人本体,而是核心组件

晚点:梅卡曼德已成立 8 年,服务了很多工业、物流行业客户;而 2023 年之后成立的一新公司一开始就做通用机器人。它们虽然现在还没有规模落地,但有投资人认为,梅卡曼德这类更早进入具体场景的公司未来会被这批直接做通用的公司覆盖。你怎么看这种想法?

邵天兰:通用的本质首先是能适配多个不同行业和应用场景,极大地减少,甚至不需要定制化。

我们的产品现在既在车厂造车、也在银行金库里搬钱、甚至也给浴缸钻孔,服务了汽车、金属加工、家电、3C、锂电、光伏、物流等几十个行业的上千家公司,覆盖搬运、装配、切割、焊接、涂胶、拧螺丝、质检等很多工艺,而且是用标准化产品做到的。这说明当前的产品已经有不错的通用性,而且还在快速拓展应用场景。



左上为发动机连杆无序上料,右上为物流场景透明膜包包裹抓取,左下为轮胎装配,右下为汽车零部件上料。

第二,通用机器人不是说最后都长一个样。通用的不是机器人本体,而是核心能力和组件。

这和电脑、手机,甚至汽车都不一样。电脑、手机是处理虚拟任务的,汽车是在物理世界工作,但任务相对单一,就是从 A 到 B 运货和运人;而机器人要帮助人完成物理世界里的各种复杂任务,注定形态多样。

我认为未来会像《机器人总动员》那样:天上飞的、地上跑的、水里游的、墙上爬的;帮人们切钢板、割草、洗泳池、扫地、擦窗、带孩子的……什么样的机器人都有。

它们长得不一样,但组成它们的核心模块是通用的——所有形态的机器人,本质上都可以拆解为移动、手的操作、视觉感知、复杂任务理解和规划等基础能力的组合。落到产业链里,就是通用核心零部件来支持不同形态的机器人。

晚点:这是个 “拼积木” 的逻辑,梅卡曼德主攻的 “积木” 是什么?

邵天兰:我们现在专注做机器人的 “眼睛” 和 “大脑”,也就是高精度 3D 相机和机器人的感知、规划、决策能力,这些能力通过标准化、简单易用的软件来交付给用户,能适配不同行业和场景。



梅卡曼德高精度 3D 相机的点云成像,可精确识别黑色物体、高反光物体等。

晚点:实际上有多标准化?你们现在去服务一个新客户时要部署多长时间?

邵天兰:现在部署和调试我们自己的视觉感知系统,通常只要数小时到数天,这是算上了安装和测试的总时间。因为我们用的都是标准化传感器和软件套件,几乎没有定制了。

晚点:你怎么定义 “机器人大脑”?它就等于你刚才说的 “感知 + 决策 + 规划” 吗?

邵天兰:机器人大脑还需要有常识和推理能力,要能听懂指令、看懂图纸,自己想办法完成任务目标。

大语言模型在给机器人加 “常识” 上很有帮助,比如让机器人知道杯子是用来装水的,平时放在桌上;现在大家在探索的世界模型,也会让人机器人能具备物理世界的常识,比如能预判环境中其它运动物体的轨迹等等。



配合大语言模型,梅卡曼德的感知和轨控算法可让机器人听懂自然语言指令,完成任务。

晚点:这些能力未来会是分开、分层的多个具身模型的组合,还是像自动驾驶一样有整合为同一个端到端模型的趋势?

邵天兰:坦率说我不知道。长远的技术路线很难判断,我也不认为任何人对此的判断准确度能超过抛一枚硬币。端到端是一个可能的技术路线,但它不是魔法。现在一些人把 “端到端” 当做了咒语,仿佛念了这句咒语就能自动解决很多问题。实际上进展远没有一些人宣称的好,而且端到端也有大量的不同细分路线。

狭义人形机器人在工业场景没有任何优势

晚点:你们现在去工业、物流场景竞标时,会遇到做人形机器人和通用机器人的新公司吗?比如智元机器人 CTO 彭志辉曾告诉我们,工厂里的 “PPT”,即抓取(Pick)、放置(Place)和转运(Transfer)会是人形机器人最快落地的场景。

邵天兰:暂时还没遇到过。我认为现在在工厂的绝大部分生产场景里,狭义的人形机器人没有任何优势。

从亨利·福特时代的流水线开始,工业生产逻辑就是分工细化,极致追求效率和可靠性。不管是看现状还是看趋势,在工厂里做抓取、放置和转运都不适合狭义的人形机器人。

比如要在工厂里抓取或放置重物和大型工件,人形机器人的负载和臂展都比不上重载机器人,甚至根本无法完成任务。你可以想象一下——用多台人形机器人一起去抬一个几百公斤的工件,这会是个非常搞笑的画面——就像坐着光速飞船去拳打外星人。



梅卡曼德产品配合机械臂在汽车工厂内上料车内门板,这个场景适合高载重大型机械臂。

如果是小型工件,人形机器人相比轻型机器臂、SCARA(Selective Compliance Assembly Robot Arm,一种特化的机械臂) 等,精度和速度又差很多。

而在转运场景,AMR(轮式移动底盘上,可以加机器臂)是一个更好的形态,它更高效、稳定、安全,而且续航更长。

我自己去过上百家工厂,大家对人形机器人在工厂怎么用,还没有一个好答案。但很多客户都需要有更好智力和视觉能力的机器人。

晚点:如果客户本身就是投资方呢?比亚迪、上汽、宁德时代都在投资人形机器人公司。

邵天兰:对 demo 阶段肯定有很大帮助,这类支持对机器人行业也是利好。

但到真实、持续的大规模应用时,它们就不是投资方而是客户甲方了。工业、物流等生产场景的客户最看重的是效率、稳定性和部署成本;反而不那么在意机器人到底用了什么技术,或是不是很通用。

但从我们机器人公司的角度,通用性会极大影响方案成本和部署效率,这是机器人公司的核心竞争力之一。

晚点:更长期来说,人形机器人会不会因为技术发展和统一形态带来的规模降本效应,取代很多生产场景里现在已在运行的方案?

邵天兰:这不是单纯的技术成熟度问题,之前也提到了,狭义人形机器人在一些场景里,比如搬重物、平地快速移动等,就不是最优形态。

真正合适人形机器人的场景应该有如下特点:任务非常灵活,工作环境为人类打造,需要机器人与真人有交互、信任甚至共情。交叉一下就是酒店、咖啡馆、餐厅等服务业,以及家务、助老等。而大量其它场景,包括一些 to C、to 家庭的场景,比如扫地、擦泳池、割草等,人形的效率也不是最高的。

所以还是回到刚才说的:更重要的是通用的组件——移动能力、操作能力、感知和决策能力——这些组件能快速、灵活地组合出适合特定场景和任务的机器人,兼顾成本和效率。

晚点:资本会是一个多大的变量?现在不少公司正以更通用的愿景吸引大量融资,是否存在一种可能:以资本优势研发更前沿的技术,长期在落地上反超更早去做商业落地的公司?

邵天兰:资本是助推器,而不是物理定律扭曲器。

历史上,一开始就讲宏大技术叙事,要直接 “登月” 的创业公司极少成功。比如上一代计算机视觉热潮中,不少公司想做大而全的 AI 平台,往往发展得很艰难。

更可行的创业路径是先在产业链局部环节达到足够的效率和可靠性,形成商业闭环和数据飞轮。即使是宏大叙事的代表人物马斯克,也有非常务实的技术和产品路线。比如 SpaceX 的长期愿景是送 100 万人去火星,但它是一步步做了低成本的重复发射和星链卫星网络。

晚点:一步到位做通用机器人,这不就是马斯克带起来的风潮吗?

邵天兰:马斯克开始做 Optimus 时,特斯拉已经是市值 7000 亿美元的巨头了,也有领先的自动驾驶技术,还有自己的工厂场景,它有足够的资源和耐心去做十年、二十年甚至三十年的规划。

但哪怕是独角兽级别的创业公司,资金和时间都极其有限。而且一个创业公司长时间没有真实业务来提供反馈和检验,就像一个只训练不比赛的足球队一样,会很容易跑偏。

太多人关注终局,更重要的是路径

晚点:通用机器人的链条很长,现在各创业公司在从不同环节切入这个机会:大脑、运动控制、传感器和感知、本体硬件、手……也有自己掌握 AI 技术和场景的大公司在布局机器人,如特斯拉、宁德时代、小鹏等。你觉得从哪个环节出发的公司未来会获得通用机器人的最大价值?

邵天兰:从技术逻辑推理,未来最核心的模块是 “腿”“眼睛”“手” 和 “大脑”。

但我想说,“最大价值” 这个问题本身没那么重要。太多人只关注终局,但更重要的是路径和速度。

真实创业过程是:专注自己擅长的事,先找到有价值的场景形成足够竞争力,再快速迭代、逐步扩展。至于最后能否拿下最有价值的环节,可遇不可求。腾讯第一个赚钱的业务是短信增值服务,亚马逊从卖书起步,京东从卖电子产品起步,都不是一开始就是现在的大而全形态。

我们自己也是这样:最擅长做机器人的传感、感知、规划和决策,这在整个产业链里价值很大,但我们不强求,也不宣称自己做的就一定是价值最大的部分。

同时,机器人的特点是环节多、链条长,因为机器人非常复杂,涉及传感器、执行器、各种算法,还有各种应用场景和对应的形态;需要 AI、机械结构、材料、能源等多种技术,最后不可能靠五家、十家公司就搞定。

所以只要一个公司能在特定环节有很强的竞争力,就有机会参与这个大生态。最怕的是什么都做,却什么都不强。

晚点:梅卡曼德的路径是什么?

邵天兰:第一步是从制造业和物流中的部分场景起步,建立商业闭环和数据飞轮;在这里跑通 “Product-Market Fit”,做出有足够可靠性、效率,能解决客户痛点的产品。

这一点我们已经做到了:我们的智能视觉系统已部署到了上千个场景,是全球销量最大的公司,获得了大量实际应用数据和行业 Know-how,在现金流、数据和产品定义与优化上都有正向反馈,这会带来更快的发展速度。

第二步是通过技术进步拓展更多应用。比如大疆的无人机,它的飞控、图传等技术从航拍开始,可以拓展到植保、巡检、运输等更多场景。

类似的,我们最近也在以 DeepSeek 等模型为基础,提升机器人的传感、感知、规划决策等能力,当智能程度足够高、成本足够低时,就可以自然拓展到更多更场景,比如医院、药店、便利店等服务业,最终走向所有行业和家用。

晚点:找到第一个 PMF,跑通商业闭环的过程中踩过什么坑?

邵天兰:一个重要的教训或经验是,产品完成度非常关键。

比如四五年前我们交付一个项目时,最长需要几个月。因为成像效果不够好,就要花时间调试优化,也给视觉算法带来压力;视觉算法不够好,又需要花时间调试优化,并给机器人规划带来压力;机器人规划效果不好,又需要花时间调试优化,给系统防错带来压力。机器人智能是一个长链条,每个环节差一点,整体效率就会差很多。

现在我们的交付时间缩短到了几天甚至几小时,而且很多时候我们自己的人完全不用参与或只远程线上参与。就是靠一点点提升产品完成度,从同时服务 10 个客户、100 个客户到能服务 1000 个客户,否则跨不过形成商业闭环和数据飞轮的门槛。

晚点:在从 0 到 1 的规模化策略上,同类公司中,也有人选择是做更多总包和集成,这能更快达到更大的收入体量,而你们是卖标准化产品,让集成商来交付。为什么这么选?

邵天兰:首先我做不成一家好的系统集成商。作为研发出身的年轻团队,我们的能力是死磕大系统中的局部技术和产品。而系统集成商往往有丰富的应用经验,擅长工艺理解、方案设计、大型项目管理、大客户关系等等,我们是互补的。我也见过一些和我们类似的研发出身的团队做系统集成商,普遍发展不太好。

而且我认为智能机器人仅在制造业和物流的销量,未来几年内就可以到数十万甚至百万台。那么如果想做一个重要的参与者,至少也要有十万级的出货量,而且要覆盖全球主流地区,这种体量只有标准化产品才能做到。这类商业模式也是现成的,比如西门子、基恩士、ABB 等,有很多参考。

晚点:当已经服务很多客户后,你发现有哪些机器人在实际落地中才会遇见,实验室和研发环境想不到的难点?

邵天兰:当前学术界的很多 benchmark 是大大简化的。比如在学界的常见标准下,机器人把一个物体抓取起来就算成功,但实际情况千奇百怪:比如便利店自动结账这个场景,光抓取物体还不够,还要扫码,而不同产品的条形码位置相差很大,有时也会被包装上的褶皱遮挡或有污损,这都是要实际落地才会遇到的问题。

晚点:如果作为投资人和外部观察者,怎么评判一个机器人公司规模化落地的进度?

邵天兰:我的一个观察是,当一个公司需要派最好的研发人员去服务客户时,这是非常早期的阶段;当不再需要核心研发人员,但仍需研发人员介入时,是稍微成长的阶段;当专门的现场工程师就能解决大部分问题时,这是相对成熟的阶段。

我们今天甚至不需要专门的技术人员,我们的客户部署大部分是交给集成商合作伙伴和客户自行解决的,因为产品足够标准和成熟了。

晚点:你觉得具身智能领域的下一个竞争点可能是什么?

邵天兰:找到好的产品形态和场景,并形成商业闭环。人们常常高估了技术路线的重要性,而低估了商业落地路径带来的限制与机会。

比如今天看,直接做全无人驾驶和 Robotaxi,发展速度不如与乘用车结合的 L2+。那些先从 L2+ 切入,服务一批客户,有大规模收入的公司,后面也有机会往 L3、L4 发展,它们的生存和成功概率更大。

我当然可以说把所有技术都做到极致——视觉足够通用、走得也很好、手也很好、大脑足够聪明,就会自动解锁所有场景。但这件事其实是倒过来的:需要先在一部分应用场景有商业价值,才能逐渐走到到更多场景。

初期场景的选择很关键,太简单难以建立竞争力;太难会导致很长时间都无法建立起商业闭环,这是一种危险而脆弱的创业模式。

晚点:整个智能机器人行业这些年有很多波动,热点不断变化,这也让其中的公司处境起伏。在变化的潮流之中,你一直相信的、不变的东西是什么?

邵天兰:机器人一定要产生实际价值,它不能停在实验室里,也不能停留在视频里。

我们不认为自己是个追求特定技术路线的公司,我们追求 “让机器人用起来”。这听起来非常朴素、简单,但也是整个行业追求了几十年还在努力的事。

这是《晚点 LatePost》 「具身智能对话」系列的第 9 篇。该系列将持续访谈智能机器人和自动驾驶产业链头部公司。

题图来源:梅卡曼德产品在汽车焊装车间引导机器人完成车身件上料;来源:梅卡曼德。

相关推荐

梅卡曼德邵天兰:“通用机器人”的吹牛竞赛与现实路径丨具身系列
36氪独家 | “AI+3D视觉+机器人”解决方案提供商「梅卡曼德机器人」再获近10亿元C系列融资
“3D视觉+AI+机器人”解决方案提供商「梅卡曼德机器人」完成数亿元C轮融资,由美团领投
36氪首发 | 「梅卡曼德机器人」获红杉资本中国基金过亿元B轮投资,进入规模化应用阶段
加速规模化应用,梅卡曼德机器人推出可拾取海量SKU的AI+机器人货品拣选解决方案
让具身智能走进现实,他们做到了
AI机器人落地步入深水区,疫情重创的2020会是春天吗?
Update | 要实现工业机器人智能化,「梅卡曼德机器人」获英特尔投资
晚点独家丨地平线组建具身智能实验室
36氪首发 | 将智能赋予工业机器人,「梅卡曼德机器人」完成A+轮融资

网址: 梅卡曼德邵天兰:“通用机器人”的吹牛竞赛与现实路径丨具身系列 http://www.xishuta.com/newsview132599.html

所属分类:人工智能

推荐科技快讯