延伸的技术发展方向。如今,机器人正加速跨越单一演示的藩篱,向更多元、更实用的应用场景稳步进阶。

今年的中关村论坛年会现场,“机器人餐吧”成为热门打卡点。与去年单机演示不同,如今这里上演的是一场多品牌、多形态机器人的协同作业:好饮科技的咖啡机器人精准制作咖啡,乐博空间的机械臂精心调制果茶饮品,千寻智能的“墨子”机器人熟练串起糖葫芦,银河通用的人形机器人高效转运糕点,乐聚的“夸父”机器人将制作好的餐品稳稳送至取餐点。从扫码点单到餐品制作,再到配送取餐,全程仅需2分钟,无需人工干预。
“多订单并发时如何智能调配,送餐任务如何最优分配,这些都是机器人‘大脑’调度能力的集中体现。”乐聚机器人具身操作算法总监王强向《今日中国》记者介绍,支撑这一复杂场景的核心,是智源研究院的RoboBrain具身大脑与RoboOS协作平台打造的“跨本体机器人大脑操作系统”。该系统构建起“云端大脑+本体小脑”的分层协同架构,成功打破了不同厂商、多类型机器人本体的协作壁垒。

会场另一端,由钢琴、立鼓、唢呐等六种机器人乐手组成的“灵心乐府”乐队,以一曲曲中西合璧的美妙演奏吸引着参会者频频驻足。这支由灵心巧手(北京)科技有限公司(以下简称“灵心巧手”)打造的机器人乐队,目前已能演奏五六百首曲目。
“整支乐队的关键在于协同。”灵心巧手联合创始人左家平揭示了乐队背后的三大核心技术:一是全栈自研的灵巧手,具备亚毫米级的控制精度;二是多机器人群协同技术,实现亚毫米级的时间同步;三是情感模型加持,使机器人能通过调整指法、力度和节奏,呈现出不同风格的音乐质感。
从“机器人餐吧”的高效协同,到“灵心乐府”机器人乐队的精准配合,“一脑一平台一场景N本体”的创新模式,不仅为多机协同作业提供了实践样本,更标志着具身智能技术正从实验室加速迈向真实的商业服务场景。

如果说多机器人协同是具身智能落地的场景支撑,那么灵巧手——机器人的“手”,则是任务执行的核心载体。在展示区,灵心巧手的L20灵巧手再度上演“穿针引线”的“绝活”。这款工业级灵巧手拥有21个自由度,可实现接近人手的复杂操作与精细作业。此外,全球最轻灵巧手06(仅重370克)与速度达人手三倍的科研级L30灵巧手也同步亮相。
“在具身智能领域,灵巧手作为机器人最重要的末端执行器,大量复杂操作与交互任务都要靠它完成。”左家平将灵巧手比作“具身智能时代的核心基础设施”,“就像新能源时代的电池、人工智能时代的GPU。唯有‘手’足够灵活,机器人才能真正具备类人的操作能力,从实验室走向千行百业。”

灵心巧手在2026中关村论坛展出三款灵巧手,覆盖消费级、工业级、科研级应用
目前,灵心巧手在高自由度灵巧手市场份额超80%,近一年销量增长约10倍,其中约30%收入来自出口。产品矩阵覆盖消费级、工业级、科研级,已广泛应用于工业制造、生活服务、医疗助残等场景。
谈及优势,左家平总结为四点:一是性价比全球领先,最便宜的灵巧手通过平台补贴仅售3999元,而国外同类产品售价高达百万元;二是拥有全球规模最大的灵巧手研发团队;三是数据集与技能积累全球领先;四是量产能力强劲,已在多地布局工厂。“未来我们将进一步降低成本,让灵巧手带动机器人走进千行百业、千家万户。”左家平说。
为了适应更复杂的真实环境,机器人不仅要“手巧”,还需“身灵”。在本届年会上,北京达奇月泉仿生科技首发的一款轮式人形机器人,拥有全球最小的底盘——仅0.2平方米,能在狭窄空间穿梭自如。其独特的仿人髋、膝、踝三折叠设计,使工作高度覆盖从地面至2.2米。与其配套的“应手Y-Hand M2”灵巧手,拥有38个自由度,是目前世界上自由度最高的灵巧手,在速度、力量、精度、柔顺性、灵活性五个方面全面超越传统产品。
“机器人吹拉弹唱、穿针引线,并非‘炫技’。动作更柔顺、力度更精准,意味着它们离走进家庭、服务百姓的日常生活越来越近。”北京达奇月泉仿生科技有限公司智库主任胡喆祺表示,“在家政养老、医疗康养等场景中,喂药、量体温、端茶倒水等细致工作对力度和安全性要求极高,高柔顺性带来出色的人机交互安全性,让这些服务更易实现、更有保障。”
“家庭场景是机器人技术的终极考场。”胡喆祺补充道,“具身智能目前在工业场景、商业场景都有了初步的应用。但家庭环境复杂度高、不确定性强,对机器人的认知能力要求更高。”他坦言,机器人全面入户仍面临三大技术瓶颈:灵活度不足、能耗偏高、人机交互安全性有待提升。
挑战固然存在,但具身智能的规模化商用已势不可挡。国际数据公司IDC今年1月发布的《全球人形机器人市场分析》报告显示,人形机器人已正式迈入规模化商用阶段,2025年全球人形机器人出货量约达1.8万台,其中中国占据主要份额。
“2025年是人形机器人量产元年,2026年将是面向操作智能的人形机器人的量产元年。”无界动力创始人、首席执行官张玉峰表示,“从去年的POC(概念验证)到今年的量产落地,我们正推动行业从量变走向质变。”
然而,从“能演”到“能用”,机器人究竟还差什么?业内专家给出了各自的判断。
北京人形机器人创新中心首席技术官唐剑指出,机器人要在工业、商业乃至生活场景中真正落地,核心卡点是泛化能力不足——当环境、流程或操作物品发生变化时,机器人的成功率会大幅下降。他预测,今年泛化能力将迎来质的提升,工业、泛工业及简单商业场景中将出现较大规模的应用落地。
光轮智能(北京)科技有限公司副总裁廉和则认为,当前最大的挑战在于数据。大语言模型的参数量级可以从几十B到几百B甚至更大,而具身智能模型只有1B到10B,并非不想做大,而是缺乏足够的数据支撑。然而,仅靠购买机器人进行遥操作采集,成本高昂,难以规模复制。通过仿真模拟与自动生成技术实现数据量级的“指数级增长”,已成为行业突破的关键。
荣耀具身智能领域副总裁赵瑞则强调“大脑”(VLA模型)的重要性。他指出,这种模型需具备视觉感知、语言指令与动作逻辑的深度融合,能根据场景变化自动调整、纠错。而这一能力的构建,高度依赖机器人本体的可靠性与一致性,是一个涵盖硬件本体、数据设计、模型调优的系统性工程。
西门子中国研究院院长朱骁洵则将焦点转向“手”。他认为,在工业场景中,双足行走并非关键,真正的难题在于末端执行器——机器人的“手”。目前人形机器人在精细操作上仍存在显著技术瓶颈,许多复杂的机械问题无法像虚拟训练那样快速迭代解决。左家平对此深有同感:“现在的症结就在手上。只有让手的技能不断完善,机器人才能真正走进千行百业。我们给自己定的目标,三到五年内,让大批机器人下工厂、进家庭。”
蚂蚁灵波科技首席科学家沈宇军表示,具身智能是一个高度综合的学科,涵盖了从零部件到本体、从控制到智能的全链条,目前仍处于非常早期的阶段。他强调,具身智能的复杂性决定了必须走开放协同之路:“当更多人参与、更多能力复用、更多场景闭环,具身智能才能真正从技术探索走向产业实践。”