
与会嘉宾和迎宾机器人互动。 青年报记者 刘晶晶 摄
100台一模一样的人形机器人集体“受训”,在人的帮助下模拟各种动作,以达到今后进入各类生活应用场景的目的。这是记者在2025中关村论坛年会期间看到的场景。人们如此关心人形机器人的发展,反映出的是对未来美好生活的向往。这些代表未来的产业,成为今年中关村论坛年会上最为科学家们关心的焦点。
青年报特派记者 刘晶晶 发自北京
为人形机器人打造训练场
人形机器人是怎么做到“像”人类的? 在位于中关村科幻产业创新中心刚刚启用的人形机器人和具身智能遥操作训练场,记者看到,100台人形机器人正在这里接受训练。从浇花、采摘、清洁、叠被,要让小说电影里的“机器人保姆”真的能来到我们的身边,“艰苦”的训练原来一样不能少。
智能餐饮区,拥有智能机械臂的“小睿”可以现场制作咖啡,完成精美拉花。智能生活区里,在人类训练师的带动下,农业机器人将成熟的番茄采摘下来放进篮子,收纳机器人叠起了毛巾,清洁机器人在卫生间擦拭洗手池,阳台上,家务机器人有板有眼地浇着花——这似乎是很多人期望的未来,机器人帮我们干完了那些繁琐的家务活。
但在真正应用之前,这些机器人一样要经过艰苦的训练。训练员们穿戴上动作捕捉装置,一遍又一遍地“教导”机器人重复操作。人形机器人数据训练中心负责人张钦锋告诉记者,通过背负式设备、VR设备等,训练员可以在10个构建的场景中,控制机器人完成每一个动作,完成一个任务时,系统会记录手臂、底盘、末端执行器等数据。记录完成的数据还要经过相关人员的标注和审核,确保所得数据都是高质量的。
而根据这些数据所形成的模型效果,则可以动态调整每个训练员应该操作的内容。“对这些人形机器人每天训练的内容可能不一样,但都要完成任务列表。”张钦锋表示,目前,这一训练场部署了100台人形机器人,计划在今年产生超百万条数据。
“数据收集得越多,模型迭代越快,人形机器人才能更快走入千家万户。”他表示。而最快走入的,或许就是那些重复、无聊且需要标准化的场景。
走中国人自己的技术路线
对于人形机器人何时能走进千家万户这个问题,张钦锋给出的答案是或许两三年,也或许四五年。而北京银河通用有限公司创始人兼CTO王鹤则在此次2025中关村论坛年会上表示,人形机器人已经进入应用时代。
以数据积累来换取模型迭代,是目前国内不少人形机器人向应用发展时所走的技术路线王鹤表示,过去外国的机器人学习一个简单动作至少需要一个40人的团队,以及长达数月的训练,成本高昂。但如果要让人形机器人服务千行百业、走进千家万户,如此高昂的人力和时间成本难以实现。
“为了破解成本高、数据难获得等问题,让人形机器人真正成为普通人的好帮手,我们选择了中国自己的技术路线,即通过大规模生产和使用合成数据来训练人形机器人。”他表示,这样的训练模式让机器人有了举一反三的能力,进一步降低了对数据的需求,真正赋予具身机器人自我学习的基础。“有了这样的基础,人形机器人才能在家庭应用和训练场景中变得更有价值。”王鹤说道。
总部位于北京中关村的银河通用创立于2023年5月,是一家专注于研发人形机器人硬件和具身智能大模型的创新性企业。目前,银河通用的Gal-bot G1机器人不仅可以利用合成数据进行技能学习,还可以通过视觉的方式进一步强化学习,探索更多的操作方式,从而直接将自主学习的技能应用到真实世界中。王鹤介绍说,通过物理仿真合成大规模高质量数据的技术路线,银河通用的合成数据已达到10亿级别,并在此基础上训练出了27亿参数的预训练大模型,规模超全球同行两个数量级。
在王鹤看来,目前市面上比较成熟的人形机器人的运行已经可以得到很好的技术支撑,可靠性也非常好。他认为,人形机器人已经步入运动时代,而以视觉引领肢体控制,进而实现自主泛化操作的能力,将让人形机器人真正成为人类的帮手。“接下来人形机器人将迈入生产力时代。”
以未来产业描绘发展新图景
人形机器人走入普通百姓家,寄托的是人类对于未来的美好向往。而以人形机器人为代表的具身智能正是被列入今年政府工作报告中的未来产业之一。
未来产业是由新一轮科技革命孕育催生,目前尚处于技术突破关键期或商业化探索导入期,未来5~10年内具备较大增长潜力或较强战略性影响的新产业形态。在今年政府工作报告中,明确指出,要培育生物制造、量子科技、具身智能、6G等未来产业。
这也无疑成为今年中关村论坛年会上的热议方向。
在“未来产业创新发展论坛”上,智昌科技集团股份有限公司创始人、复旦大学智能机器人学院院长甘中学指出,具身智能不同于“人形计算机”,它的思考和判断能力,应该更趋近于人类。
“具身智能对通用人工智能技术的依赖程度更高,但如果要模拟人的智能,就需要将大脑整个的神经部分、小脑、中枢神经、脑干进行连锁反应,这才是真正的具身智能。”甘中学说。他认为,具身智能机器人是未来产业的新型劳动工具,既可以让人类从重复性的劳动中解放出来,也可以带来发明创造力的持续增长。
让机器人学会运动已经实现,而真正实现脑机融合,则是科学家不断在攻克的难题。脑机融合在智能制造、智能生活等领域都有着广阔的发展空间。美国国家工程院院士陈世卿在论坛上表示:“脑机融合技术的研发与应用是未来健康发展的重要方向,我们专注于研究脑、保护脑、开发脑和延伸脑的研发项目,正尝试通过‘脑科学+AI+智能超算’的创新模式,驱动人类‘第三脑’加速发展。”
2023年度国家最高科学技术奖获得者、中国科学院院士薛其坤认为,在人工智能时代,需要强大的算力。“6秒的视频用200张H100的GPU芯片要训练1个月。如果变成30秒的视频,就需要400张这样的芯片训练3个月。如果制作两小时时长的电影,可能我们一个电站发的电量都不够用。”而量子计算机,或是解决方案。“60个逻辑比特的量子计算机,理想状态下,能比拟占地3亩的超级计算机的运行速度快。”
通用量子计算机的研制,在薛其坤看来,是挑战人类的最高智慧,“研发难度肯定要高于人类首次登月,是一个国家最强科技实力的象征之一。”他表示。从科学发现到产业实现,或许依然需要时间。但科学家们,从未止步。
[记者手记]今年或将成为智能体元年
房间乱了会主动做家务,肚子饿了就满屋子找吃的,无聊时还会打开电视机…… 日前,在2025中关村论坛年会举行的通用人工智能论坛上,电子大屏中一个表情灵动、反应敏捷的仿真小女孩吸引了现场观众的目光。
她叫“通通”,是由北京通用人工智能研究院研发的通用人工智能系统原型,也指向了当下人工智能领域的热词——AI智能体。
“AI智能体可以理解为更立体、‘类人’的智能系统。除了提供大模型广泛使用的语言交流,还能完成更复杂的任务。”中国科学院自动化研究所研究员蒲志强说。
记者看到,当研究人员将“通通”的体感温度调高后,便触发了“打开空调”的任务。为了拿到放在高处墙架上的遥控器,“通通”经过思考,先脱鞋上沙发,再利用沙发上的靠垫增加自身高度,最终取得成功。
“‘通通’就像一个有智商、有情商、能理解、会帮忙的‘小助手’。”北京通用人工智能研究院院长朱松纯说,它不由数据驱动,而是由价值和因果驱动,因此会主动参与到任务各环节,而非被动执行。未来如果投入实际应用场景,不仅有助于提高生产效率,还能更好应对突发情况,提高生产和服务的灵活性。
今年,“具身智能”首次被写入政府工作报告,成为我国培育未来产业的重要方向。目前,AI智能体已在不少场景中得到应用,如客服、内容创作、手机助手等。
朱松纯表示,研究院正在探索将“通通”的技术优势与具身智能相结合,相当于为人形机器人安装上“大脑”,进一步学习行业特定的知识和技能,让智能体、机器人走入每个人的家庭。
当前,超越“鹦鹉学舌”式的智能,打破“缸中之脑”的困境,人工智能技术还有很长一段路要走。然而,如果“通通”具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感与道德观念,是否也会带来安全、伦理、隐私等风险?
中国工程院院士张亚勤指出,智能体能够自我规划、学习和实现目标,是很好的技术,但其路径往往不可控,会带来安全风险。
中国科学院自动化研究所研究员、联合国人工智能高层顾问机构专家曾毅认为,超级智能体可能会出现,它有可能是一个有生命的、可以自我演化的人工智能,也将成为整个人类社会要面对的重大课题。
业内人士普遍认为,2025年或将成为智能体元年。记者期待,在仿真环境里不断长大的“通通”,可以更深刻地懂得人类寄予它的期望与情感,拥抱人机和谐共生的未来。 据新华社电