点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

【洞见·TMT】
“当前,人工智能正处在一个新的拐点,推动机器人从1.0专用机器人时代迈向2.0通用具身智能时代。”智源研究院院长王仲远说。
但王仲远也坦言,当下具身大模型依然面临“不好用、不通用、不易用”的核心痛点。
“不好用”指的是,虽然具身智能在过去一两年有非常快速的发展,但还没有“ChatGPT时刻”;“不通用”指的是,很多模型依然只适用于一个本体或者同品牌的本体;“不易用”指的是,大脑、小脑以及本体的适配难度比较高。
为解决这些痛点,智源研究院在今年发布了一系列具身智能的大模型;今年3月份中关村论坛上,发布了跨异构本体的具身大小脑协作框架RoboOS1.0以及跨异构本体的具身大脑RoboBrain1.0;6月份智源大会上,发布升级版本——RoboOS2.0和RoboBrain2.0;9月份,发布了能够跨本体的VLA Foundation Model——RoboBrain-X0,并部署在星海图机器人、智元机器人、松灵双臂机器人、Franka机械臂上……
“我们已构建以具身大脑为核心,自底向上全栈具身智能技术体系,包括能够跨异构本体数据采集以及标准化一站式平台,具身大小脑以及VLA等具身基座模型,还有具身智能评测等,为具身技术生态提供一套可复现、可对齐的公共基础设施,降低从研究到产业化落地的门槛。”王仲远说。
具身智能发展迅速,已进入深水区,行业亟需开放、协同、标准化的生态,来加速技术演进与落地。
王仲远表示,在具身智能的科研布局上,希望构建面向通用机器人(可跨本体、高泛化性)具身大模型系统,以开源开放夯实具身智能公共底座。希望能够跟行业里更多从事具身智能机器人和具身智能模型以及具身智能场景落地企业机构以及专家学者进行合作,共同推进整个具身智能行业健康快速发展。

在近日举行的一场具身智能开放日上,来自智源研究院等40余家国内科研机构、企业、生态伙伴,围绕具身模型进展、硬件迭代与产业落地等议题展开深入交流,协作共建可复现、可对齐的具身科研公共基础设施。
当天,智源研究院具身研究负责人分享了最新进展——模型与框架方面,RoboBrain 2.0 Pro 在原有通用具身大脑的基础上,引入 RoboBrain-Dopamine 和 RoboBrain-SpatialTrace,分别提升机器人对动作时序价值和三维空间结构的理解与推理能力。
人机交互方面,推出原生全双工语音大模型RoboBrain-Audio与终身认知记忆系统RoboBrain-Memory。比如,RoboBrain-Audio将响应延迟降低至约80毫秒,显著优于传统模型,契合人类日常对话节奏。
平台与工具链方面,开放了“面向异构本体、规范操作流程、提高研发效率”的具身数据软件框架CoRobot,打造了面向具身智能的多芯片训练与推理一体化框架FlagOS-Robo。
智源方面将持续迭代并同步公布在开源项目、数据集与评测平台上的进展,同时与产业伙伴推进联合试点,加速具身智能从实验室走向生产线。与会人士还探讨了端到端视觉语言模型(VLA)、分层式大模型、世界模型等不同技术路线的优劣。
他们认为,短期内,将任务规划、感知与控制解耦的“分层系统”在工程落地和稳定性上更具优势;而中长期,行业需要向“可迁移、可复用”的通用基座模型演进,其关键在于统一的场景表示、高效的数据闭环以及对齐的评测标准。
针对“硬件是否仍在拖累模型”的问题,他们认为,二者已进入“共同定义”的新阶段。优秀的具身系统需要在模型层面做好规划,也需要在硬件层面通过力控等技术保证执行的可靠性。(记者 李政葳)
