山东企业“互联网+”“移动营销”的优选品牌
数字应用开发倡导者
“在当前阶段,试图通过真实数据来启动具身智能的Scaling Law,希望渺茫。”跨维智能创始人贾奎在与网易科技等媒体交流时,直截了当地表达了这一观点。
数据匮乏且质量不佳,具身智能领域的数据短缺问题,已然成为行业内的普遍共识。针对这一难题,行业内逐渐分化出两大阵营:真机派与仿真派。
跨维智能、英伟达、银河通用等企业选择了仿真路线。近日,跨维智能宣布,将同步开源其自主研发的、由EmbodiChain自动训练的VLA基座模型,以及几个具体任务示例的VLA模型。
据悉,EmbodiChain作为一款开源的、专为具身智能设计的“生成式数据引擎”,开辟了一条全新路径:机器人能够完全依赖100%的合成数据(即在虚拟世界中“做梦”)来习得技能,并在真实世界中实现零样本(Zero-Shot)的完美执行。
为何机器人尚未达到ChatGPT的智能水平?
“具身智能的智能与大语言模型的智能,属于两种截然不同的智能形态。”贾奎一针见血地指出了两者之间的根本差异。大语言模型的成功,得益于互联网上浩如烟海的文本数据,遵循着著名的Scaling Law。然而,当这一模式试图移植到具身智能领域时,却遭遇了物理世界的严峻挑战。
传统机器人学习依赖于真实数据的采集,这一过程存在三大难题:成本高昂,采集真实数据需人工遥控机器人,耗时费力;效率低下,物理世界无法加速,且存在安全隐患;数据孤岛,仅有极少数巨头企业有能力组建庞大的数据采集团队。
贾奎以无人驾驶为例,阐释了数据稀缺的深层缘由:“为何无人驾驶领域却能积累大量真实数据?因为我们每天都在驾车进行各种活动。而在具身智能领域,除了工厂、物流仓库中的机械臂外,我们的日常生活中鲜有机器人的身影。”
因此,面对这一困境,跨维智能选择了生成式仿真的技术路径。贾奎强调:“成熟的基础物理仿真技术已能达到毫米级精度,工厂环境甚至要求亚毫米级。具身智能领域所缺乏的,并非底层的仿真技术,而是如何将物理仿真构建的任务场景、虚拟传感器生成的数据、模型训练以及本体部署等环节,实现高效自动化的连接。”
仿真数据如何在真实世界中实现零样本的完美执行?
EmbodiChain作为一款开源的、面向具身智能的“生成式数据引擎”,再次验证了这一全新路径的可行性:机器人能够完全依靠100%的合成数据来习得技能,并在真实世界中实现零样本的完美执行。
EmbodiChain的核心突破体现在三个“无需”:无需采集真实数据,证明了VLA模型可以完全使用合成数据进行训练;无需繁琐的人工调优,模型在仿真环境中训练完成后,可直接部署到真实机器人上使用;无需专业建模工程师,能够根据文本描述自动生成场景和任务,实现全流程的自动化。
烟台三明网络专注软件开发10年+,具备烟台APP开发、烟台小程序定制、烟台公众号定制、烟台网站建设、烟台商城开发、烟台分销系统开发、烟台康复系统开发,致力烟台互联网+行业的系统定制开发与运营,为企业发展提供助力。