3月17日下午,在上海世纪公园,两个机器人的出现迅速吸引了游客的目光。
镜天湖畔,随着悬挂架的高度逐渐调低,两个身高1.75米的人形机器人双脚落地,在五分钟之内吸引了八十位左右的游客围观。
这两台吸引了众多围观游客目光的机器人来自傅利叶的GR-2,全身拥有53个自由度,最大关节扭矩为380N.m,步态行走速度为5公里/小时。第一财经记者在现场看到,实际的行走过程当中,GR-2还能晃动小臂,和围观的人群打招呼,并做出比心的姿态。
就在同一天上午,傅利叶正式开源了全尺寸人形机器人数据集Fourier ActionNet。Fourier ActionNet数据集包括了傅利叶GRx系列机型的各类训练任务,包括对常用工具、家居用品、食物等多种物体的精确取放、倾倒等操作,以及在不同环境条件下实现泛化执行。
除了数据集开源之外,傅利叶表示,也同时开放了全球首个包含采集算法、训练算法以及数据部署算法的全流程工具链,包括开源的训练框架(如DP、ACT、iDP3)和部署工具等。
在傅利叶之前,多家人形机器人企业已经开放了自己的数据集。去年12月底,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出了一个大规模多构型具身智能数据集和Benchmark——RoboMIND,支持多本体任务并具备通用性。同一个月,智元机器人也宣布开源百万真机数据集AgiBot World,数据质量从实验室级上升到工业级标准。
“高质量数据集能让机器人学习到不同场景下的操作方法和应对策略,增强泛化能力,从而更全面地掌握各种技能,显著提升机器人的学习能力和任务执行效率。”萨摩耶云科技集团AI机器人行业研究员郑扬洋告诉第一财经记者,开源数据集的底层逻辑是,当前机器人的技术路径以强化学习为主,而需要指数级增长的数据,生成或仿真数据又容易因为物理交互的复杂性难以迁移到现实,因此真实的数据集在一定程度上能够降低机器人技术研发的门槛。
数据集的质量也关乎着机器人训练的效率。一位使用过第三方提供数据的具身智能从业者告诉第一财经记者,就大模型的训练要求来说,第三方的数据使用率可能不足1%。“我们经常遇到的情况是,买了100万条数据,经过严格的质量筛选后,实际投入使用的数据量可能只有1万条甚至更少。”
“部分公开的数据集存在数据质量参差不齐的情况,存在噪声、偏差等问题,会影响机器人的训练效果。”郑扬洋指出,目前开源的数据集大多集中在手部操作,缺乏对其他重要任务,如全身运动、复杂环境交互等动作的覆盖,整体来看,数据集在复杂环境下的泛化能力仍需提升。
为了确保训练质量,傅利叶相关负责人告诉第一财经记者,Fourier ActionNet数据集中的数据都采用了视觉语言模型(VLM)进行自动标注,并通过人工二次核验,确保数据精度与准确性。
“清洗”之后,理论上更高质量的数据能够迁移至更多机器人本体上做训练,并获得更高的成功率和泛化性。“我们之后还会陆续推出包括机器人下半身动作在内的多个数据集。”傅利叶相关负责人透露。
0 条