编辑:林风语
康奈尔大学研究人员开发机器人学习新框架:观看视频即可掌握任务
康奈尔大学的研究团队近日宣布,他们成功开发了一种名为RHyME的机器人学习框架。这项创新技术可以让机器人通过观看单一的“操作指南”视频,便能够学习完成特定任务。这一突破性进展有望显著加速机器人系统的开发和部署,同时大幅降低培训过程中的时间、能源和经济成本。
“与机器人合作的一大痛点在于,需要为它们完成各种任务收集大量数据,”研发团队成员、计算机科学博士生Kushal Kedia表示,“但人类并不是这样学习的。我们通过观察他人获得灵感。”受此启发,研究团队设计了RHyME框架,让机器人可以像人类一样,通过观察模仿来学习任务。
Kedia将于2025年5月在亚特兰大举行的国际电气与电子工程师协会机器人与自动化国际会议(IEEE ICRA)上详细介绍这一成果。
目前,家庭服务机器人仍未实现广泛普及,原因在于难以训练机器人应对复杂多变的真实环境场景。为了缩短这一差距,研究人员一直致力于使用“模仿学习”,即通过实验室中人类演示任务的方法,让机器人更快地掌握技能并适应现实世界。
“我们的工作类似于翻译,把特定任务从人类版本转译为机器人版本,”康奈尔大学计算与信息科学学院助理教授、研究项目资深作者Sanjiban Choudhury表示。然而,这一“翻译过程”仍面临诸多挑战,比如:人类动作高度流畅,而机器人难以准确追踪模仿;此外,这种视频训练方式往往需要大量的高质量、低误差数据,稍有偏差便可能导致机器学习失败。
为了克服这些瓶颈,RHyME框架采用了一种新颖、可扩展的方法。它使机器人具备记忆和联想能力,从过去的视频示例中提取相关信息完成新任务。例如,展示一个人将杯子从桌面拿起并放入水槽的视频,RHyME系统会通过参考类似动作的视频数据(如抓住物体或放置餐具),连贯地完成观察到的任务序列。
研究团队的实验结果显示,使用RHyME框架的机器人,训练仅需30分钟的任务数据,其任务完成率较传统方法提升了50%以上。这表明,RHyME可以显著降低机器人大量依赖“遥控操作”进行培训的需求,为机器人提供了更快、更高效的学习路径。
“目前我们仍需要耗费数千小时,通过远程人工操作教会机器人完成任务。这种编程方式并不现实,”Choudhury强调,“RHyME实现了机器人培训的新方式,使大规模、高效训练成为可能。”
这项研究得到了谷歌(Google)、OpenAI、美国海军研究办公室(ONR)以及美国国家科学基金会(NSF)的资助。研究成果已由团队成员Kushal Kedia、Prithwish Dan、Angela Chao、Maximus Adrian Pace和Sanjiban Choudhury合作完成,并于近期发布。
通过RHyME的成功开发,科学家们正在探索机器人学习的全新边界。从缩短培训周期到提高任务适应性,这一进步不仅为机器人技术带来了颠覆性变革,同时也为家庭服务机器人和更复杂场景中的应用铺平了道路。这一进展让人们距离更加智能化的未来更近了一步。
[人形纪元网出品] [机器人学习框架RHyME] [模仿学习与视频培训] [家庭服务机器人智能化] [机器人训练效率提升] [刘智勇频道] [真机智能] [机器姬智能体] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [黄金广告位]
📚 更多资源分享:刘智勇频道第五卷
💾 百度网盘链接:
https://pan.baidu.com/s/1wt8v6MyTmc3rGizAldR1ow?pwd=qwer
🔑 提取码: qwer
数千小时的努力换来一小步的进展,未来家庭里的叮咚机器人指日可待!
如果 RHyME 代表了未来,那这个未来看起来总是与勇气和智慧为伴,期待机器人改变生活!