

哥伦比亚大学工程学院的研究团队日前通过让机器人学习人类面部表情并实现高精度的唇部同步,为实现自然人机交互迈出了重要一步。这项研究由创新部门机械工程专业的詹姆斯与萨莉·斯卡帕创新教授霍德·利普森(Hod Lipson)及其研究团队完成,研究团队对多语言、多种语音风格以及音乐音频进行了一系列测试。

虽然机器人并不理解音频的具体含义,却可以根据声音准确同步嘴唇动作。研究负责人胡宇航(Yuhang Hu)表示,这项技术仅是实现更自然人机交互目标的一部分。配合像ChatGPT或Gemini这样的对话式人工智能,这种唇部同步能力将赋予机器人更深层次的情感互动能力。胡宇航解释道,机器人通过观察人类对话逐渐改善其模仿能力,对话的语境范围越广,机器人越能展现出更符合语境的面部动作和表情。“人类与机器人建立联系的关键在于微妙的面部动作,而这些动作是我们情感连接的重要桥梁。”
霍德·利普森指出,当前类人机器人技术对面部表情的关注十分重要。他预测,随着类人机器人的广泛应用,娱乐、教育、医疗及老年护理等领域对逼真的面部表情需求将大幅增加。一些经济学家的估计表明,未来世界或将生产超过十亿台类人机器人。“这些机器人不可能没有‘面孔’,当它们最终拥有面部功能时,必须协调眼睛和嘴唇动作,否则它们的外表始终会让人感到不适。”
这项研究延续了利普森教授长期致力的技术探索,即通过观察而非预先编程的方式教会机器人执行复杂的面部行为,例如微笑、眼神交流和语言表达。“当机器人通过观察人类学会微笑或说话时,会触发一种奇妙的效果。这不仅是技术上的进步,更是一种情感共鸣。”利普森认为,这是推动人机交互自然化的关键之一。

胡宇航进一步表示,人类面部是最强大的沟通工具之一,尽管科学家至今仍未完全理解它的工作机制。然而,对于机器人来说,掌握这种能力将极大提升其与人类的连接效果。“我们的许多沟通都通过面部语言进行,而机器人在这一领域的潜能还未被真正挖掘。”

尽管这项技术具有重大潜力,研究团队也承认为机器人赋予情感互动能力可能引发伦理争议。“当机器能够通过面部表情与我们建立联系时,无论是技术应用还是伦理限制都将成为公众关注的焦点,”团队成员表示。
这一研究不仅为类人机器人技术带来革命性进展,也为科学界探索改善人机交互的可能性提供了新视角。随着机器人不断学习和复制人类表情,他们或许不仅仅是工具,而将逐步成为人类生活中更自然的伙伴。


[人形纪元网出品] [类人机器人技术] [自然人机交互] [机器人表情识别] [机器人情感互动] [刘智勇频道] [RoboPony(真机智能)] [真机算法] [PixStock.online(设计智能体图库)] [ZhenMeta.com] [机器姬永生人] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [真机量化(zhenquant.hk)] [真机内参] [高能判官] [片场狂徒] [暴徒外放] [Cognition OS] [Embodied OS] [黄金广告位]
📚 【精品资源】添加关注『人形纪元网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》



从科学到生活,技术的发展让人振奋,期待未来的机器人会像朋友一样温暖陪伴
这种研究很燃!也提醒我们,人类依然是技术发展的主导者,我们的想象力才是无穷的力量源泉!
利普森教授延续了对开创性研究的追求,让我们看到了科学家坚持创新的力量,点赞!