近日,麻省理工学院(MIT)的计算机科学与人工智能实验室(CSAIL)与丰田研究院共同推出了一款名为 “可引导场景生成”(steerable scene generation)的生成式 AI 工具,旨在提升机器人学习能力。这款新工具能够创建虚拟训练环境,如厨房、客厅和餐厅,以供工程师测试机器人如何处理现实生活中的任务。
图源备注:图片由AI生成,图片授权服务商Midjourney
该平台经过训练,基于超过4400万个3D 房间的数据,具备 “可引导” 的特性,利用了一种名为 “蒙特卡洛树搜索”(Monte Carlo tree search,MCTS)的策略。MCTS 可以帮助 AI 模型识别并选择场景生成的选项,以实现特定目标,例如让场景尽可能真实,或在场景中添加更多物体。这一策略使得系统在训练过程中能够不断学习,创建出日益复杂的场景。
MIT 的博士生兼 CSAIL 研究员尼古拉斯・帕夫(Nicholas Pfaff)表示,这个项目是首次将 MCTS 应用于场景生成,将场景生成任务视为一种 “序列决策过程”。他说:“我们通过不断构建部分场景,随着时间的推移生成更好或更理想的场景。因此,MCTS 生成的场景比扩散模型训练的场景更为复杂。”
行业专家指出,这项工作可以弥补机器人学习中的一个主要短板,即高质量训练数据的匮乏一直制约着技术的发展。亚马逊机器人应用科学家杰里米・比纳吉亚(Jeremy Binagia)表示:“可引导场景生成提供了更好的方法…… 保证了物理的可行性,并使得生成更加有趣的场景成为可能。”
研究团队表示,他们项目的优势在于能够为工程师创建多样化、可用的场景。帕夫补充道:“借助我们的引导方法,我们能够生成多样化、真实且与任务相一致的场景,从而用于训练我们的机器人。”
尽管该系统仍处于概念验证阶段,团队希望未来能够扩展更多的对象和环境,最终利用生成式 AI 创建全新的资产,而不仅仅依赖于固定的库。通过扩大虚拟训练场的多样性和真实感,团队也希望建立一个用户社区,生成大量数据,为机器人学习更广泛的技能奠定基础。
划重点:
🌐 MIT 与丰田研究院合作推出新 AI 工具,增强机器人虚拟训练能力。
🤖 新工具利用蒙特卡洛树搜索技术生成复杂场景,推动机器人学习进步。
📈 未来希望扩展更多对象与环境,建立用户社区支持机器人技能训练。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则