近日,一项名为 RoboChallenge 的基准测试平台正式发布,旨在为机器人领域提供首个大规模、多任务且在真实物理环境中由真实机器人执行操作任务的评估标准。

RoboChallenge 由 Dexmal 原力灵机联合 Hugging Face 共同发起。该测试平台的核心价值在于克服了现有机器人基准测试在真实环境下的性能验证、标准化测试条件和公开可访问测试平台等方面的挑战。

全球首个真实物理环境多任务基准 RoboChallenge 发布

该基准测试将为**视觉语言动作模型(VLAs)**在机器人中的实际应用提供更加可靠和可比较的评估标准,从而加速 VLA 模型从模拟环境走向实际物理世界的部署和验证进程。