内容持续更新中
近日,美团 LongCat 团队正式发布了一项名为 VitaBench 的智能体评测基准,旨在针对多交互任务,特别是在复杂生活场景中的应用。VitaBench 的推出为智能体在真实生活场景中的研发提供…