近日,上海交通大学的 IPADS 实验室团队推出了一款名为 MobiAgent 的全新移动端智能体工具链,打破了个人化智能助手的开发壁垒,声称其真实场景表现优于 GPT-5和其他顶级闭源模型。

MobiAgent 的推出让每个人都有机会培养属于自己的 AI 助手。这个工具链支持用户从零开始构建移动端智能体,包括从收集操作数据到训练模型,再到将模型部署到手机上的完整流程。MobiAgent 的开源性质,意味着用户可以自主获取数据、训练模型,并在个人设备上实现智能助手的应用。

上海交大发布 MobiAgent:人人都能拥有自己的 AI 助手,超越 GPT-5!

为了验证 MobiAgent 的实际能力,研究团队在国内20款热门应用中进行了测试,结果显示,7B 规模的 MobiAgent 模型在任务完成评分上,不仅超越了多款知名闭源大模型,甚至在同规模的开源 GUI 智能体中也处于领先地位。MobiAgent 独特的 “潜记忆加速器” 能够通过学习历史操作,帮助智能体快速完成重复任务,性能提升达到2-3倍。

MobiAgent 的核心在于其高效的数据收集和智能训练流程。它通过轻量级工具记录用户的手机操作,然后利用通用 VLM 模型生成高质量的训练数据。这些数据经过精炼调整,确保训练出的智能体具有出色的泛化能力。MobiAgent 的 “大脑” 被分为三部分:负责任务规划的 “规划师”、根据当前屏幕做出决策的 “决策者” 以及执行具体操作的 “执行者”。这样的架构让模型训练更加高效,反应速度大幅提升。

通过创新的 AgentRR 加速框架,MobiAgent 能够借助以往的操作经验,大幅提升重复任务的执行效率,最高可实现60%-85% 的动作复用率。这使得智能助手在处理日常事务时更加迅速、准确。

MobiAgent 的推出不仅为个人智能助手的定制化提供了便利,更是推动了整个移动智能体生态的发展,标志着 “能动口就不动手” 的智能时代即将到来。

论文地址:https://arxiv.org/pdf/2509.00531