最近,麻省理工学院(MIT)发布的《2025年商业 AI 现状》报告引发了广泛关注。报告中指出,超过300亿美元已经投入到生成式人工智能(GenAI)中,但高达95% 的企业试点项目未能成功转入生产阶段。

调查显示,阻碍企业进展的并不是技术本身或相关的法规,而是这些工具的应用方式。许多系统并未融入实际工作流程中,缺乏记忆和适应能力,使用一段时间后很少能够改善,因此,尽管在实验室中表现良好,但在实践中却难以奏效。

​MIT 报告揭示 95% 企业 GenAI 项目失败,批评者称其过于简化

图源备注:图片由AI生成,图片授权服务商Midjourney

报告中的 “GenAI 鸿沟” 概念引人注目,一方面只有约5% 的试点项目取得显著成功,带来了数百万美元的收益;另一方面,几乎所有其他项目的90% 则停滞不前,无法迈过测试阶段。MIT 的研究人员指出,这种差距并不在于拥有最好的模型或最快的计算芯片,而是与工具的实际应用息息相关。成功的案例是那些能够与真实工作流程紧密结合并能够随着时间改进的系统,而失败的则是试图将通用 AI 嵌入笨重流程中的项目。

尽管像 ChatGPT 和 Copilot 等通用工具已被80% 以上的公司尝试,并有近40% 的公司在某种程度上进行了推广,但这些工具实际上主要提升了个人生产力,并未显著影响公司的利润表现。针对企业定制的平台或供应商系统,约有60% 的公司进行了探索,但只有20% 的项目进入了试点阶段,失败的主要原因是工作流程脆弱,工具缺乏学习能力,且不符合人们的实际工作方式。

报告还分析了四种主要模式,包括有限的行业颠覆、企业悖论、投资偏见和实施优势。其中,大企业虽然推出了最多的试点项目,但往往是规模化进展最慢的;而中型企业则能在约90天内从测试转向推广。MIT 还指出,大约70% 的预算流向销售和市场营销领域,尽管在后端自动化方面往往能取得更强的回报。

一些批评者对报告的透明度提出质疑,认为报告中的95% 失败率缺乏详细的数据支持,而成功与失败的定义也存在争议,可能会使得一些项目的成果被低估。此外,报告与商业机构的关联性也引发了讨论,认为这可能影响了研究的客观性。

展望未来,报告认为下一阶段将聚焦于 “智能代理 AI”,这些工具能够学习、记忆并跨供应商协调工作,形成一个新兴的 “智能代理网络”,希望这一网络能够实现大规模和一致性,这是早期 GenAI 项目一直未能达到的目标。

划重点:  

📉95% 的企业 GenAI 项目未能成功转入生产,主要原因在于工具的应用方式。  

🏢 大型企业虽然试点最多,但推广速度却相对较慢,中型企业通常能更快转向实施。  

🤖 未来将聚焦智能代理 AI,期望实现更高效的工作流程和一致性。