12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Speciale。新模型具有创新的稀疏注意力机制(DSA)和强化的Agent能力,旨在挑战全球顶级AI模型,包括OpenAI的GPT-5和Google的Gemini3.0Pro。

DeepSeek-V3.2 正式发布:引入创新稀疏注意力架构,API 成本腰斩,性能比肩顶尖闭源模型

DeepSeek-V3.2系列的核心在于其独有的DeepSeek Sparse Attention (DSA)架构。该机制首次实现了细粒度的稀疏注意力,降低了长文本场景下的计算复杂度和内存占用,同时保持了与密集注意力模型相当的性能。这一技术创新带来了效率提升:

  1. 长文本任务上的推理速度提升了2至3倍。

  2. API成本降低,官方宣布价格降低了50%以上。

DeepSeek-V3.2被定位为“Agent优先”的模型,专注于将深度推理能力与工具使用流程深度融合。该模型采用了大规模的 Agent 任务合成流水线进行训练,提高了模型在现实世界应用场景中的泛化能力。新模型引入了“思考模式”,允许模型在执行复杂任务前进行链式逻辑推理,提升了解决问题的准确性。在一系列 Agent 评估中,V3.2达到了开源模型中的最高水平。

DeepSeek-V3.2 正式发布:引入创新稀疏注意力架构,API 成本腰斩,性能比肩顶尖闭源模型

此次发布包含两个核心版本:

  1. DeepSeek-V3.2:该版本已上线于深度求索的网页端、App和API服务。它是一个兼顾效率和性能的模型,适用于日常的推理助手和开发任务。
  2. DeepSeek-V3.2-Speciale:这是一个专注于极限推理能力的高计算增强版,目前仅通过临时的API服务开放。官方报告称,Speciale版本在某些高难度推理任务上的表现超越了GPT-5,并在2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)竞赛中取得了金牌级别的成绩。

深度求索已在Hugging Face上开放了V3.2模型的权重,并提供了相关的开源内核和演示代码,支持研究人员和企业进行商业部署。分析人士认为,DeepSeek V3.2的发布标志着AI行业向结合深度推理和实际工具操作的模型迈出了一步,进一步缩小了开源模型与闭源巨头之间的差距。开发者可以通过查阅DeepSeek API 文档了解更多技术细节和使用指南。

地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp