DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

12月1日 — 中国人工智能初创公司深度求索（DeepSeek AI）发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Speciale。新模型具有创新的稀疏注意力机制(DSA)和强化的Agent能力，旨在挑战全球顶级AI模型，包括OpenAI的GPT-5和Google的Gemini3.0Pro。

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

DeepSeek-V3.2系列的核心在于其独有的DeepSeek Sparse Attention （DSA）架构。该机制首次实现了细粒度的稀疏注意力，降低了长文本场景下的计算复杂度和内存占用，同时保持了与密集注意力模型相当的性能。这一技术创新带来了效率提升:

长文本任务上的推理速度提升了2至3倍。
API成本降低，官方宣布价格降低了50%以上。

DeepSeek-V3.2被定位为“Agent优先”的模型，专注于将深度推理能力与工具使用流程深度融合。该模型采用了大规模的 Agent 任务合成流水线进行训练，提高了模型在现实世界应用场景中的泛化能力。新模型引入了“思考模式”，允许模型在执行复杂任务前进行链式逻辑推理，提升了解决问题的准确性。在一系列 Agent 评估中，V3.2达到了开源模型中的最高水平。

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

此次发布包含两个核心版本:

DeepSeek-V3.2:该版本已上线于深度求索的网页端、App和API服务。它是一个兼顾效率和性能的模型，适用于日常的推理助手和开发任务。
DeepSeek-V3.2-Speciale:这是一个专注于极限推理能力的高计算增强版，目前仅通过临时的API服务开放。官方报告称，Speciale版本在某些高难度推理任务上的表现超越了GPT-5，并在2025年国际数学奥林匹克（IMO）和国际信息学奥林匹克(IOI)竞赛中取得了金牌级别的成绩。

深度求索已在Hugging Face上开放了V3.2模型的权重，并提供了相关的开源内核和演示代码，支持研究人员和企业进行商业部署。分析人士认为，DeepSeek V3.2的发布标志着AI行业向结合深度推理和实际工具操作的模型迈出了一步，进一步缩小了开源模型与闭源巨头之间的差距。开发者可以通过查阅DeepSeek API 文档了解更多技术细节和使用指南。

地址：https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

32万用户在看

中国人工智能缩小与美国差距

21.5万用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.5万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.8万用户在看

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

最近更新

文章目录

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

32万 用户在看

中国人工智能缩小与美国差距

21.5万 用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.5万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.8万 用户在看

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

最近更新

文章目录

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

32万用户在看

21.5万用户在看

19.5万用户在看

17.8万用户在看