据《科创板日报》消息,DeepSeek 即将于下周发布其最新的大型模型 ——V4。这款新模型备受期待,具备图像、视频和文本生成功能,标志着 DeepSeek 在多模态技术上的又一次飞跃。
据知情人士透露,DeepSeek V4 在硬件适配上将全面支持国产算力,目的是优化与中国制造芯片的兼容性。这不仅有望提升中国市场对其半导体产品的需求,还能加速 AI 模型在推理阶段与本土芯片的融合。
在 V4 发布的同时,DeepSeek 还计划推出一份简短的技术说明,预计一个月后会有更详尽的技术报告。这一系列动作显示了 DeepSeek 在技术透明度和市场反应上的决心。
目前,DeepSeek 的 “V4 Lite” 测试版本也正在进行中。这一版本被称为 “sealion-lite”,具有 100 万 tokens 的上下文窗口,相较于 V3 系列的 128K 提升了近 8 倍,理论上能够一次性处理《三体》全集的文本量。值得注意的是,V4 Lite 是原生多模态架构,意味着它在预训练阶段就将文本和视觉理解相结合,而非后期拼接。
从参数规模来看,V4 Lite 预计有 2000 亿参数,而完整的 V4 版本参数可能会突破 1 万亿。此外,V4 Lite 在生成 SVG 图像的能力上也表现出色,使用极简代码(仅 54 行)即可生成高质量图像,显示出其在空间推理和结构化输出方面的提升。
回顾 DeepSeek 的发展历程,该公司自 2023 年以来在推理能力和模型效率上不断创新。自 2024 年发布 V2 以来,DeepSeek 不断追求综合性能与推理效率的平衡。到 2025 年,DeepSeek 推出的 V3 系列不仅确立了强大的综合性能基础,更通过持续的小版本更新提升了用户体验。
总的来看,DeepSeek 在等待 V4 发布的同时,始终在技术革新和多模态能力的布局上不遗余力。这无疑将为 AI 领域带来新的活力与可能性。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则