一个消息在科技圈悄悄炸开了锅:DeepSeek V4 确认将在2026年4月正式发布。
距离上一个版本V3的发布日期为2025年6月27日,已将近一年了。春节期间各大厂都发布大模型新版本,openClow大火的时候,deepseek也没动静,就在大家都以为deepseek再难有大作为的时候,一个消息在科技圈悄悄炸开了锅,V4版本要发布了,而且带来了三大惊喜!
一:参数能力和成本优势以及开源。
总参数量1万亿,上下文窗口100万 Token,原生多模态,输入价格每百万 Token 仅 0.5 美元。
对比一下,GPT-4o 是 2.5 美元,Claude Opus 4 是 15 美元。
而且……它是 Apache 2.0 开源协议。
二:牵手华为昇腾芯片,中国AI算力独立
DeepSeek正准备在未来几周内发布下一代DeepSeek V4大模型,却走出了一条截然不同的路:完全搭载华为芯片,而非美国GPU。 这一举动直接打破了行业惯例。
为了实现这一目标,这家总部位于杭州的初创公司并未像往常一样寻求英伟达或AMD的授权优化,而是直接联手华为与寒武纪,对模型底层代码进行了深度重写与专项调优。这种“原生适配”的模式,使得英伟达和AMD失去了在芯片性能微调上的早期关键机会。
三:尝试使用全新模型,底层代码级别重构
有人猜测三月底deepseek的C端大故障,系V4新模型进行隐身测试导致。
多模态能力 V4 将是一个真正的多模态大模型,不只是文字,还能处理图像、视觉内容。这是 V3 没有的能力。
长期记忆机制 DeepSeek 团队负责人梁文锋在今年 1 月发表了一篇论文《Conditional Memory via Scalable Lookup》,提出了”条件记忆”机制——简单说,就是让模型在超长对话或复杂任务中,能更好地”记住”关键信息,而不是越聊越忘。 这个方向,恰好戳中了当前 AI 助手最大的痛点:记忆能力太弱,上下文一长就乱套。
深度适配国产芯片 DeepSeek V4 的目标之一是完全基于国产算力运行。这是在英伟达出口限制背景下的主动应对,也是未来中国 AI 产业自主化的关键一步。

