DeepSeek V4箭在弦上:新功能曝光、发布时间确定

4月7日,有网友发现DeepSeek网页端上线"快速模式"与"专家模式"两个新选项,这被视为其最新大模型DeepSeek V4开启灰度测试的信号。
快速模式主打日常对话的即时响应,支持识别图片和文件中的文字,而专家模式则擅长复杂推理,词元吞吐速度极快,背后疑似路由到了更大规模的V4版本。
更令人期待的是,有开发者在测试界面发现了尚未开放的"视觉模式"按钮,外界普遍猜测DeepSeek V4将最终形成Lite、正式版和视觉版的三款产品矩阵,覆盖从轻量高效到多模态交互的全场景需求。
在技术层面,DeepSeek V4实现了多项突破性创新。其总参数规模达到约1万亿至1.2万亿,采用MoE架构但激活参数控制在32\-37B,推理成本大幅降低。
基于此前发表的Engram技术论文,V4通过将静态知识检索与动态推理解耦,实现了百万Token上下文窗口中"大海捞针"准确率从84.2%跃升至97%,并能永久保存对话历史。
此外,层级化条件专家选择技术将路由计算开销降低约40%,而流形约束超连接(mHC)技术则解决了万亿参数训练稳定性这一世界级难题,使1T级别模型的稳定训练成为现实。
最受关注的战略调整来自算力底座的根本性切换。据The Information独家报道,DeepSeek V4将全面运行在华为昇腾950PR芯片之上,底层代码已从英伟达CUDA迁移至华为自研的CANN Next框架。这一迁移耗时数月,也是V4从年初一再推迟至4月发布的主要原因。
与之呼应的是,阿里、字节跳动、腾讯等国内巨头已向华为下达数十万颗芯片的批量订单,为V4的推理部署铺平道路。这标志着国产大模型在核心技术路径上迈出了独立自主的关键一步。
根据多方消息确认,DeepSeek V4确定于2026年4月正式发布。值得注意的是,OpenAI已宣布其新一代旗舰模型GPT\-6将于4月14日全球亮相。
两款全球顶级大模型的发布时间意外撞车,这不仅是技术参数与性能的巅峰对决,更被业界视为中美AI领域竞争的一次"顶峰相见"。一方是依托国产算力、开源开放的创新力量,另一方是闭源生态、资本驱动的领跑者。
究竟谁能赢得开发者和市场的认可,答案即将在四月揭晓。
