DeepSeek V4箭在弦上：新功能曝光、发布时间确定-最极客

DeepSeek专家模式

4月7日，有网友发现DeepSeek网页端上线"快速模式"与"专家模式"两个新选项，这被视为其最新大模型DeepSeek V4开启灰度测试的信号。

快速模式主打日常对话的即时响应，支持识别图片和文件中的文字，而专家模式则擅长复杂推理，词元吞吐速度极快，背后疑似路由到了更大规模的V4版本。

更令人期待的是，有开发者在测试界面发现了尚未开放的"视觉模式"按钮，外界普遍猜测DeepSeek V4将最终形成Lite、正式版和视觉版的三款产品矩阵，覆盖从轻量高效到多模态交互的全场景需求。

在技术层面，DeepSeek V4实现了多项突破性创新。其总参数规模达到约1万亿至1.2万亿，采用MoE架构但激活参数控制在32\-37B，推理成本大幅降低。

基于此前发表的Engram技术论文，V4通过将静态知识检索与动态推理解耦，实现了百万Token上下文窗口中"大海捞针"准确率从84.2%跃升至97%，并能永久保存对话历史。

此外，层级化条件专家选择技术将路由计算开销降低约40%，而流形约束超连接（mHC）技术则解决了万亿参数训练稳定性这一世界级难题，使1T级别模型的稳定训练成为现实。

最受关注的战略调整来自算力底座的根本性切换。据The Information独家报道，DeepSeek V4将全面运行在华为昇腾950PR芯片之上，底层代码已从英伟达CUDA迁移至华为自研的CANN Next框架。这一迁移耗时数月，也是V4从年初一再推迟至4月发布的主要原因。

与之呼应的是，阿里、字节跳动、腾讯等国内巨头已向华为下达数十万颗芯片的批量订单，为V4的推理部署铺平道路。这标志着国产大模型在核心技术路径上迈出了独立自主的关键一步。

根据多方消息确认，DeepSeek V4确定于2026年4月正式发布。值得注意的是，OpenAI已宣布其新一代旗舰模型GPT\-6将于4月14日全球亮相。

两款全球顶级大模型的发布时间意外撞车，这不仅是技术参数与性能的巅峰对决，更被业界视为中美AI领域竞争的一次"顶峰相见"。一方是依托国产算力、开源开放的创新力量，另一方是闭源生态、资本驱动的领跑者。

究竟谁能赢得开发者和市场的认可，答案即将在四月揭晓。

DeepSeek V4箭在弦上：新功能曝光、发布时间确定