爆料!DeepSeek-V4 再战春节:不卷推理,卷「编程」!

DeepSeek-V4 要来了。

The Information 今天独家报道,DeepSeek 正在准备发布下一代旗舰模型 V4,预计在 2 月中旬春节前后上线。

两位知情人士透露,内部测试显示 V4 在编程任务上的表现可能超越 Anthropic Claude 和 OpenAI GPT 系列。

 

 

 

 

 

这是继 R1 之后的又一次架构级调整。方向变了:从推理,转向「编程」。

 

 

 


去年 1 月 20 日,DeepSeek 在春节前发布了 R1。

假期里口碑发酵,开市第一天美股芯片股集体暴跌。

市场突然意识到,用极低算力成本也可以实现与顶级模型的对标。

今年,DeepSeek 可能打算再来一次。

 

 

 


为什么是编程?

因为编程能力才是 AI 在个人和企业市场的硬通货。

 

 

当前编程领域的标杆是 Claude Opus 4.5,在 SWE-bench Verified 上以 80.9% 保持记录。

 

V4 要想夺冠,需要展示的不只是代码生成能力,还包括调试和调用外部工具的 Agent 能力。

报道还提到,V4 在处理超长代码提示方面取得了突破。这对复杂软件项目的开发者来说,可能是个大杀器。

 

 

 


其实在这篇报道之前,DeepSeek 已经放出了两个信号。

第一个信号是 1 月 1 日的 mHC 论文。创始人梁文锋署名。

图片

论文里提到,他们把信号放大倍数从 3000 降到了 1.6,三个数量级的差距。

德国特里尔大学的研究员 Florian Brand 说,DeepSeek 的论文往往是下一代模型技术方向的早期信号。

第二个信号是 1 月 4 日 R1 论文的悄悄更新。

 

 

 

没有官方公告,只是版本号从 v1 变成了 v2。但页数从 22 页膨胀到 86 页,新增了完整的训练流程披露,还有一个罕见的「失败尝试」章节,分析了 MCTS 在通用推理任务上行不通。

图片

这种「防御性开源」通常意味着一件事:为新模型清理技术债务,把技术细节公开存档,然后全力投入下一代。

 

 

 


关于 R2,分析师的判断是「很可能不会有单独的 R2 了」。

DeepSeek 已经把 R1 的更新整合进了 V3 模型,mHC 技术很可能会成为 V4 的技术骨架。

V4 预计 2 月中旬发布,但时间表仍有变动可能。

去年 R1 让硅谷意识到,中国 AI 公司可以用十分之一的成本做出同等水平的模型。

今年 V4,DeepSeek 想证明的是另一件事:不只是推理,编程也行。

注:文章来源于为微信公众号《AI信息Gap》。

 

首页_07180934_815    行业新闻    爆料!DeepSeek-V4 再战春节:不卷推理,卷「编程」!
创建时间:2026-01-12
浏览量:0

请完善以下信息,获取完整案例资料!

联系电话 *

姓名

公司名称

意向方案选择
咨询问题 *