他来了，deepseek v4pro，国产之光，腾讯救星

作者: AIGCHUB

最近 DeepSeek 发布了 V4 预览版，从技术路径上看，这一代的重点已经非常明确：不是单纯做更大的模型，而是把「超长上下文」做成一个可用、可规模化的能力。

先看模型本身： V4 系列包含两个 MoE 模型——V4-Pro（1.6T 参数，49B 激活）和 V4-Flash（284B 参数，13B 激活），都支持 100万 token 上下文。这个量级已经不只是长文本理解，而是开始覆盖 multi-doc、agent 轨迹甚至复杂任务历史。

关键不在“能不能做”，而在“成本能不能接受”。

这一点上，V4 的优化比较有意思：

从结果上看比较直观：在百万 token 设置下，V4-Pro 的单 token FLOPs 只有 V3.2 的约 27%，KV cache 只有 10%。这意味着长上下文不再是“理论能力”，而是开始具备工程可行性。

性能方面，V4-Pro-Max 在多个 benchmark 上已经接近甚至超过现有顶级模型（包括代码、推理、agent任务）。尤其是 SWE、Tool 等 agent 相关指标，提升比较明显。

一个值得关注的趋势是：长上下文 + 高效率 → 推动 test-time scaling 和 agent 体系真正落地

当上下文可以承载更长轨迹，模型才有可能做更复杂的规划、反思和多轮决策，这一点对 agentic AI 非常关键。

整体来看，DeepSeek-V4 这一步，不只是“更强模型”，而是在回答一个更现实的问题：大模型在长上下文场景下，是否可以成为基础设施级能力。

#大模型话题# #DeepSeek话题# #LLM话题# #长上下文话题# #MoE话题# #Agent话题# #AI工程话题# #推理模型话题#

来源: 小红书