国产大模型再突破！DeepSeek-V3.1发布：上下文窗口翻倍至128k，长文本处理能力跃升

北京，2025年8月19日 — 国内人工智能领军企业深度求索（DeepSeek）今日正式发布大语言模型升级版DeepSeek-V3.1。此次更新在保持API接口兼容性的同时，将上下文处理能力从64k tokens提升至128k tokens，创下国产开源大模型在长文本理解领域的新纪录。

快速迭代展现技术实力

距离上一代V3-0324版本发布仅五个月，新版本便火速面世。值得注意的是，今年3月推出的V3-0324已在代码生成、逻辑推理等关键领域取得突破，为本次升级奠定了坚实基础。

在全球AI竞赛日趋激烈的背景下，深度求索团队克服高端算力获取受限的困难，通过自研训练架构和算法优化，成功突破资源瓶颈。这种技术韧性使其在开源生态中建立了显著优势。

四大升级亮点解析

1. 超长上下文支持：处理能力翻倍后，模型可轻松应对多轮对话、长篇文档分析等复杂任务，特别适合法律文书、科研论文等专业场景。

2. 结构化输出优化：新版本能更智能地使用表格、项目符号等排版方式，就像专业编辑一样组织内容，大幅提升信息呈现效果。

3. 物理建模能力增强：对力学原理、自然现象的理解更加精准，为教育仿真、工程设计等应用提供了更可靠的智能支持。

4. 推理效率提升：延续广受好评的MoE架构，日常任务无需启用"深度思考"模式即可获得优质输出，响应速度提升约30%。

技术负责人表示："V3.1不是简单的参数堆砌，而是在真实应用场景中打磨出的实用型AI。"

全平台同步上线

目前新版本已登陆官网、官方App及微信小程序，API接口保持完全兼容。开发者无需修改代码即可享受升级带来的性能提升，极大降低了迁移成本。

持续赋能开源生态

尽管Hugging Face平台暂未开放模型权重下载，公司重申对开源社区的承诺。深度求索表示将持续为学术界和开发者提供透明、可复用的技术资源。

业内专家认为，这次升级标志着国产大模型在实用性、稳定性上的全面进步。随着长文本处理等技术的成熟，V3.1有望在知识管理、智能客服等领域创造更大价值。

快速迭代展现技术实力

四大升级亮点解析

全平台同步上线

持续赋能开源生态

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复