DeepSeek-V3.1重磅发布：128K上下文+智能体架构，推理效率提升50%

8月21日，深度求索公司正式推出新一代AI模型——DeepSeek-V3.1。这一版本被视作迈向智能体（Agent）时代的关键节点，不仅在性能上实现显著提升，更在功能多样性和使用灵活性方面带来突破，标志着人工智能正向更高效、更智能的方向持续演进。

本次升级最引人瞩目的，是其创新的混合推理架构。该设计让模型能够根据任务需求，在“思考模式”和“非思考模式”之间智能切换。其中，DeepSeek-V3.1-Think在深度思考场景下响应速度大幅提升，相比前代DeepSeek-R1-0528，完成复杂推理的时间显著缩短，思维效率明显优化。同时，借助强化后的Post-Training策略，模型在工具调用、任务自动化等智能体核心能力上也实现了质的飞跃。

为提升用户体验，官方App及网页端现已全面接入V3.1。用户只需点击“深度思考”按钮，即可一键切换推理模式，操作简单直观。API服务也同步升级：deepseek-chat适用于常规对话，而deepseek-reasoner专为复杂推理设计，上下文长度扩展至128K，更好地支持长文本处理。值得一提的是，API Beta版还新增了strict模式下的Function Calling功能，确保函数输出严格遵循预设格式，大幅提升开发集成的稳定性。

兼容性方面，V3.1加强了对Anthropic API格式的支持。开发者可轻松将其整合进Claude Code框架，实现跨平台无缝协作。这一改进显著降低了技术迁移成本，为构建多元化AI应用生态打下坚实基础。

在多项智能体能力测试中，DeepSeek-V3.1表现卓越。无论是编程任务中的代码生成与调试，还是命令行环境下的复杂操作，其成功率和执行效率均优于前代模型。面对需多步推导的复杂查询或跨学科专业问题，V3.1同样表现突出，多项指标大幅领先。

新模型在效率优化方面取得显著进展。经思维链压缩训练，V3.1-Think在输出token减少20%至50%的情况下，仍能保持与旧版相当的任务完成质量。非思考模式下，模型也能精准控制输出长度，维持高效稳定的性能。

为推动技术共享，DeepSeek-V3.1的Base模型已在Hugging Face和魔搭（ModelScope）平台开源。该版本在原有V3基础上追加了840B tokens的训练数据，进一步强化了基础能力。开发者可自由下载与定制，加速AI应用创新。

价格策略方面，公司宣布自2025年9月6日起调整API调用费用，启用新版计价标准，并取消夜间优惠。在此之前用户仍可享受现有优惠。平台也已扩大API服务资源，保障高并发场景下的稳定调用。

开源链接：

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

官方文档：

https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复