8月21日,深度求索公司正式推出新一代AI模型——DeepSeek-V3.1。这一版本被视作迈向智能体(Agent)时代的关键节点,不仅在性能上实现显著提升,更在功能多样性和使用灵活性方面带来突破,标志着人工智能正向更高效、更智能的方向持续演进。

本次升级最引人瞩目的,是其创新的混合推理架构。该设计让模型能够根据任务需求,在“思考模式”和“非思考模式”之间智能切换。其中,DeepSeek-V3.1-Think在深度思考场景下响应速度大幅提升,相比前代DeepSeek-R1-0528,完成复杂推理的时间显著缩短,思维效率明显优化。同时,借助强化后的Post-Training策略,模型在工具调用、任务自动化等智能体核心能力上也实现了质的飞跃。
为提升用户体验,官方App及网页端现已全面接入V3.1。用户只需点击“深度思考”按钮,即可一键切换推理模式,操作简单直观。API服务也同步升级:deepseek-chat适用于常规对话,而deepseek-reasoner专为复杂推理设计,上下文长度扩展至128K,更好地支持长文本处理。值得一提的是,API Beta版还新增了strict模式下的Function Calling功能,确保函数输出严格遵循预设格式,大幅提升开发集成的稳定性。
兼容性方面,V3.1加强了对Anthropic API格式的支持。开发者可轻松将其整合进Claude Code框架,实现跨平台无缝协作。这一改进显著降低了技术迁移成本,为构建多元化AI应用生态打下坚实基础。
在多项智能体能力测试中,DeepSeek-V3.1表现卓越。无论是编程任务中的代码生成与调试,还是命令行环境下的复杂操作,其成功率和执行效率均优于前代模型。面对需多步推导的复杂查询或跨学科专业问题,V3.1同样表现突出,多项指标大幅领先。
新模型在效率优化方面取得显著进展。经思维链压缩训练,V3.1-Think在输出token减少20%至50%的情况下,仍能保持与旧版相当的任务完成质量。非思考模式下,模型也能精准控制输出长度,维持高效稳定的性能。
为推动技术共享,DeepSeek-V3.1的Base模型已在Hugging Face和魔搭(ModelScope)平台开源。该版本在原有V3基础上追加了840B tokens的训练数据,进一步强化了基础能力。开发者可自由下载与定制,加速AI应用创新。

价格策略方面,公司宣布自2025年9月6日起调整API调用费用,启用新版计价标准,并取消夜间优惠。在此之前用户仍可享受现有优惠。平台也已扩大API服务资源,保障高并发场景下的稳定调用。
开源链接:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
官方文档:
https://api-docs.deepseek.com/zh-cn/guides/anthropic_api
