国产大模型又升级了！智谱新AI能写代码还支持国产芯片

9月30日，国内人工智能领军企业智谱正式推出其最新一代旗舰级文本模型——GLM-4.6，标志着国产大模型在核心技术能力上的又一次重大突破。作为GLM系列的最新成员，该模型不仅在整体性能上全面超越前代GLM-4.5，更在代码生成领域实现了高达27%的显著提升，成为当前国内最强的编程专用模型。

此次发布的GLM-4.6拥有高达3550亿的总参数量，激活参数为320亿。官方数据显示，该模型在多项核心能力维度上均实现了对上一代产品的全面超越，展现出强大的综合竞争力。

在编码能力方面，GLM-4.6在多个公开基准测试和真实编程场景中表现卓越，已达到与Claude Sonnet 4齐平的水平，被业内视为目前国内最顶尖的代码生成模型。
上下文处理能力大幅提升，窗口长度从128K扩展至200K，能够更高效地处理长篇代码文件及复杂智能体任务，满足开发者对超长上下文的需求。
推理能力进一步增强，支持在推理过程中动态调用外部工具，提升了模型的自主决策与执行能力。
搜索与工具调用表现优化，尤其在智能体框架中的响应速度与准确性均有明显提升。
内容创作能力也得到强化，在文风把控、可读性以及角色扮演类应用中更贴近人类表达习惯，用户体验更加自然流畅。
多语言翻译能力持续进化，跨语种任务处理效果更加精准，助力全球化应用场景落地。

目前，GLM-4.6已正式上线智谱MaaS平台（bigmodel.cn），并计划即将在Hugging Face与ModelScope等主流开源社区发布，采用宽松的MIT协议，便于开发者自由使用与二次开发。

1. 综合能力评测表现亮眼

在涵盖AIME 25、LCB v6、HLE、SWE-Bench Verified等八大权威基准测试中，GLM-4.6在多个榜单中与Claude Sonnet 4/4.5并驾齐驱，稳居国产大模型榜首位置，展现出全面均衡的通用能力。

2. 真实编程场景实测领先

为验证模型在实际开发中的表现，智谱在Claude Code环境下设计了74项真实编程任务进行测试。结果显示，GLM-4.6不仅超越了Claude Sonnet 4，也大幅领先其他国产同类模型。尤为值得一提的是，其平均token消耗较GLM-4.5降低了30%以上，为当前同类模型中最低，显著降低了使用成本。

为提升测试透明度，智谱已将全部测试题目与Agent执行轨迹公开，供业界复现与验证，相关数据集已发布于Hugging Face平台。

在硬件适配方面，GLM-4.6实现了里程碑式的突破：首次在寒武纪国产芯片上完成FP8+Int4混合量化部署，打造了国产芯片与先进大模型深度融合的“芯片-模型”一体化解决方案，在不牺牲精度的前提下大幅降低推理开销。同时，基于vLLM推理框架，摩尔线程新一代GPU也已实现对GLM-4.6原生FP8精度的稳定支持，彰显了国产算力生态的快速演进与强大兼容性。

上述软硬协同的成果将通过智谱MaaS平台向公众与企业用户开放服务。

伴随新模型上线，智谱同步升级了GLM Coding Plan服务方案，推出最低20元起的包月畅玩套餐，并上线企业定制版。原有订阅用户将自动升级至GLM-4.6，享受包括图像识别与搜索能力在内的多项新功能，并支持Claude Code、Roo Code等十余种主流编程工具。针对高频开发者，还特别推出GLM Coding Max套餐，提供远超竞品的资源配额，满足重度使用需求。

1. 综合能力评测表现亮眼

2. 真实编程场景实测领先

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复