9月30日,国内人工智能领军企业智谱正式推出其最新一代旗舰级文本模型——GLM-4.6,标志着国产大模型在核心技术能力上的又一次重大突破。作为GLM系列的最新成员,该模型不仅在整体性能上全面超越前代GLM-4.5,更在代码生成领域实现了高达27%的显著提升,成为当前国内最强的编程专用模型。

此次发布的GLM-4.6拥有高达3550亿的总参数量,激活参数为320亿。官方数据显示,该模型在多项核心能力维度上均实现了对上一代产品的全面超越,展现出强大的综合竞争力。
-
在编码能力方面,GLM-4.6在多个公开基准测试和真实编程场景中表现卓越,已达到与Claude Sonnet 4齐平的水平,被业内视为目前国内最顶尖的代码生成模型。
-
上下文处理能力大幅提升,窗口长度从128K扩展至200K,能够更高效地处理长篇代码文件及复杂智能体任务,满足开发者对超长上下文的需求。
-
推理能力进一步增强,支持在推理过程中动态调用外部工具,提升了模型的自主决策与执行能力。
-
搜索与工具调用表现优化,尤其在智能体框架中的响应速度与准确性均有明显提升。
-
内容创作能力也得到强化,在文风把控、可读性以及角色扮演类应用中更贴近人类表达习惯,用户体验更加自然流畅。
多语言翻译能力持续进化,跨语种任务处理效果更加精准,助力全球化应用场景落地。
目前,GLM-4.6已正式上线智谱MaaS平台(bigmodel.cn),并计划即将在Hugging Face与ModelScope等主流开源社区发布,采用宽松的MIT协议,便于开发者自由使用与二次开发。
1. 综合能力评测表现亮眼
在涵盖AIME 25、LCB v6、HLE、SWE-Bench Verified等八大权威基准测试中,GLM-4.6在多个榜单中与Claude Sonnet 4/4.5并驾齐驱,稳居国产大模型榜首位置,展现出全面均衡的通用能力。
2. 真实编程场景实测领先
为验证模型在实际开发中的表现,智谱在Claude Code环境下设计了74项真实编程任务进行测试。结果显示,GLM-4.6不仅超越了Claude Sonnet 4,也大幅领先其他国产同类模型。尤为值得一提的是,其平均token消耗较GLM-4.5降低了30%以上,为当前同类模型中最低,显著降低了使用成本。
为提升测试透明度,智谱已将全部测试题目与Agent执行轨迹公开,供业界复现与验证,相关数据集已发布于Hugging Face平台。
在硬件适配方面,GLM-4.6实现了里程碑式的突破:首次在寒武纪国产芯片上完成FP8+Int4混合量化部署,打造了国产芯片与先进大模型深度融合的“芯片-模型”一体化解决方案,在不牺牲精度的前提下大幅降低推理开销。同时,基于vLLM推理框架,摩尔线程新一代GPU也已实现对GLM-4.6原生FP8精度的稳定支持,彰显了国产算力生态的快速演进与强大兼容性。
上述软硬协同的成果将通过智谱MaaS平台向公众与企业用户开放服务。

伴随新模型上线,智谱同步升级了GLM Coding Plan服务方案,推出最低20元起的包月畅玩套餐,并上线企业定制版。原有订阅用户将自动升级至GLM-4.6,享受包括图像识别与搜索能力在内的多项新功能,并支持Claude Code、Roo Code等十余种主流编程工具。针对高频开发者,还特别推出GLM Coding Max套餐,提供远超竞品的资源配额,满足重度使用需求。
