678CHAT AI资讯 腾讯混元翻译模型拿过30次国际第一,现在开源了

腾讯混元翻译模型拿过30次国际第一,现在开源了

9 月 1 日消息,腾讯混元正式宣布将其自主研发的国际翻译模型对外开源,全面开放免费下载与本地部署权限,标志着其在多语言技术领域的又一次重大突破。此次发布的模型名为 Hunyuan-MT-7B,尽管参数规模仅为 70 亿,却展现出惊人的翻译能力,支持多达 33 种国际语言以及 5 种少数民族语言与汉语之间的互译,是一款兼具高效性与实用性的轻量级多语言翻译引擎。

腾讯混元翻译模型拿过30次国际第一,现在开源了插图

据腾讯混元方面介绍,该模型在近期落幕的国际顶级自然语言处理赛事——ACL 旗下的 WMT2025 比赛中表现抢眼。以“Shy-hunyuan-MT”为参赛名称的 Hunyuan-MT-7B,在涵盖中、英、日等主流语种的同时,还参与了捷克语、马拉地语、爱沙尼亚语、冰岛语等冷门语种的比拼,最终在全部 31 个语向翻译任务中斩获 30 项冠军,展现出压倒性的领先优势。值得注意的是,WMT2025 对参赛模型有严格限制:必须开源、仅能使用公开数据集训练,且对模型体积有明确要求。在如此严苛的条件下,Hunyuan-MT-7B 凭借出色的算法优化能力,成功击败多个参数量更大的竞争对手,证明了其技术路径的先进性。

在通用评测基准 Flores200 上的测试结果同样令人瞩目。Hunyuan-MT-7B 不仅在同规模模型中遥遥领先,其翻译质量甚至可与部分超大规模模型相媲美。这一成就背后,是腾讯混元构建的一套完整的翻译模型训练体系。该体系贯穿预训练、持续预训练(CPT)、监督微调、翻译强化学习到模型集成等多个阶段,通过全链路优化显著提升了翻译的准确性与流畅度,最终实现行业顶尖水平。

腾讯混元翻译模型拿过30次国际第一,现在开源了插图1

此次开源还包含一款极具创新性的翻译集成模型——Hunyuan-MT-Chimera-7B(奇美拉)。作为业界首个开源的翻译集成系统,奇美拉能够综合多个翻译模型的输出结果,结合原始文本智能生成更精准、更自然的最终译文。它不仅原生兼容 Hunyuan-MT-7B,还可接入如 DeepSeek 等第三方模型,为专业翻译场景提供更强的定制化能力。

目前,腾讯混元的翻译技术已深度集成至腾讯会议、企业微信、QQ 浏览器、翻译君及海外客服系统等多个核心产品中,显著提升了跨语言沟通效率与用户体验。随着本次开源,开发者和企业用户均可在 Huggingface、Github 等平台获取模型权重、技术文档及论文资料,官网也已上线在线体验入口,进一步推动多语言 AI 技术的普惠化发展。

体验地址:https://hunyuan.tencent.com/modelSquare/home/list

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/19588.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部