在人工智能技术日新月异的今天,蚂蚁百灵大模型团队再次引领行业风向,正式对外开源其最新研发成果——Ring-flash-2.0。这款基于Ling-flash-2.0-base深度优化的高性能思考模型,凭借其卓越的架构设计与推理效率,迅速成为AI领域关注的焦点。该模型总参数量高达100亿,但在实际推理过程中,仅需激活约6.1亿参数,通过这种高度稀疏化的激活机制,实现了计算效能与资源消耗之间的完美平衡。

据官方披露,Ring-flash-2.0在多项专业评测中表现抢眼,尤其在数学推导、代码生成及复杂逻辑推理等高难度任务中,展现出超越同级别40亿参数模型的强劲实力。更令人瞩目的是,其综合性能已可与部分大规模闭源思考模型API以及先进的开源稀疏架构(MoE)模型相抗衡,充分证明了其在技术前沿的领先地位。
为打造这一高效能模型,研发团队创新性地构建了一套两阶段强化学习训练体系。第一阶段采用轻量级Long-CoT(长链思维)结合SFT(监督微调)策略,使基础模型掌握多样化的推理路径与思维模式。进入第二阶段后,团队引入RLVR(可验证奖励强化学习)机制,通过精准的奖励信号持续激发模型深层推理能力。最终,辅以RLHF(基于人类反馈的强化学习)优化,进一步提升模型在真实场景下的通用性与响应质量,确保其在复杂任务中依然保持稳定输出。
此次开源不仅包括Ring-flash-2.0的完整模型权重,更难得的是,团队还将训练所用的强化学习方案与数据配方悉数公开。这一举措无疑为全球AI开发者与科研机构提供了极具价值的技术参考,有望推动整个行业在高效推理模型方向上的深入探索与创新应用。

随着开源生态的持续繁荣,Ring-flash-2.0的发布不仅是技术层面的突破,更是开放协作精神的体现。它为智能对话、自动编程、科学计算等多个领域注入了新的活力,预示着高效、可扩展的AI解决方案将迎来更广阔的应用前景。未来,这款模型或将成为众多创新项目的核心驱动力。
模型地址:
https://huggingface.co/inclusionAI/Ring-flash-2.0

https://modelscope.cn/models/inclusionAI/Ring-flash-2.0
