678CHAT AI资讯 美团放大招!LongCat-Flash-Chat模型560B参数,智能表现太牛了

美团放大招!LongCat-Flash-Chat模型560B参数,智能表现太牛了

近日,国内科技巨头美团在人工智能领域再落一子,正式对外发布并开源了其全新研发的AI大模型——LongCat-Flash-Chat。这款模型凭借高达560B的总参数量以及18.6B至31.3B的动态激活参数区间,成功在性能与效率之间找到了理想平衡点。尤为引人注目的是,LongCat-Flash采用了前沿的混合专家系统(MoE)架构,并创新性地引入“零计算专家”机制。这意味着在处理每一个token时,模型仅激活真正需要的参数模块,大幅降低冗余计算,显著提升整体算力利用率。

美团放大招!LongCat-Flash-Chat模型560B参数,智能表现太牛了插图

在底层架构设计上,LongCat-Flash还融入了跨层通道技术,有效增强了模型在训练与推理过程中的并行处理能力。得益于此,该模型仅用短短30天便在H800硬件平台上完成了高强度训练,并实现了单用户每秒处理100个token的惊人推理速度。更进一步,美团团队在训练中引入了PID控制器,实时调控专家模块的偏置参数,将平均激活参数稳定控制在27B左右,既保障了模型性能,又避免了算力资源的过度消耗,体现出极高的工程优化水准。

除了基础性能的突破,LongCat-Flash在智能体(Agentic)能力方面的表现同样亮眼。研发团队构建了专属的Agentic评测体系,并采用多智能体协同的数据生成策略,持续强化模型在复杂任务环境下的决策与执行能力。在权威的VitaBench基准测试中,LongCat-Flash一举夺魁,展现出远超同类模型的智能体行为规划与工具调用能力。即便面对参数规模更为庞大的竞品,它依然能在实际应用场景中保持敏捷响应与高准确率。

美团放大招!LongCat-Flash-Chat模型560B参数,智能表现太牛了插图1

在通用知识理解层面,LongCat-Flash同样交出了令人信服的成绩单。其在ArenaHard-V2测试中斩获86.50分,高居评测榜单第二位;而在MMLU和CEval两大核心基准测试中,分别取得89.71与90.44的优异成绩,充分证明了其在多语言理解、逻辑推理以及中文语境下的强大适应力。无论是学术知识还是日常对话,模型均能精准捕捉语义,提供高质量输出。

LongCat-Flash-Chat的推出,不仅标志着美团在大模型技术路径上的深度探索取得实质性成果,其全面开源的策略更为全球开发者社区注入了新动能。无论是研究机构还是独立开发者,均可基于该项目进行二次开发与创新应用,共同推动AI生态的开放与进步。

项目地址:https://github.com/meituan-longcat/LongCat-Flash-Chat

体验官网:https://longcat.ai/

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/19548.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部