美团放大招！LongCat-Flash-Chat模型560B参数，智能表现太牛了

近日，国内科技巨头美团在人工智能领域再落一子，正式对外发布并开源了其全新研发的AI大模型——LongCat-Flash-Chat。这款模型凭借高达560B的总参数量以及18.6B至31.3B的动态激活参数区间，成功在性能与效率之间找到了理想平衡点。尤为引人注目的是，LongCat-Flash采用了前沿的混合专家系统（MoE）架构，并创新性地引入“零计算专家”机制。这意味着在处理每一个token时，模型仅激活真正需要的参数模块，大幅降低冗余计算，显著提升整体算力利用率。

在底层架构设计上，LongCat-Flash还融入了跨层通道技术，有效增强了模型在训练与推理过程中的并行处理能力。得益于此，该模型仅用短短30天便在H800硬件平台上完成了高强度训练，并实现了单用户每秒处理100个token的惊人推理速度。更进一步，美团团队在训练中引入了PID控制器，实时调控专家模块的偏置参数，将平均激活参数稳定控制在27B左右，既保障了模型性能，又避免了算力资源的过度消耗，体现出极高的工程优化水准。

除了基础性能的突破，LongCat-Flash在智能体（Agentic）能力方面的表现同样亮眼。研发团队构建了专属的Agentic评测体系，并采用多智能体协同的数据生成策略，持续强化模型在复杂任务环境下的决策与执行能力。在权威的VitaBench基准测试中，LongCat-Flash一举夺魁，展现出远超同类模型的智能体行为规划与工具调用能力。即便面对参数规模更为庞大的竞品，它依然能在实际应用场景中保持敏捷响应与高准确率。

在通用知识理解层面，LongCat-Flash同样交出了令人信服的成绩单。其在ArenaHard-V2测试中斩获86.50分，高居评测榜单第二位；而在MMLU和CEval两大核心基准测试中，分别取得89.71与90.44的优异成绩，充分证明了其在多语言理解、逻辑推理以及中文语境下的强大适应力。无论是学术知识还是日常对话，模型均能精准捕捉语义，提供高质量输出。

LongCat-Flash-Chat的推出，不仅标志着美团在大模型技术路径上的深度探索取得实质性成果，其全面开源的策略更为全球开发者社区注入了新动能。无论是研究机构还是独立开发者，均可基于该项目进行二次开发与创新应用，共同推动AI生态的开放与进步。

项目地址:https://github.com/meituan-longcat/LongCat-Flash-Chat

体验官网:https://longcat.ai/

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复