美团大模型及AGI-Eval大模型评测社区介绍

LMG2025

LongCatFlash模型简介：

美团 LongCat 团队正式发布并开源自研大模型 LongCatFlash，采用创新性混合专家模型（Mixture-of-ExpertsMoE）架构，总参数 560 B，激活参数 18.6B ~ 31.3B（平均27B），实现了计算效率与性能的双重优化。其中LongCatFlash-Chat 版本凭借面向推理效率的设计实现极速响应，性能比肩主流模型，尤其在智能体任务中表现突出，适配复杂且耗时的智能体应用场景。全新 LongCat-Flash-Thinking 版本在延续极致推理速度的同时，成为国内首个融合「深度思考+工具调用」与「非形式化+形式化」推理能力的大模型。其在逻辑、数学、代码、智能体等多领域的推理任务中，达到全球开源模型的最先进水平（SOTA）。

技术亮点：

极致的性能：

通过系统优化，LongCat-Flash 在H800 上达成了100 tokens/s 的生成速度，在保持极致生成速度的同时，输出成本低至 5元/百万 token。

创新型架构：

引入“零计算专家（ZeroComputation Experts）”机制，总参数量 560B，每个token 依据上下文需求仅激活 18.6B~31.3 B参数，实现算力按需分配；同时通过Shortcut-connected MoE，极大提高了训练和推理效率。

优秀的智能体能力：

通过自建 Agentic 评测集指导数据策略，在训练全流程进行了全面的优化。

全面开放，即刻体验 LongCat Chat：https://longcat.ai

Hugging Face： https://huggingface.co/meituan-longcat

GitHub：https://github.com/meituan-longcat

LMG2025

AGI-Eval大模型评测社区介绍：

AGI-Eval是上海交通大学、同济大学、华东师范大学、美团、DataWhale等高校和机构合作发布的大模型评测社区，以“评测助力，让AI成为我们更好的伙伴”为使命，旨在通过发展长生命周期的评测体系，打造公正、可信、科学、全面的评测生态，评估大语言模型及多模态模型在各类任务中的AGI能力。 👉立即体验：https://agi-eval.cn LMG2025

AGI-Eval评测合伙人计划

本计划面向具备前沿探索能力的大模型评测研究团队，力求帮助您解决大模型评测研究过程中的资源紧俏、技术攻关、成果转化等核心诉求，诚挚邀请您共同打造长周期的评测生态，迈进下一代AGI！您将获得： 1.全方位、高影响力的学术曝光渠道 2.免费、长期的评测集托管服务，新模型发布后为您维护最新模型榜单 3.学术资助金、标注及算力资源 4.大模型评测学术社区交流网络 👉评测集社区：https://agi-eval.cn/evaluation/home，已收录超100个高价值评测集，评测社区专家学者人数超300人。 LMG2025 LMG2025

AGI-Eval评测社区展示

LMG2025