美团大模型及AGI-Eval大模型评测社区介绍



LongCatFlash模型简介:
美团 LongCat 团队正式发布并开源自研大模型 LongCatFlash,采用创新性混合专家模型(Mixture-of-ExpertsMoE)架构,总参数 560 B,激活参数 18.6B ~ 31.3B(平均27B),实现了计算效率与性能的双重优化。其中LongCatFlash-Chat 版本凭借面向推理效率的设计实现极速响应,性能比肩主流模型,尤其在智能体任务中表现突出,适配复杂且耗时的智能体应用场景。全新 LongCat-Flash-Thinking 版本在延续极致推理速度的同时,成为国内首个融合「深度思考+工具调用」与「非形式化+形式化」推理能力的大模型。其在逻辑、数学、代码、智能体等多领域的推理任务中,达到全球开源模型的最先进水平(SOTA)。
技术亮点:
极致的性能:
通过系统优化,LongCat-Flash 在H800 上达成了100 tokens/s 的生成速度,在保持极致生成速度的同时,输出成本低至 5元/百万 token。
创新型架构:
引入“零计算专家(ZeroComputation Experts)”机制,总参数量 560B,每个token 依据上下文需求仅激活 18.6B~31.3 B参数,实现算力按需分配;同时通过Shortcut-connected MoE,极大提高了训练和推理效率。
优秀的智能体能力:
通过自建 Agentic 评测集指导数据策略,在训练全流程进行了全面的优化。
全面开放,即刻体验 LongCat Chat:https://longcat.ai
Hugging Face: https://huggingface.co/meituan-longcat
GitHub:https://github.com/meituan-longcat

AGI-Eval大模型评测社区介绍:
AGI-Eval是上海交通大学、同济大学、华东师范大学、美团、DataWhale等高校和机构合作发布的大模型评测社区,以“评测助力,让AI成为我们更好的伙伴”为使命,旨在通过发展长生命周期的评测体系,打造公正、可信、科学、全面的评测生态,评估大语言模型及多模态模型在各类任务中的AGI能力。
👉立即体验:https://agi-eval.cn

AGI-Eval评测合伙人计划
本计划面向具备前沿探索能力的大模型评测研究团队,力求帮助您解决大模型评测研究过程中的资源紧俏、技术攻关、成果转化等核心诉求,诚挚邀请您共同打造长周期的评测生态,迈进下一代AGI!
您将获得:
1.全方位、高影响力的学术曝光渠道
2.免费、长期的评测集托管服务,新模型发布后为您维护最新模型榜单
3.学术资助金、标注及算力资源
4.大模型评测学术社区交流网络
👉评测集社区:https://agi-eval.cn/evaluation/home,已收录超100个高价值评测集,评测社区专家学者人数超300人。

AGI-Eval评测社区展示




