代号为 Elephant Alpha 的匿名模型正式揭晓:Ling-2.6-flash

AI 资讯快报  • 2026-04-22 17:271次浏览
蚂蚁百灵大模型团队推出,总参数 104B、激活参数 7.4B,采用 MLA+Lightning Linear 混合注意力与稀疏 MoE 架构。模型在4 卡 H20 环境下推理速度达 340 tokens/s,评测 Token 消耗仅同类约 1/10,在 BFCL-V4、SWE-bench Verified 等 Agent 基准达 SOTA。 更多详情...