蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源

星*** · 发表于 2025-3-24 16:22:59

IT之家 (https://www.ithome.com/) 3 月 24 日消息，据新浪科技报道，针对有关蚂蚁“百灵”大模型训练成本有关消息，蚂蚁集团回应称，公司针对不同芯片持续调优，以降低 AI 应用成本，目前已经取得一定进展，也将逐步通过开源分享。
IT之家附事件背景：
近日，蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要：无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》，宣布推出两款不同规模的 MoE （混合专家）大语言模型 —— 百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），并提出一系列创新方法，实现在低性能硬件上高效训练大模型，显著降低成本。
百灵轻量版参数规模为 168 亿（激活参数 27.5 亿），增强版基座模型参数规模高达 2900 亿（激活参数 288 亿），性能均达行业领先水平。实验表明，其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源 - IT之家 (https://www.ithome.com/0/840/329.htm)

		自动登录	找回密码
密码			立即注册