蚂蚁回应新模型训练成本降低:基于不同芯片持
针对有关蚂蚁“百灵”大模型训练成本有关消息,蚂蚁集团回应称,公司针对不同芯片持续调优,以降低 AI 应用成本,目前已经附事件背景:
近日,蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文,宣布推出两款不同规模的 MoE 大语言模型 —— 百灵轻量版与百灵增强版,并提出一系列创新方法,实现百灵轻量版参数规模为 168 亿,增强版基座模型参数规模高达 2900 亿,性能均达行业领先水平。实验表明,其 3000 亿参数的 MoE 大模型可在
