3月24日,彭博社征引知恋人士动静称,蚂蚁集团已成功操纵阿里巴巴、华为等国产芯片,连系夹杂专家(MoE)架构锻炼出参数规模达2900亿的大模子“Ling-Plus”,其机能取英伟达H800芯片锻炼的同类模子相当,且锻炼成本降低20%。这一冲破是继科大讯飞“星火大模子”之后,中国国产算力生态即将送来的第二个标记性大模子。据蚂蚁集团Ling团队发布的论文,其自研的Ling系列模子通利用国产芯片(如壁仞科技、智芯、锻炼1万亿Token的成本从635万元降至508万元,降幅达20%,针对外媒(彭博社)关于蚂蚁百灵大模子锻炼成本的报道,蚂蚁方面回应察看者网称:蚂蚁针对分歧芯片持续调优,以降低AI使用成本,目前取得了必然的进展,也会逐渐通过开源分享。除了自研机能领先的大模子以外,该手艺论文最大的冲破正在于提出了一系列立异方式,以提拔资本受限下AI开辟的效率取可及性。尝试表白,其3000亿参数的MoE大模子可正在利用国产GPU的低机能设备上完成高效锻炼,机能取完全利用英伟达芯片、同规模的浓密模子及MoE模子相当。做为国内较早结构AI大模子的厂商,蚂蚁自研的百灵大模子2023年已通过存案,沉点结构正在糊口办事、金融办事、医疗健康等场景的使用。本月,科大讯飞取华为结合团队颁布发表,成功正在昇腾国产算力集群上实现MoE模子的大规模跨节点专家并行推理。这是继深度求索(DeepSeek)公开MoE锻炼方案后,业界首个完全基于国产算力的处理方案。通过算子融合、夹杂并行策略和通信计较并行优化等一系列立异,科大讯飞正在国产算力上实现了显著机能提拔:单卡静态内存占用缩减至双机摆设的1/4,效率提拔75%,专家计较密度添加4倍,推理吞吐提拔3。2倍,端到端时延降低50%。基于此次科大讯飞联袂华为所做的首个基于国产算力的MoE模子训推方案,科大讯飞称,这一冲破性的处理方案也将使用于讯飞星火深度推理模子的锻炼加快,预期锻炼时推理效率将提拔200%。同时,基于该方案的推理引擎也实现了国产算力上DeepSeek-V3和R1的高效推理。科大讯飞“星火”验证了国产算力的可行性,蚂蚁“Ling系列”则进一步证明其规模化和经济性。跟着阿里、华为等巨头加码,中国AI财产正从“单点冲破”转向“生态协同”。这场算力平权活动,或将成为全球AI竞赛的新变量。 |