蚂蚁开源万亿参数高性能强化学习权重交换框架Awex

据百灵大模型消息,蚂蚁集团宣布开源万亿参数高性能强化学习权重交换框架Awex。据介绍,今年10月,蚂蚁百灵正式开源了两款万亿参数旗舰模型,包括非思考的Ling-1T和思考模型Ring-1T。其中Ring-1T基于其自研的高性能权重交换框架Awex(Asystem Weight Exchange Framework),实现了在数千卡GPU集群上5-10秒内完成万亿参数级别的权重同步。 [原文链接]

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

邮箱:service@doujiju.com

工作时间:周一至周五,9:30-18:30

微信客服