30亿参数大模型的国产GPU实践：无问芯穹千卡集群

27 5 月 2024

30亿参数大模型的国产GPU实践：无问芯穹千卡集群

近日，我国本土的全功能GPU制造商摩尔线程（Moore Threads）与无问芯穹（UniQ Cloud）公司携手成功完成了基于国产全功能GPU千卡集群的3B规模大模型“MT-infini-3B”实训。该模型的训练基于摩尔线程的国产全功能GPU MTT S4000千卡集群，以及无问芯穹的AIStudio PaaS平台共同打造。此次训练历时13.2天，始终保持稳定运行，集群训练稳定性高达100%，表明了夸娥千卡智算集群在大模型训练场景下的可靠性。同时，“MT-infini-3B”模型在C-Eval、MMLU、CMMLU等三个测试集上表现出色，实现了性能领先，堪称业内首次在国产GPU芯片上进行的端到端大模型实训案例。

无问芯穹联合创始人兼CEO夏立雪表示，他们正在开发“M种模型”和“N种芯片”之间的“M x N”中间层产品，以实现多种大模型算法在多元化芯片上的高效、统一部署。无问芯穹已与摩尔线程建立深入合作关系，而“MT-infini-3B”这一训练成果标志着国产GPU芯片在大型模型训练领域取得了重要突破。

分秒AI研究院

分秒AI研究院

30亿参数大模型的国产GPU实践：无问芯穹千卡集群

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

30亿参数大模型的国产GPU实践：无问芯穹千卡集群

30亿参数大模型的国产GPU实践：无问芯穹千卡集群

分秒AI

发表回复 取消回复

发表回复取消回复