Meta开源轻量级AI模型：MobileLLM系列助手机应用

8 11 月 2024

Meta开源轻量级AI模型：MobileLLM系列助手机应用

11月8日，科技巨头Meta宣布，其研发的智能手机专用小语言模型MobileLLM家族现已正式开源，并新增了600M、1B和1.5B三种不同参数版本的模型。IT之家为您附上项目GitHub链接，方便您了解相关信息（点击访问）。

据悉，MobileLLM模型家族的设计理念是将人工智能的强大功能带入智能手机，实现高效与性能的平衡。该模型采用精简架构，并引入了“SwiGLU激活函数”和“分组查询注意力”机制，有效提升了运行效率。Meta研究团队透露，在配备32颗Nvidia A100 80G GPU的服务器上，他们仅用了18天时间便完成了1.5B参数量模型的训练，而125M版本的模型仅需3天即可完成。

训练成果方面，MobileLLM的125M和350M版本在零样本常识理解任务上的准确率分别领先Cerebras、OPT、BLOOM等SOTA模型2.7%和4.3%。此外，当将MobileLLM-1.5B与其他参数量更大的模型进行对比时，其表现同样出色，领先于GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B等众多模型。这一成果再次证明了Meta在人工智能领域的创新能力与实力。

分秒AI研究院

分秒AI研究院

Meta开源轻量级AI模型：MobileLLM系列助手机应用

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

Meta开源轻量级AI模型：MobileLLM系列助手机应用

Meta开源轻量级AI模型：MobileLLM系列助手机应用

分秒AI

发表回复 取消回复

发表回复取消回复