小钢炮 MiniCPM-S AI 模型:高效低耗
近日,在2024世界人工智能大会上,我国知名的人工智能公司面壁智能联合创始人、首席科学家刘知远宣布,该公司的全新一代“面壁小钢炮”MiniCPM-S模型已正式开源,同时还发布了助力开发者一键打造大模型SuperApp的全栈工具集MobileCPM。据了解,面壁公司在2024年发布的具有GPT-3同等性能但参数仅为24亿的新一代MiniCPM-2.4B,其知识密度比之前的模型提高了约86倍。
值得一提的是,面壁公司并没有止步于此。他们持续优化Scaling Law,以使模型知识密度不断提高,从而训练出计算更加高效、表现更强的基础大模型。而这次开源的MiniCPM-S采用“稀疏激活”技术,在同等参数下减少了大模型的推理能耗。这种技术的运用使得大模型的推理成本和能耗大幅降低。
与同规模的稠密模型MiniCPM 1.2B相比,MiniCPM-S 1.2在稀疏度和节能方面的优势尤为明显。在FFN层,它的平均稀疏度达到了87.89%,推理算力下降了84%。在大模型推理速度方面,它也在纯CPU环境下取得了显著的提升,约为2.8倍。
此外,面壁公司还首次对外公开了业内首个端侧大模型工具集MobileCPM。开发者只需一键集成大模型到App,即可实现“开箱即用”。MobileCPM目前支持iOS系统,安卓版本也即将上线。
总的来说,面壁智能公司在人工智能领域的研究和应用取得了重要突破,为我国人工智能产业的发展做出了积极贡献。