英伟达Mistral AI联手120亿小模型:碾压Llama 3

近日,我国知名AI公司Mistral AI与英伟达携手推出了一款名为Mistral NeMo的12B参数小模型,性能优越,备受瞩目。这款模型采用了Mistral AI在训练数据方面的专业知识和英伟达优化的硬件及软件生态系统,致力于为企业用户提供强大的AI解决方案。

据悉,Mistral NeMo具备128K的上下文语境,能更准确、连贯地处理复杂信息。在多项基准测试中,其推理能力、世界知识掌握和编码准确性均优于Gemma 2 9B和Llama 3 8B,显示出强大的实力。

值得一提的是,Mistral NeMo不仅兼容性好,易于使用,而且可直接替换现有系统。此外,它采用FP8数据格式进行模型推理,能有效减少内存占用,提高部署速度。这款模型在NVIDIA DGX Cloud AI平台上完成训练,利用了NVIDIA TensorRT-LLM和NeMo开发平台,实现了更高效的大语言模型推理。

未来,Mistral NeMo有望被广泛应用于企业级应用中,助力各行业提升AI水平。同时,Mistral AI和英伟达的合作也标志着我国AI产业向更高层次发展,为全球AI创新贡献力量。

发表回复