微软PHI-3-vision与Claude 3-haiku、Gemini 1.0 Pro齐名

微软发布新一代小语言AI模型:Philippi-3 Vision,具备强大视觉理解能力

近日,微软在Build 2024大会上推出了Philippi-3 Vision,这是其Philippi-3家族的最新成员,主打“视觉能力”。Philippi-3 Vision是一种多模态的小型语言模型(SLM),适用于本地AI场景。据微软发布的论文表明,该模型在多个项目中表现优异,与Claude 3-haiku、Gemini 1.0 Pro等其他模型不相上下。

Philippi-3 Vision参数量达到42亿,上下文长度为128k token,能够在移动平台上实现流畅高效的运行。尽管参数量并不多,但其性能非常出色。微软对Philippi-3 Vision与其他竞品模型进行了对比实验,结果显示,在许多项目中,Philippi-3 Vision的表现优于ScienceQA、MathVista和ChartQA等模型。

目前,微软已将Philippi-3 Vision模型上传至Hugging Face平台,供全球开发者免费使用。这一成果标志着微软在小语言AI领域取得了重要突破,有望推动人工智能技术的发展与应用。

发表回复