“Pixtral Large模型领先GPT-4,多模态推理突破!”
11月19日,知名人工智能公司Mistral AI公布了一项重要进展,推出全新的多模态AI模型——Pixtral Large。该模型参数量高达1240亿,是基于Mistral Large 2的升级版,专注于处理文本与图片数据。目前,Pixtral Large已向公众开放,可供研究、教育以及商业领域使用。
Mistral AI在官方公告中表示,Pixtral Large是公司多模态模型系列中的又一力作。据悉,该模型在多个标准多模态基准测试中均取得了优异成绩,特别是在MathVista测试中,其准确率高达69.4%,领先所有竞争对手。在ChartQA和DocVQA测试中,Pixtral Large同样表现出色,超越了GPT-4o和Gemini-1.5 Pro。
Pixtral Large采用了123B的多模态解码器和1B的视觉编码器,支持高达128K的上下文窗口,能够处理至少30张高分辨率图像。除了在视觉数据处理上的卓越表现,该模型在复杂推理和图表理解方面也具备显著优势。
据悉,Pixtral Large目前已通过Mistral研究许可证和商业许可证两种形式提供,旨在为不同领域的用户带来更高效、便捷的人工智能解决方案。