AI推理新突破:谷歌通用模型领跑Arena LLM榜单
12月20日,据最新消息,谷歌AI Studio近日推出了实验性新模型“Gemini 2.0 Flash Thinking”,该模型旨在清晰展示其推理过程,成为谷歌首个通用推理模型。这一创新模型的诞生,不仅能够解决复杂问题,还能模拟人类逐步推理的方式,逐步展示其“思考”的每一步,有望在AI领域引发革新,并与OpenAI的o1推理模型展开竞争。
在演示中,Google DeepMind的首席科学家Jeff Dean展示了该模型如何通过一系列“思考”步骤来解答物理问题。而Google的产品负责人Logan Kilpatrick则展示了模型如何处理包含图像和文本信息的复杂推理问题。
“Gemini 2.0 Flash Thinking”模型是基于Gemini 2.0 Flash的速度和性能构建的。在Chatbot Arena LLM排行榜上,该模型在所有类别中都排名第一,相较于之前的Gemini-2.0-Flash模型,其在“硬提示”和“视觉”两项分别提升了14分和16分。目前,该模型已经正式在Google AI Studio和Vertex AI平台上线。
谷歌表示,这仅仅是推理之旅的第一步,未来这些推理能力有可能被整合到Gemini 2.0系列的主要模型中,为用户带来更加丰富和强大的AI体验。