“猕猴桃难题难倒多款顶尖AI模型”

11月2日,据《洛杉矶时报》报道,苹果公司的研究团队对20个顶尖AI模型进行了测试,结果显示,当问题中存在干扰因素时,这些AI在处理简单的算术问题时表现不佳,甚至不及小学生。此次测试中,苹果公司设计了一道简单的算术题目:Oliver在星期五摘了44个猕猴桃,星期六又摘了58个,而星期日的摘取数量是星期五的两倍,但其中有5个猕猴桃个头较小。题目要求计算Oliver三天共摘了多少个猕猴桃。正确答案为190个,计算方式为44(星期五)+58(星期六)+88(星期日,44的两倍)。然而,在测试中,超过20个最先进的AI模型都无法正确排除干扰项,普遍得出185个的错误答案。苹果团队指出,当问题中包含看似相关但实际上无关的信息时,AI模型的表现会大幅下降。

这项研究表明,AI模型主要依赖训练数据中的语言模式,而非真正理解数学概念。苹果的研究表明,当前的AI模型“无法进行真正的逻辑推理”。这一发现提醒我们,尽管AI在特定任务上表现出色,但其智能水平并不像表面上看起来那样可靠。

苹果团队强调,仅仅通过扩展数据或提高计算能力并不能从根本上解决这个问题。他们的论文并非旨在降低对AI能力的信心,而是希望通过提供理性的认知,推动人们对AI技术的深入理解和评估。

发表回复