“猕猴桃难题难倒多款顶尖AI模型”

2 11 月 2024

“猕猴桃难题难倒多款顶尖AI模型”

11月2日，据《洛杉矶时报》报道，苹果公司的研究团队对20个顶尖AI模型进行了测试，结果显示，当问题中存在干扰因素时，这些AI在处理简单的算术问题时表现不佳，甚至不及小学生。此次测试中，苹果公司设计了一道简单的算术题目：Oliver在星期五摘了44个猕猴桃，星期六又摘了58个，而星期日的摘取数量是星期五的两倍，但其中有5个猕猴桃个头较小。题目要求计算Oliver三天共摘了多少个猕猴桃。正确答案为190个，计算方式为44（星期五）+58（星期六）+88（星期日，44的两倍）。然而，在测试中，超过20个最先进的AI模型都无法正确排除干扰项，普遍得出185个的错误答案。苹果团队指出，当问题中包含看似相关但实际上无关的信息时，AI模型的表现会大幅下降。

这项研究表明，AI模型主要依赖训练数据中的语言模式，而非真正理解数学概念。苹果的研究表明，当前的AI模型“无法进行真正的逻辑推理”。这一发现提醒我们，尽管AI在特定任务上表现出色，但其智能水平并不像表面上看起来那样可靠。

苹果团队强调，仅仅通过扩展数据或提高计算能力并不能从根本上解决这个问题。他们的论文并非旨在降低对AI能力的信心，而是希望通过提供理性的认知，推动人们对AI技术的深入理解和评估。

分秒AI研究院

分秒AI研究院

“猕猴桃难题难倒多款顶尖AI模型”

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

“猕猴桃难题难倒多款顶尖AI模型”

“猕猴桃难题难倒多款顶尖AI模型”

分秒AI

发表回复 取消回复

发表回复取消回复