AI对弈“猜画”挑战：Claude胜GPT-4o，表现抢眼 – 分秒AI研究院

3 11 月 2024

AI对弈“猜画”挑战：Claude胜GPT-4o，表现抢眼

近期，一场由人工智能模型参与的“你画我猜”游戏在网络上引起了广泛关注。在这场游戏中，包括GPT-4o、Claude、Llama、Gemini、Grok等知名大模型参与其中，人类观众们见证了这些AI的绘画与猜谜能力。

这场游戏的初衷源于Simon Willison的一次测试，他让不同的人工智能模型绘制同一主题的图像，以比较其绘画效果。而Paul Calcraft从中获得了灵感，将这种比较方式升级为一场“你画我猜”的竞赛。在游戏中，模型们需要在短时间内根据对方绘画的内容进行猜测。

经过六轮的激烈角逐，Claude模型以三胜的战绩脱颖而出，成为这场“你画我猜”游戏的佼佼者。然而，GPT-4o的表现却颇为独特，它的第一轮猜测往往是“圆形”，显得有些抽象。

此次游戏的参与模型不仅展现了各自的绘画技能，还揭示了它们在不同主题下的猜谜能力。在简单题目上，如“房子”、“草地”和“海洋”，模型们几乎都能在几个回合内猜中答案。但在更复杂的题目，如“大象”时，它们往往需要经过4-5轮的猜测才能找到正确的答案。

网友们对这场游戏给予了高度评价，认为它不仅趣味十足，还能成为评估大模型能力的新基准。有人甚至调侃说，随着AI的发展，人类或许只能充当“围观者”。

Paul Calcraft表示，未来将继续更新游戏，加入分数显示、更多游戏主题等功能，期待更多的模型参与其中。此次“你画我猜”游戏的成功，也引发了对AI训练新方式的探讨，有网友提出，或许可以通过游戏化学习的方式，提升大模型的智力水平和技能。

尽管此次游戏只进行了6轮，参与模型数量有限，但它无疑是一次有趣的实践，为人工智能领域的研究提供了新的思路。

分秒AI

查看所有文章

发表回复取消回复

要发表评论，您必须先登录。