AI对弈“猜画”挑战:Claude胜GPT-4o,表现抢眼

近期,一场由人工智能模型参与的“你画我猜”游戏在网络上引起了广泛关注。在这场游戏中,包括GPT-4o、Claude、Llama、Gemini、Grok等知名大模型参与其中,人类观众们见证了这些AI的绘画与猜谜能力。

这场游戏的初衷源于Simon Willison的一次测试,他让不同的人工智能模型绘制同一主题的图像,以比较其绘画效果。而Paul Calcraft从中获得了灵感,将这种比较方式升级为一场“你画我猜”的竞赛。在游戏中,模型们需要在短时间内根据对方绘画的内容进行猜测。

经过六轮的激烈角逐,Claude模型以三胜的战绩脱颖而出,成为这场“你画我猜”游戏的佼佼者。然而,GPT-4o的表现却颇为独特,它的第一轮猜测往往是“圆形”,显得有些抽象。

此次游戏的参与模型不仅展现了各自的绘画技能,还揭示了它们在不同主题下的猜谜能力。在简单题目上,如“房子”、“草地”和“海洋”,模型们几乎都能在几个回合内猜中答案。但在更复杂的题目,如“大象”时,它们往往需要经过4-5轮的猜测才能找到正确的答案。

网友们对这场游戏给予了高度评价,认为它不仅趣味十足,还能成为评估大模型能力的新基准。有人甚至调侃说,随着AI的发展,人类或许只能充当“围观者”。

Paul Calcraft表示,未来将继续更新游戏,加入分数显示、更多游戏主题等功能,期待更多的模型参与其中。此次“你画我猜”游戏的成功,也引发了对AI训练新方式的探讨,有网友提出,或许可以通过游戏化学习的方式,提升大模型的智力水平和技能。

尽管此次游戏只进行了6轮,参与模型数量有限,但它无疑是一次有趣的实践,为人工智能领域的研究提供了新的思路。

发表回复