UCSD 宣布 GPT-4 通过图灵测试,人类判断准确率高达 54%
人工智能助手通过图灵测试,揭示人类难以区分真实与虚假
一项由加州大学圣地亚哥分校(UCSD)的研究团队进行的新研究表明,最新的人工智能助手GPT-4已经达到了图灵测试的标准。研究人员招募了500名志愿者,让他们与不同的人工智能助手进行5分钟的交谈,然后判断哪一个是人类。结果,54%的情况下,志愿者无法将GPT-4与其他人工智能助手区分开来。这一结果打破了以往人们对人工智能助手智能程度的质疑。
图灵测试是一种衡量人工智能智能水平的方法,其标准是让一位人类评审员通过与人工智能助手的对话,判断哪位是真正的人类,哪位是人工智能助手。然而,尽管经过了74年的研究和尝试,却鲜有人工智能助手能通过图灵测试。此次UCSD团队的实验,首次实现了受控图灵测试,即在严格控制的环境下进行的图灵测试。
在这项实验中,研究人员使用了三种人工智能助手,分别是GPT-4、GPT-3.5和ELIZA。结果显示,GPT-4的通过率达到了54%,高于GPT-3.5(50%)和ELIZA(22%),但低于人类评审员(67%)。
虽然GPT-4的表现令人惊讶,但仍有一些人对这种测试的有效性和公正性提出质疑。例如,GPT-4的知识储备过于丰富,或者掌握的语言太多,这可能会使人类评审员更容易区分它们。然而,研究人员表示,他们在实验过程中已经注意到这个问题,并在一定程度上解决了它。
总的来说,这项实验的结果揭示了人类在识别人工智能助手方面面临的挑战,同时也展示了人工智能助手在某些方面的智能水平已经达到了让人类难以区分真实与虚假的程度。