AI智能体预测人类行为,精准率突破85%

据IT之家11月25日报道,近日,斯坦福大学、华盛顿大学与谷歌DeepMind的研究人员共同研发出一种先进的AI智能体,该智能体能在社会实验中高度仿真地复制人类行为。此项研究成果揭示了这类模拟系统在经济学、社会学、组织学和政治科学领域的理论研究中的巨大潜力。

为了构建这些AI智能体模型,研究团队对超过1000名具有广泛代表性的美国民众进行了深入访谈,涵盖了不同年龄、性别、教育背景和政治立场的参与者。通过结合详细的访谈记录与GPT-4o模型,系统在用户提问时能够即时加载访谈数据,并让AI智能体模仿受访者的回答。

值得一提的是,为了生成这些访谈记录,研究团队对每位受访者进行了长达两小时的访谈,并利用OpenAI的Whisper技术将对话转录成文本。随后,研究团队设计了一系列测试,旨在评估AI在预测社会行为方面的能力,包括《通用社会调查》、大五人格评估以及多种行为经济学实验。

测试结果显示,基于访谈数据的AI在预测社会调查(GSS)问题时,准确率达到了惊人的85%,远超仅依靠人口统计信息的AI智能体。在五项社会科学实验中,AI的表现与人类高度一致,相关系数高达0.98,证明了AI在模拟人类行为方面具有极强的能力。

与传统的基于人口统计的方法相比,这种以访谈为基础的AI在处理不同种族群体和政治观点的预测时更加精确,同时也有助于减少人口统计类别之间的偏差。为了便于研究者进一步研究,研究团队已将包含1000个AI模型的完整数据集公开至GitHub,并提供两层访问机制。其中,综合性数据对所有研究人员开放,而个别参与者的详细数据则需经过特别审批。

IT之家将数据集的GitHub地址分享如下:https://github.com/joonspk-research/genagents

发表回复