斯坦福大学与华盛顿大学联合研究:利用1000个AI智能体进行社会实验,预测人类行为的准确率高达85%,数据集开放供进一步分析

斯坦福大学、华盛顿大学与谷歌 DeepMind 联合开发 AI 模拟人类行为

近日,斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究人员共同开发了一款 AI 智能体,该智能体能够在社会实验中逼真地模拟人类行为。这一突破性成果不仅为学术界提供了新的研究工具,还为验证经济学、社会学、组织学和政治科学中的理论提供了可能。

建立 AI 模型的方法

研究团队通过对 1000 多名具有代表性的美国人进行深度访谈,涵盖了不同的年龄、性别、教育背景和政治立场,从而构建了这些 AI 模型。每名受访者接受了长达两小时的访谈,访谈通过 OpenAI 的 Whisper 技术转录成文本。这些详细的访谈记录与 GPT-4 模型相结合,使得 AI 能够模拟受访者的回答。

测试与评估

为了评估 AI 模拟人类行为的能力,研究团队设计了一系列测试,包括《通用社会调查》、大五人格评估以及多项行为经济学实验。测试结果显示,基于访谈数据的 AI 在预测社会调查问题时,准确率高达 85%,显著优于仅依赖人口统计信息的 AI 模型。

实验结果

在五项社会科学实验中,AI 表现出了与人类高度一致的结果,相关系数高达 0.98,显示出其强大的模拟能力。与传统的基于人口统计信息的方法相比,访谈驱动的 AI 在预测不同种族群体和政治观点方面表现出更高的准确性,同时有效减少了人口统计类别之间的偏差。

数据集开放

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub 平台,并设置了两层访问机制。综合性数据对所有研究人员开放,而个别参与者的详细数据则需要经过特殊审批。这为未来的研究提供了丰富的资源和支持。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...