斯坦福大学与华盛顿大学联合研究：利用1000个AI智能体进行社会实验，预测人类行为的准确率高达85%，数据集开放供进一步分析

斯坦福大学、华盛顿大学与谷歌 DeepMind 联合开发 AI 模拟人类行为

近日，斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究人员共同开发了一款 AI 智能体，该智能体能够在社会实验中逼真地模拟人类行为。这一突破性成果不仅为学术界提供了新的研究工具，还为验证经济学、社会学、组织学和政治科学中的理论提供了可能。

建立 AI 模型的方法

研究团队通过对 1000 多名具有代表性的美国人进行深度访谈，涵盖了不同的年龄、性别、教育背景和政治立场，从而构建了这些 AI 模型。每名受访者接受了长达两小时的访谈，访谈通过 OpenAI 的 Whisper 技术转录成文本。这些详细的访谈记录与 GPT-4 模型相结合，使得 AI 能够模拟受访者的回答。

测试与评估

为了评估 AI 模拟人类行为的能力，研究团队设计了一系列测试，包括《通用社会调查》、大五人格评估以及多项行为经济学实验。测试结果显示，基于访谈数据的 AI 在预测社会调查问题时，准确率高达 85%，显著优于仅依赖人口统计信息的 AI 模型。

实验结果

在五项社会科学实验中，AI 表现出了与人类高度一致的结果，相关系数高达 0.98，显示出其强大的模拟能力。与传统的基于人口统计信息的方法相比，访谈驱动的 AI 在预测不同种族群体和政治观点方面表现出更高的准确性，同时有效减少了人口统计类别之间的偏差。

数据集开放

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub 平台，并设置了两层访问机制。综合性数据对所有研究人员开放，而个别参与者的详细数据则需要经过特殊审批。这为未来的研究提供了丰富的资源和支持。

本文来源：