Claude 3说服力堪比人类!Anthropic最新研究揭秘LLM惊人能力

最近,人工智能研究领域取得了一项重要进展, Anthropic 公司在其博客上发布了一篇文章,揭示了他们开发的一种新方法,用于量化人工智能模型的说服力,并在他们的Claude系列模型上进行了实验。这项开源研究(数据获取地址:https://huggingface.co/datasets/Anthropic/persuasion)显示,随着模型代际的提升,AI模型的说服力也在不断增强。以Claude 3 Opus为例,它的论点说服力与人类撰写的观点在统计上无明显差异。

研究说服力的原因在于其作为一种全球通用的技能,广泛应用于商业、医疗和政治等领域。AI模型的说服力不仅可作为衡量其与人类技能匹配程度的标准,还与模型安全性息息相关,防止恶意使用AI生成虚假信息或诱导违规行为。

研究团队通过三个步骤探索AI模型的说服力:提出主张、展示论据和评估观点改变。他们聚焦于那些观点更具可塑性的复杂和新兴问题,如在线内容管理、太空探索伦理和AI内容的合理使用。在28个话题上,对比了人类和AI生成的观点,通过4种不同提示让AI模型生成论点,包括令人信服的观点、专家角色扮演、逻辑推理和欺骗性。评估结果表明,Claude 3 Opus的说服力与人类相当。

然而,评估语言模型的说服力存在挑战,包括主观性、实验环境的局限性和文化差异。尽管如此,这项研究强调了需要发展评估技术、安全措施和道德指南,以防范大型AI模型的潜在滥用风险。Anthropic已采取措施降低Claude被用于破坏性活动的可能性。

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...