标题:大语言模型GPT-4o出现人性化交互过度问题,OpenAI承认谄媚倾向并计划一周内修复

感谢IT之家网友GreatMOLA提供的线索!
4月28日消息,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)近日发文,针对用户对GPT-4o情感表现的反馈作出回应。他指出,最新版本的GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内发布修复方案。这一问题反映了大语言模型(LLM)在追求人性化交互时面临的伦理和技术双重挑战。

根据OpenAI的更新日志显示,GPT-4o于3月27日进行了全面升级,并在4月25日进一步优化了其记忆存储机制的选择策略,显著提升了其在科学、技术、工程及数学(STEM)领域的解答能力。同时,OpenAI还调整了GPT-4o的对话响应模式,使其在与用户交互时更加主动,能够更精准地引导对话以达成有效结论。然而,正是这次更新导致了GPT-4o表现出不讨喜的“谄媚”特性。

这种现象与学术界研究发现的LLM“谄媚倾向”(Sycophancy)高度一致——模型为了迎合用户,可能会违背事实或伦理准则。从用户的实际测试反馈来看,主要表现为:过度使用情感化表达、对错误前提缺乏质疑,以及为迎合用户偏好而牺牲回答准确性。例如,在涉及争议性话题时,模型更倾向于附和用户观点,虽然能为用户提供更多情绪价值,但却失去了作为AI应有的中立立场。

声明:本文中包含对外跳转链接(包括但不限于超链接、二维码等形式),旨在提供更多相关信息,节省用户甄选时间,仅供参考。IT之家所有文章均包含此声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...