怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

ChatGPT API 的系统提示功能让开发者能更精细地控制语言模型的输出,比如设置特殊规则和限制。与用户提示相比,系统提示能产生更有趣的效果,如“给小费”实验。数据科学家 Max Woolf 发现,给 ChatGPT 提供小费后,它的响应质量似乎有所提升,能按照要求生成更多表情符号。然而,关于小费是否真的改善输出质量,存在争议,因为文本生成的主观性使得验证困难。

Max Woolf 使用统计方法探讨了这一问题,提出了“高尔夫生成”测试,即指定生成固定长度的文本,以观察模型的适应性。实验结果显示,添加字符长度限制后,ChatGPT 能遵守规则,但分布不均匀。他还测试了不同金额的小费,发现500美元和100,000美元的小费似乎产生了更正常分布的输出。

此外,研究还探索了非金钱激励,如“世界和平”、“母亲的骄傲”,发现“世界和平”激励效果最佳。负向激励如罚款也有影响,其中“死亡”的威胁最能促使 ChatGPT 遵守限制。然而,大部分实验结果的统计显著性不足,表明激励对输出质量的影响尚不明确。

尽管如此,这项研究揭示了与 ChatGPT 交互的新策略,并提醒我们,即使看似荒谬的激励也可能在AI世界中发挥作用。随着AI竞赛加剧,创新和非传统的激励机制可能会成为竞争优势。完整实验数据和代码可在相关GitHub仓库中找到。

本文来源: ​机器之心公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...