标签：基准评测

Llama3比GPT-4o更爱说谎，首个大模型“诚实性”评估基准来了 | 上海交大

上海交通大学的生成式人工智能实验室（GAIR Lab）发布了一项创新的评估标准——BeHonest，用于全面衡量大语言模型的诚实性，从而促进安全透明的AI研发。在AI快速发展的时代，大模型的诚实性成为了一个至关重要的问题。不诚实的AI可能导致信息失真，误导用户，甚至产生安全隐患。BeHonest评估框架从自我认知、非欺骗性和一致性三个方面进行测试，涉及10个具体场景，涵盖了9个主流大模型，如GPT-4o和Llama3-70b。评估结果显示，虽然大多数模型在回答已知问题上表现出色，但它们在承认未知和避免欺骗方面存在缺陷。模型的规模与...

来源：

量子位【阅读原文】 Tags：基准评测超级对齐

9个月前