近期,OpenAI宣布自即日起至9月23日,将为4级、5级用户提供GPT-4o mini的免费微调服务,助力开发者构建定制化的生成式AI应用程序。在此期间,每位用户每天可享受200万tokens的数据量,超出部分将以每10万tokens 3美元的标准收费。从9月24日起,每100万tokens的微调服务费用调整为3美元,这一价格策略极为亲民,几乎相当于无限使用的成本。
开发者反响热烈,价格优势明显
不少开发者已接收到OpenAI的正式通知。有用户指出,即便是在9月24日后,每100万tokens的服务费用定为3美元,这样的定价依然极具竞争力,堪比电话无限套餐的价格。相较于GPT-3.5时期的每100万tokens 8美元,GPT-4o mini的成本几乎减半,同时推理价格也降低了约60%。这种大幅度降价对于竞争对手而言无疑是一次重大挑战。
GPT-4o mini性能出众,性价比极高
有用户分享了使用GPT-4o进行微调的经验,单次花费高达2000美元,与GPT-4o mini形成了鲜明对比。OpenAI此举除了旨在吸引更多用户外,还意在回应Meta最新推出的开源模型Llama3.1系列。尽管某些性能测试显示,在创建聊天机器人、摘要生成及数据提取等方面,GPT-4o mini略逊一筹,但其性价比仍然十分突出。
GPT-4o mini:小参数大作为
GPT-4o mini作为OpenAI上周新发布的轻量化模型,在MMLU、GPQA、DROP、MGSM等多个评测平台上表现出色,性能远超GPT-3.5 Turbo,达到了GPT-4o性能的大约80%。与此同时,该模型的API价格降低了约60%,性价比极高。更重要的是,GPT-4o mini是首个采用指令层级结构的大模型,能够更好地处理不同级别的指令,有效提升安全性与实用性。
指令层级结构增强模型安全性
当前的大模型在处理输入信息时往往难以区分系统消息、用户消息、模型输出和工具输出等多种类型的信息,这可能导致恶意用户通过输入特定提示来干扰模型的行为。为了应对这一问题,GPT-4o mini引入了指令层级结构,确保低优先级指令不会影响到高优先级指令的执行。例如,当模型被设定为金融顾问时,它只会响应与该角色相关的合理请求,而不会被误导执行不符合角色定义的任务。
据OpenAI透露,经过针对GPT-3.5 Turbo的微调实验发现,新的指令层级结构显著提升了模型抵御提示攻击的能力,提高了63%的防御效果,并使模型的鲁棒性增强了30%以上。目前,OpenAI已用GPT-4o mini取代了之前的GPT-3.5 Turbo,为ChatGPT提供更加高效的服务。
本文来源: AIGC开放社区公众号【阅读原文】