谷歌Gemini助力数学能力显著提升:成本降低至1/10,速率飞跃,超越OpenAI预览版!

谷歌Gemini 1.5迎来重大升级,数学能力超越o1预览版

OpenAI宣布《Her》全量开放的同一天,谷歌推出了Gemini 1.5的重大更新。这次更新不仅大幅降低了成本,还提升了处理速度和响应时间。开发者现在可以通过Google AI Studio和Gemini API免费访问新版本,尽管聊天版本还需等待一段时间。

更新细节与性能提升

本次更新包括两个主要型号:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。以下是具体改进

1. 价格调整:对于输入和输出都小于128K的情况,价格下调超过50%。
2. 速率限制提升:速率限制提高了2-3倍。
3. 输出速度加快:输出速度提升了2倍,延迟减少了3倍。
4. 默认过滤器设置更新:新的过滤器设置为可选项,默认不启用。

性能表现

在MMLU-Pro上,性能提高了约7%;在MATH和HiddenMath基准测试中,两种模型的表现提升了约20%,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。此外,在视觉理解和代码生成方面的评估中也有2%-7%的提升。

根据开发者的反馈,新模型采用更简洁的风格,使它们更容易使用并降低成本。对于摘要、问题解答和提取等场景,更新后的模型默认输出长度比之前的模型缩短了5-20%。

价格与速率限制

1. 价格下调:1.5pro输入token降价64%,输出token降价52%,增量缓存token降价64%,将于10月1日起生效。
2. 速率限制提升:1.5 Flash的付费速率限制从1000RPM提升至2000RPM;1.5 Pro速率限制从360RPM提升至1000RPM。

用户测试反馈

多名网友对新版本进行了测试,其中包括音频转录功能。一位用户发现Gemini 1.5 Flash能在50-60秒内转录13分钟的音频,且准确率接近99%。另一位用户测试了其视觉理解能力,结果表明新模型在这方面表现出色。

然而,也有一些用户认为数学基准测试的实际意义有限,因为许多模型的训练数据已经被饱和。尽管如此,谷歌的这次更新仍被视为推动OpenAI发布新模型的一种方式。

结语

谷歌Gemini 1.5的更新不仅提升了数学能力和多模态处理能力,还在价格和速率限制方面做出了显著改进。虽然某些方面仍然无法与o1系列媲美,但这次升级无疑增强了谷歌在人工智能领域的竞争力。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...