标签：实时API

重磅更新！OpenAI开放高效O1模型API，成本直降60%，助力WebRTC与实时API开发者优化偏好微调

今天凌晨2点，OpenAI开启了第9天的技术分享直播，正式发布了O1模型的API，并对实时API进行了重大升级，支持WebRTC技术。新版O1模型API相比之前的预览版，思考成本降低了60%，并新增了高级视觉功能；GPT-4O的音频处理成本也降低了60%，而迷你版本的价格更是下降了10倍。同时，OpenAI还推出了一种全新的偏好微调方法，通过直接偏好优化算法，使大模型能够更好地理解和适应用户的偏好风格。此次发布的O1模型API集成了多项新功能，包括函数调用、结构化输出、开发者消息以及推理工作量调整。函数调用功能允许模型根据输入数据...

来源：

AIGC开放社区公众号【阅读原文】
Tags：O1模型API WebRTC 偏好微调实时API 开发者消息

3个月前

OpenAI发布GPT-4实时API公测版，Agora等三家语音交互合作伙伴正式揭晓

10月2日，OpenAI正式推出了实时API公开测试版，这项技术主要用于构建基于GPT-4模型的语音到语音的人工智能应用程序及智能体。所有付费用户可以在他们的应用程序中创建低延迟、多模式的实时互动体验。与此同时，OpenAI宣布了三家合作的语音API伙伴：LiveKit、Agora以及Twilio。值得注意的是，Agora与声网原本同属一家公司，但在今年5月份进行了拆分。现在，声网主要关注中国市场，并将总部设在中国上海；而Agora则专注于美国和国际市场的开发，其总部位于美国加利福尼亚州的圣克拉拉市。根据Agora官方网站的消息，他们已经...

来源：

TechWeb.com.cn【阅读原文】
Tags：Agora GPT-4 OpenAI 实时API 语音交互

6个月前

OpenAI开发者大会揭晓四大革新：实时API与视觉微调引领未来，提示词缓存技术降低50%输入token成本

10月2日的消息显示，OpenAI于美东时间10月1日在年度开发者大会DevDay上发布了一系列创新工具。这些新工具包括实时API、视觉微调、提示词缓存及模型蒸馏四大亮点，旨在帮助开发者降低模型成本、提升视觉理解能力和语音AI功能，并改善小模型的性能。实时API（Realtime API）在OpenAI DevDay大会上推出的实时API正处于公开测试的beta阶段。这一API能够构建低延迟、多模式对话体验，支持文本和音频作为输入与输出，并具备函数调用功能。音频功能由GPT-4o模型“gpt-4o-realtime-preview”支持，允许开发人员将任何文本或音频输...

来源：

TechWeb.com.cn【阅读原文】
Tags：OpenAI 实时API 提示词缓存模型蒸馏视觉微调

6个月前