标签:实时API

重磅更新!OpenAI开放高效O1模型API,成本直降60%,助力WebRTC与实时API开发者优化偏好微调

今天凌晨2点,OpenAI开启了第9天的技术分享直播,正式发布了O1模型的API,并对实时API进行了重大升级,支持WebRTC技术。新版O1模型API相比之前的预览版,思考成本降低了60%,并新增了高级视觉功能;GPT-4O的音频处理成本也降低了60%,而迷你版本的价格更是下降了10倍。同时,OpenAI还推出了一种全新的偏好微调方法,通过直接偏好优化算法,使大模型能够更好地理解和适应用户的偏好风格。 此次发布的O1模型API集成了多项新功能,包括函数调用、结构化输出、开发者消息以及推理工作量调整。函数调用功能允许模型根据输入数据...

OpenAI发布GPT-4实时API公测版,Agora等三家语音交互合作伙伴正式揭晓

10月2日,OpenAI正式推出了实时API公开测试版,这项技术主要用于构建基于GPT-4模型的语音到语音的人工智能应用程序及智能体。所有付费用户可以在他们的应用程序中创建低延迟、多模式的实时互动体验。与此同时,OpenAI宣布了三家合作的语音API伙伴:LiveKit、Agora以及Twilio。 值得注意的是,Agora与声网原本同属一家公司,但在今年5月份进行了拆分。现在,声网主要关注中国市场,并将总部设在中国上海;而Agora则专注于美国和国际市场的开发,其总部位于美国加利福尼亚州的圣克拉拉市。根据Agora官方网站的消息,他们已经...

OpenAI开发者大会揭晓四大革新:实时API与视觉微调引领未来,提示词缓存技术降低50%输入token成本

10月2日的消息显示,OpenAI于美东时间10月1日在年度开发者大会DevDay上发布了一系列创新工具。这些新工具包括实时API、视觉微调、提示词缓存及模型蒸馏四大亮点,旨在帮助开发者降低模型成本、提升视觉理解能力和语音AI功能,并改善小模型的性能。 实时API(Realtime API) 在OpenAI DevDay大会上推出的实时API正处于公开测试的beta阶段。这一API能够构建低延迟、多模式对话体验,支持文本和音频作为输入与输出,并具备函数调用功能。音频功能由GPT-4o模型“gpt-4o-realtime-preview”支持,允许开发人员将任何文本或音频输...