标签:实时API

OpenAI发布GPT-4实时API公测版,Agora等三家语音交互合作伙伴正式揭晓

10月2日,OpenAI正式推出了实时API公开测试版,这项技术主要用于构建基于GPT-4模型的语音到语音的人工智能应用程序及智能体。所有付费用户可以在他们的应用程序中创建低延迟、多模式的实时互动体验。与此同时,OpenAI宣布了三家合作的语音API伙伴:LiveKit、Agora以及Twilio。 值得注意的是,Agora与声网原本同属一家公司,但在今年5月份进行了拆分。现在,声网主要关注中国市场,并将总部设在中国上海;而Agora则专注于美国和国际市场的开发,其总部位于美国加利福尼亚州的圣克拉拉市。根据Agora官方网站的消息,他们已经...

OpenAI开发者大会揭晓四大革新:实时API与视觉微调引领未来,提示词缓存技术降低50%输入token成本

10月2日的消息显示,OpenAI于美东时间10月1日在年度开发者大会DevDay上发布了一系列创新工具。这些新工具包括实时API、视觉微调、提示词缓存及模型蒸馏四大亮点,旨在帮助开发者降低模型成本、提升视觉理解能力和语音AI功能,并改善小模型的性能。 实时API(Realtime API) 在OpenAI DevDay大会上推出的实时API正处于公开测试的beta阶段。这一API能够构建低延迟、多模式对话体验,支持文本和音频作为输入与输出,并具备函数调用功能。音频功能由GPT-4o模型“gpt-4o-realtime-preview”支持,允许开发人员将任何文本或音频输...