10月2日,OpenAI正式推出了实时API公开测试版,这项技术主要用于构建基于GPT-4模型的语音到语音的人工智能应用程序及智能体。所有付费用户可以在他们的应用程序中创建低延迟、多模式的实时互动体验。与此同时,OpenAI宣布了三家合作的语音API伙伴:LiveKit、Agora以及Twilio。
值得注意的是,Agora与声网原本同属一家公司,但在今年5月份进行了拆分。现在,声网主要关注中国市场,并将总部设在中国上海;而Agora则专注于美国和国际市场的开发,其总部位于美国加利福尼亚州的圣克拉拉市。根据Agora官方网站的消息,他们已经推出了适用于OpenAI的会话式AI软件开发工具包(SDK),该SDK整合了OpenAI最新的实时API技术,使得人们可以直接通过语音与人工智能进行自然流畅的交流,而非通过传统的文本转换方式。这种超低延迟的技术让真实的对话成为可能,并帮助人工智能更好地理解和回应人类的情绪变化。
显然,实时API的推出标志着OpenAI在人工智能应用领域的又一重大突破。相较于以往需要多个模型协同工作的模式,新的实时API大大减少了语音交互的延迟时间,从而实现了更加贴近真实人与人之间的情感交流,提供了更为自然流畅的对话体验。
本文来源: TechWeb.com.cn【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...