标签:语音交互

国泰君安分析:AI Agent快速推进,智能终端通过语音交互成为个人助理,AutoGLM与Siri技术引领未来

11月4日,根据国泰君安发布的研究报告,AI Agent技术正在迅速发展并逐步应用于各种智能终端中,显著提升了设备的语音交互能力。AutoGLM通过强化语言和视觉理解能力,实现了在不同应用之间进行跨页面操作的功能,用户无需安装第三方应用程序即可轻松完成日常任务。 荣耀Magic 7系列手机引入了L3级别的AI Agent,支持多种场景下的智能操作,并能够与多个大型模型应用无缝对接。这一创新不仅提升了用户体验,还为智能终端的发展开辟了新的路径。 与此同时,苹果公司也在不断推进AI技术的应用。最新的iOS 18.1系统增加了多项AI...

OpenAI发布GPT-4实时API公测版,Agora等三家语音交互合作伙伴正式揭晓

10月2日,OpenAI正式推出了实时API公开测试版,这项技术主要用于构建基于GPT-4模型的语音到语音的人工智能应用程序及智能体。所有付费用户可以在他们的应用程序中创建低延迟、多模式的实时互动体验。与此同时,OpenAI宣布了三家合作的语音API伙伴:LiveKit、Agora以及Twilio。 值得注意的是,Agora与声网原本同属一家公司,但在今年5月份进行了拆分。现在,声网主要关注中国市场,并将总部设在中国上海;而Agora则专注于美国和国际市场的开发,其总部位于美国加利福尼亚州的圣克拉拉市。根据Agora官方网站的消息,他们已经...

兴高采烈下载了满屏AI助手,我尝鲜了一下就没再打开

随着技术的发展,人工智能(AI)大模型正逐渐普及,使得不懂编程的普通人也能轻松使用。智能手机应用程序商店中涌现出各类“智能助手”产品,如文心一言、通义、Kimi、海螺AI、豆包和元宝等,它们以大模型为基础,整合多种AI功能,提供自然语言处理的服务,包括AI搜索、文档处理、问答、写作和图像生成等。这些助手通过手机APP提供便利,用户可以通过自然语言与之交互,解决日常生活和工作中的问题。 腾讯的“元宝”因其与微信搜一搜的整合,能在时新信息搜索方面表现出色。而信息源的质量对AI的回答质量有很大影响,高质量的内...