标签:语音生成模型
Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia公司最近推出了其创新产品——Sonic,一款具有超低延迟的语音生成模型,引起了业界的广泛关注。Sonic模型的延迟时间仅为135毫秒,能够迅速生成具有丰富情感和表达力的语音。只需10秒钟的录音,它就能精确模仿说话者的语音特色,包括韵律、语调和声音特质。此外,Sonic允许用户调整音调、速度、情感等参数,以适应各种应用场景。 Sonic的特点在于它的超低延迟性能,使其成为实时聊天应用的理想选择。同时,它能够传达人类的情感,使对话更加生动自然。Cartesia通过引入“状态空间模型”(SSM)架构,解决了实时智能系统...