标签：语音生成模型

Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

Cartesia公司最近推出了其创新产品——Sonic，一款具有超低延迟的语音生成模型，引起了业界的广泛关注。Sonic模型的延迟时间仅为135毫秒，能够迅速生成具有丰富情感和表达力的语音。只需10秒钟的录音，它就能精确模仿说话者的语音特色，包括韵律、语调和声音特质。此外，Sonic允许用户调整音调、速度、情感等参数，以适应各种应用场景。 Sonic的特点在于它的超低延迟性能，使其成为实时聊天应用的理想选择。同时，它能够传达人类的情感，使对话更加生动自然。Cartesia通过引入“状态空间模型”（SSM）架构，解决了实时智能系统...

来源：

站长之家【阅读原文】
Tags：Cartesia Sonic 实时智能状态空间模型语音生成模型

10个月前