标签:第四代音频生成

中国首个喜马拉雅音频大模型通过备案:探索第四代音频生成技术,实现多情感演绎与超自然表达的珠峰AI里程碑

近日,上海网信办公布了最新一批通过备案的生成式大模型名单,喜马拉雅音频大模型与米哈游、阅文集团的筑梦岛等文本大模型一同入选,成为全国首个通过网信办备案的音频生成类大模型。这一消息标志着喜马拉雅音频大模型在全球范围内首次实现了第四代多情感演绎、超自然表达的技术突破。 喜马拉雅音频大模型是珠峰AI团队自主研发的成果,采用了先进的文本音频联合建模框架。通过在同一空间向量表征下实现音频与文本的联合建模训练,模型能够更准确地理解和处理音频与文本之间的关系,从而大幅提升了模型的性能和泛化能力。这...