标签：弱监督学习

采用多头注意力机制与弱监督学习：全新开源语音模型在效率上超越OpenAI’s Whisper达50% — 探索生成式AI的无限可能

aiOla推出Whisper-Medusa：高效语音模型近日，生成式AI初创公司aiOla在其官方网站上开源了一款名为Whisper-Medusa的新型语音模型。这款模型相较于OpenAI开源的Whisper，在推理效率上实现了高达50%的提升。这一突破性的进展主要得益于aiOla团队对Whisper架构所做的创新性改进，特别是在引入“多头注意力”机制方面的努力。多头注意力机制加速推理过程传统的Transformer架构在生成序列时，采用逐个token的顺序预测方法。这种方法虽然能够保持序列的连贯性和上下文相关性，但却显著降低了模型的推理效率，并且难以有效捕捉...

来源：

AIGC开放社区公众号【阅读原文】
Tags：多头注意力机制弱监督学习效率提升生成式AI 语音识别

8个月前