10秒钟复刻AI付航脱口秀吐槽,F5-TTS打造LPL最佳TTS声音克隆体验

上周末,我追了两个月的脱口秀,终于迎来了总决赛。周六晚上,我一边观看《英雄联盟》S14总决赛,一边关注《喜剧之王单口季》,真是体验了一把心情的过山车。一边是拉胯的表现,另一边则是稳如泰山。好在脱口秀方面,我一直喜欢的演员付航不负众望,夺得了总冠军。他在决赛中的表现充满激情,段子和表演都非常精彩,让人笑中带泪。付航的表演纯粹而直接,不需要深思熟虑,看完就想笑,笑完还想再看,好笑本身就是最大的价值。

当我看到付航夺冠时,我笑得合不拢嘴。然而,一转头看到LPL的比赛,瞬间失去了所有的动力。TES以0:3的比分被对手彻底击败,场面十分尴尬。当晚,知乎和微博上全是观众的吐槽和崩溃,逛超话都能笑出声。那一刻,我突发奇想:如果能请付航来狠狠吐槽TES,那该多完美!可惜,我买不到付航的线下演出票,也不认识他。但幸运的是,我有AI可以帮忙。

于是我决定用F5-TTS这个开源工具,克隆付航的声音,让他成为我的“嘴替”。F5-TTS只需要15秒就能克隆任何声音,并且完全免费,本地即可运行。使用也非常简单,你可以轻松生成自己想要的语音。为了方便大家使用,我们还准备了一个整合包,包含所有必要的模型和环境配置,大家只需一键部署即可使用。你只需在公众号后台回复“F5”,即可获取下载链接。

下载并解压压缩包后,运行“一键运行.bat”文件,终端会自动弹出一个链接。点击链接进入F5的界面,上传一段15秒以内的参考音频,输入你想要生成的文字,选择F5-TTS模型,点击合成,即可生成语音。我用了一段付航在《喜剧之王》中的12秒音频,生成了一段付航称赞某篇文章的语音,效果非常逼真。

为了生成更有趣的文本,我还尝试了用Claude来写脱口秀段子。尽管我多次尝试,Claude仍然无法完全捕捉到付航的风格。于是,我转向了知乎上的文章,写了一段直接吐槽TES的段子,效果出奇地好。最终,我将这段文字分段输入F5-TTS,生成了AI付航吐槽TES的音频。音色和停顿都非常接近付航本人,虽然表演和情绪还不及真人,但已经非常令人满意。

F5-TTS支持中英文,但不支持数字,需要将数字转换成中文才能正常识别。例如,“369”需要转换成“三六九”。

有人认为,脱口秀是现代的“精神布洛芬”,我深以为然。现代人压力大,谁愿意在忙碌一天后,还要面对生硬的价值观灌输?喜剧的本质就是让人开心。因此,我更欣赏付航这样的演员,也更喜欢脱口秀这种形式。虽然TES在比赛中表现不佳,但能为大家提供一个吐槽的机会,也是一种情绪释放。比赛结果如何,都是常事。我们不妨放松心态,享受其中。希望LPL能在S14决赛中表现出色,让我们一起喊出:“我们是冠军!”生活,还是要充满热情!

本文来源: 数字生命卡兹克公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...