15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

OpenAI近期宣布,它已开始有限度地开放其创新Voice Engine的访问,这是一种能根据15秒语音片段创造合成语音的先进技术。这一举措旨在通过小规模的实操部署,逐步推动产品的成熟和完善,同时在实践中探索Voice Engine在各个行业中的广泛应用。OpenAI已经向几家领先公司,如教育科技领域的Age of Learning、视觉故事平台HeyGen、医疗健康软件制造商Dimagi、人工智能通讯应用开发商Livox和健康系统Lifespan,提供了初步的访问权限。

Age of Learning已经在使用这项技术制作预设的语音旁白,并利用GPT-4生成实时、个性化的学生朗读回复。OpenAI提供的样例展示出Voice Engine的潜力,为用户提供更加丰富和定制化的语音体验。请注意,本文中可能包含的外部链接仅供传递信息和节省查找时间,所有IT之家的文章都包含此免责声明,以保证信息的透明度。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...