标签:双通道音频
ICLR 2025 Spotlight:港科北邮团队利用文本控制音频技术实现空间音频生成新突破,基于BEWO-1M数据集优化双通道音频与ITD参数
ICLR 2025 Spotlight:音频生成新突破!港科大北邮团队首次通过文本控制声源方向生成音频 在影视娱乐、AR/VR等领域,通过文本控制生成多通道音频具有重要应用。香港科技大学和北京邮电大学的研究团队首次实现了这一技术突破,使生成的音频不仅符合物理世界规律,还能通过文本精确控制声源方向。 空间音频生成的重要性 人类天生具备双耳感知声音方向的能力,这种能力使得我们在日常生活中能够准确判断周围环境的声音来源。生物声学(Bioacoustics)早在20世纪就对此进行了深入研究。人耳通过以下三种方式感知声音方位: ...