改进盲目房间声学特性评估的SRMR变体
摘要:在大房间中特别是在大房间中,混响严重影响了语音识别性能和语音可懂度。由于通常无法直接测量房间特性,对于在封闭环境中操作的语音识别和增强算法来说,对混响相关度量值(如混响时间(RT)和直接混响能量比(DRR))进行盲估计可能是有价值的信息。 本研究的目标是评估基于调制谱表示的单声道和多声道语音数据的五个变体的盲估计RT和DRR估计器的性能。这些模型都基于所谓的语音到混响调制能量比(SRMR)的变体。我们表明,这些测量方法在均方根误差(RMSE)和皮尔逊相关性方面胜过了基于声音衰减速率的最大似然估计的先进基准线。与基准线相比,最佳提议测量方法NSRMR\_k在RMSE方面实现了23\%的相对改进,并且在RT预测方面允许相对相关性的改进范围从13%到47%。
作者:M. Senoussaoui, J. F. Santos, T. H. Falk
论文ID:1510.04707
分类:Sound
分类简称:cs.SD
提交时间:2015-10-19