侵入性仪器可理解度指标的评估
摘要:评估12种单声道侵入性智能可理解度度量标准:SII,HEGP,CSII,HASPI,NCM,QSTI,STOI,ESTOI,MIKNN,SIMI,SIIB和sEPSMcorr。此外,本文研究了智能可理解度度量标准对新类型失真的泛化能力,并分析了性能最高的度量标准为何具有高性能。智能可理解度数据来自文献中描述的11个听力测试。刺激包括通过添加噪声、混响、竞争说话者、预处理增强和后处理增强而失真的荷兰语、丹麦语和英语语音。SIIB和HASPI表现最佳,平均与听力测试得分的相关性为0.92和0.89。SIIB的高性能部分可能是因为SIIB的开发者可以访问评估中考虑的所有智能可理解度数据。结果显示,智能可理解度度量标准在未在其开发期间使用的数据集上表现较差。通过修改SIIB和STOI的原始实现,证明了减少输入特征之间的统计依赖的优势。此外,本文提出了一种名为SIIBGauss的新版本,其计算时间比SIIB和HASPI少两个数量级,但性能类似。
作者:Steven Van Kuyk, W. Bastiaan Kleijn, and Richard C. Hendriks
论文ID:1708.06027
分类:Sound
分类简称:cs.SD
提交时间:2018-07-31