同频道语音中基于修改群延迟的多音高估计-arXiv论文预印本中文版

同频道语音中基于修改群延迟的多音高估计

摘要：使用修正的群延迟函数进行多音高估计使用群延迟处理替代了相位处理从语音中提取源和系统参数。当传递函数在z域中的零点接近单位圆时，群延迟函数的行为是不规则的。修正的群延迟函数解决了这个问题，并且已成功应用于共振峰和单音高估计。本文中，我们使用修正的群延迟函数进行并行语音中的多音高估计。首先对语音的功率谱进行了平坦化，以消除系统特性，同时保留源特性。在这个平坦化的谱图上进行群延迟分析，第一次通过选择出主要音高，然后使用组合滤波器滤除估计的音高及其谐波。接着再次分析剩余谱图以获得下一个候选音高的估计。通过音高分组和后处理技术形成了语音断句的最终音高轨迹。使用两个指标（音高准确性和细音高误差的标准偏差）在标准数据集上评估了所提出算法的性能。结果表明，所提出的算法是一种有前景的多音高环境中实际语音录音的音高检测方法。

作者：Rajeev Rajan and Hema A. Murthy

论文ID：1603.05435

分类：Sound

分类简称：cs.SD

提交时间：2016-03-18

PDF 下载： 英文版中文版pdf翻译中