检测英国口语国家语料库中的粗略对齐错误
摘要:对转录和音频录音之间对齐准确性进行评估的方法。这些方法已经应用于英国口语国家语料库,该语料库是一个广泛且多样化的自然非脚本言谈的语料库。初步结果显示与人工评级对准准确性有很好的一致性。这些方法还可以指示可能出现对齐问题的位置;这将允许对大型语料库进行高效的手动检查。在分析任何非常大的语料库时,自动检查这些对齐至关重要,因为即使是目前最好的语音对齐系统有时也会出现严重错误。这里描述的方法使用基于语音信号本身的统计信息、评估标签的统计信息以及连接两者的统计信息的混合方法。
作者:Ladan Baghai-Ravary, Sergio Grau, Greg Kochanski
论文ID:1101.1682
分类:Sound
分类简称:cs.SD
提交时间:2011-01-11