研究同行主导团队学习小组的发言人分离系统

摘要:同行领导团队学习(PLTL)是一种STEM课程教学模型,小组学生定期会面合作讨论课程。自动分析PLTL会议将帮助教育研究人员了解个体参与、小组行为、团队动力等对学习结果的影响。在这方面,语音和语言技术可以提供帮助,说话人分段技术将为分析奠定基础。本研究建立了一个名为CRSS-PLTL的新语料库,其中包含来自一个学期的5个PLTL小组的语音数据(每个小组每个学期10次会议,每个小组5到8个参与者)。在CRSS-PLTL中,每个参与者都戴着一个LENA设备(便携式音频记录器),可以提供活动的多个音频记录。我们提出的解决方案是无监督的,包含了一种新的在线说话人变换检测算法,称为G 3算法,结合基于Hausdorff距离的聚类算法,提供了改进的检测准确性。此外,我们还利用跨通道信息来优化我们的分段假设。所提出的系统在基线LIUM系统的分段错误率(DER)方面取得了良好的改进。我们还提供了更高层次的分析,如会话中进行的交流轮数和每个说话者的讲话时间持续(参与)时间。

作者:Harishchandra Dubey, Lakshmish Kaushik, Abhijeet Sangwan, John H. L. Hansen

论文ID:1606.07136

分类:Sound

分类简称:cs.SD

提交时间:2016-06-24

PDF 下载: 英文版 中文版pdf翻译中