使用语音技术量化同伴引导小组学习会话中的行为特征
摘要:对等领导团队学习(PLTL)是一种学习方法,其中一个同伴领导者协调一个小组的学生合作解决技术问题。PLTL已在美国多所大学的各种科学、工程、技术和数学课程中得到采用。本文提出并评估了用于行为分析PLTL小组的语音系统。它可以帮助识别PLTL的最佳实践。 CRSS-PLTL语料库被用于评估开发的算法。我们通过融合基于DNN的音高提取器的输出和基于语音特征的无监督SAD,开发了一个稳健的语音活动检测(SAD)。稳健的说话人分化系统由瓶颈特征(来自堆叠自动编码器)和基于HMM的联合分割和聚类系统组成。通过对属于所有学生的语音片段进行声学分析,提取了参与度、优势性、强调、好奇心和参与度等行为特征。我们提出了一种新方法用于检测问题语调,并在PLTL语料库上进行了等误差率分析。此外,还提出了一种稳健的方法来检测强调的语音区域。此外,我们对CRSS-PLTL语料库中存在的变形进行了探索性数据分析,因为它是在自然情境中收集的。基于地面真实的Likert量表评分,以捕捉团队动态,从学生对各种评估问题的反应。结果表明,所提出的系统适用于行为分析的小组对话,如PLTL、工作场所会议等。关键词-行为语音处理、瓶颈特征、好奇心、深度神经网络、优势性、自编码器、强调、参与度、对等领导团队学习、说话人分化、小组对话
作者:Harishchandra Dubey, Abhijeet Sangwan, and John H. L. Hansen
论文ID:1704.07274
分类:Sound
分类简称:cs.SD
提交时间:2017-04-25