NIST SRE 2016的LIA系统描述

摘要:LIA说话人识别系统在演讲者识别评估(SRE)运动中进行了开发。该系统基于最先进的方法,开发了八个子系统,其中都采用了主流技术:i-vector/PLDA(无文本自由说话人识别的主要方法)。这些子系统在以下方面有所不同:声学特征提取前端(MFCC,PLP),i-vector提取阶段(UBM、DNN或两种功能的后验概率),以及数据移位(IDVC,平均移位)。提交的系统是在这八个子系统的评分级别上的融合。

作者:Mickael Rouvier, Pierre-Michel Bousquet, Moez Ajili, Waad Ben Kheder, Driss Matrouf, Jean-Franc{c}ois Bonastre

论文ID:1612.05168

分类:Sound

分类简称:cs.SD

提交时间:2016-12-16

PDF 下载: 英文版 中文版pdf翻译中