在办公环境条件下,使用神经遗传混合算法改进文本相关的说话人识别系统

摘要:改进的自动文本相关说话者识别系统的策略在嘈杂的环境中已经被提出。识别过程中采用了神经遗传混合算法和基于倒谱的特征。为了去除源话语中的背景噪声,使用了Wiener滤波器。使用了不同的语音预处理技术,如起始点-终止点检测算法、预强调滤波、帧阻塞和窗函数来处理语音话语。使用了RCC、MFCC、MFCC、MFCC、LPC和LPCC来提取特征。在语音的特征提取后,使用神经遗传混合算法用于学习和识别目的。使用不同技术提取特征来优化识别的性能。根据VALID语音数据库,在封闭集文本相关说话者识别系统中,针对工作室环境和办公环境条件分别实现了100.000%和82.33%的最高说话者识别率。

作者:Md. Rabiul Islam and Md. Fayzur Rahman

论文ID:0909.2363

分类:Sound

分类简称:cs.SD

提交时间:2009-09-15

PDF 下载: 英文版 中文版pdf翻译中