嘈杂车内的自适应多类音频分类
摘要:汽车上安装的电子设备数量不断增加,其复杂性也在增加,因此音频分类对于汽车行业越来越重要,作为人机交互的基本工具。然而,现有的音频分类方法不足,因为没有适当地考虑到车辆内环境的独特和动态的音频特征。在本文中,我们开发了一个音频分类系统,能够根据驾驶环境,包括高速公路、道路、拥挤的城市和停车场,将音频流分类为音乐、语音、语音+音乐和噪声。我们收集了超过420分钟的音频数据,包括各种类型的音乐、语音、语音+音乐和噪声,来自各种不同的驾驶环境。结果表明,与我们的实验设置中的非自适应方法相比,所提出的方法提高了平均分类准确率高达166%,对于语音和语音+音乐分别提高了64%。
作者:Myounggyu Won, Haitham Alsaadan, Yongsoon Eun
论文ID:1703.07065
分类:Sound
分类简称:cs.SD
提交时间:2018-04-11