嘈杂车内的自适应多类音频分类-arXiv论文预印本中文版

嘈杂车内的自适应多类音频分类

摘要：汽车上安装的电子设备数量不断增加，其复杂性也在增加，因此音频分类对于汽车行业越来越重要，作为人机交互的基本工具。然而，现有的音频分类方法不足，因为没有适当地考虑到车辆内环境的独特和动态的音频特征。在本文中，我们开发了一个音频分类系统，能够根据驾驶环境，包括高速公路、道路、拥挤的城市和停车场，将音频流分类为音乐、语音、语音+音乐和噪声。我们收集了超过420分钟的音频数据，包括各种类型的音乐、语音、语音+音乐和噪声，来自各种不同的驾驶环境。结果表明，与我们的实验设置中的非自适应方法相比，所提出的方法提高了平均分类准确率高达166％，对于语音和语音+音乐分别提高了64％。

作者：Myounggyu Won, Haitham Alsaadan, Yongsoon Eun

论文ID：1703.07065

分类：Sound

分类简称：cs.SD

提交时间：2018-04-11

PDF 下载： 英文版中文版pdf翻译中