“我们关心”:提升客户服务对话中的代码混合语音情感识别

摘要:自然语音情感识别(SER)是识别口语表达的情感的任务。情感识别在构建强大的会话代理人在法律、医疗、教育和客户支持等领域至关重要。大多数发表的SER研究使用在无噪声环境下雇佣专业演员创建的数据集。在自然语境中,例如客户关怀对话,音频通常嘈杂,说话者经常在不同的语言之间切换。我们与会话AI领域的领先独角兽合作开发了自然语音情感数据集(NSED)。NSED是一个自然编码混合的语音情感数据集,其中每个对话中的话语都用情感、情绪、价值、唤醒和统治(VAD)值进行标注。在本文中,我们证明通过合并词级VAD值,我们在SER任务中将负面情感的性能提高了2%,超过了NSED的基准值。负面情感的高准确度至关重要,因为表达负面观点/意见的客户需要紧急平息,以免投诉和不满意加剧并变得失控。迅速升级负面意见对于业务利益至关重要。然后,我们的研究可以用于开发在这种情况下更礼貌和富有同理心的会话代理人。

作者:N V S Abhishek, Pushpak Bhattacharyya

论文ID:2308.03150

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-08

PDF 下载: 英文版 中文版pdf翻译中