加载中 . . .
中文标题 作者 论文ID 分类简称 发布时间
流行音乐中的调制图表 Jason I. Brown and Ian George 2306.13691 cs.SD 2023-06-27
从音乐的多模态特性和流派相关性角度改进音乐流派分类 Ganghui Ru, Xulong Zhang, Jianzong Wang, Ning Cheng, Jing Xiao 2303.07667 cs.SD 2023-06-13
普通话-英语混合语音识别的语言特定声学边界学习 Zhiyun Fan, Linhao Dong, Chen Shen, Zhenlin Liang, Jun Zhang, Lu Lu, Zejun Ma 2306.05279 cs.SD 2023-06-09
学习本地到全局特征聚合用于语音情感识别 Cheng Lu, Hailun Lian, Wenming Zheng, Yuan Zong, Yan Zhao, Sunan Li 2306.01491 cs.SD 2023-06-05
HSD:一种分层歌唱注释数据集 Xiao Fu, Xin Yuan, Jinglu Hu 2209.15640 cs.SD 2022-10-03
微软公司参与2022年VoxCeleb发言人识别挑战的系统 Gang Liu, Tianyan Zhou, Yong Zhao, Yu Wu, Zhuo Chen, Yao Qian, Jian Wu 2209.11266 cs.SD 2022-09-26
检测真实音频录音中的合成语音篡改 Md Hafizur Rahman, Martin Graciarena, Diego Castan, Chris Cobo-Kroenke, Mitchell McLaren and Aaron Lawson 2209.07498 cs.SD 2022-09-16
自适应混合语音编码及MLP LPC结构 Marcos Faundez-Zanuy 2204.00245 cs.SD 2022-04-04
视觉文本转语音 Yoshifumi Nakano, Takaaki Saeki, Shinnosuke Takamichi, Katsuhito Sudoh, Hiroshi Saruwatari 2203.14725 cs.SD 2022-03-29
在未知条件下分析语言无关的说话人匿名化框架 Xiaoxiao Miao, Xin Wang, Erica Cooper, Junichi Yamagishi, Natalia Tomashenko 2203.14834 cs.SD 2022-03-29
midiVERTO:实时可视化音调的Web应用程序 Daniel Harasim, Giovanni Affatato and Fabian C. Moss 2203.13158 cs.SD 2022-03-25
日常家庭环境中使用可穿戴感应器自动检测前景语音:一种迁移学习方法 Dawei Liang, Zifan Xu, Yinuo Chen, Rebecca Adaimi, David Harwath, Edison Thomaz 2203.11294 cs.SD 2022-03-23
一种面向最大信号干扰比的新型盲源分离框架 Jianju Gu, Longbiao Cheng, Dingding Yao, Junfeng Li and Yonghong Yan 2110.03272 cs.SD 2022-03-09
基于场景语义上下文的声音事件检测 Noriyuki Tonami, Keisuke Imoto, Ryotaro Nagase, Yuki Okamoto, Takahiro Fukumori, Yoichi Yamashita 2110.03243 cs.SD 2022-02-18
可解释的呼吸音分析的原型学习 Zhao Ren, Thanh Tam Nguyen, Wolfgang Nejdl 2110.03536 cs.SD 2022-02-08
MLP歌手:迈向快速并行的韩语歌声合成 Jaesung Tae, Hyeongju Kim, Younggun Lee 2106.07886 cs.SD 2021-11-23
通过音高差指法匹配模型估计可弹奏的钢琴指法 Haoyue Zhao and Xin Guan and Qiang Li 2108.09058 cs.SD 2021-08-23
SpecMix:一种用于训练时频域特征的混合样本数据增强方法 Gwantae Kim, David K. Han, Hanseok Ko 2108.03020 cs.SD 2021-08-09
EIHW-GLAM深度关注的多模型融合系统用于DiCOVA 2021挑战中基于咳嗽的COVID-19识别 Zhao Ren, Yi Chang, Bj"orn W. Schuller 2108.03041 cs.SD 2021-08-09
基于超声静默语音界面的神经说话者嵌入 Amin Honarmandi Shandiz, L''aszl''o T''oth, G''abor Gosztolya, Alexandra Mark''o, Tam''as G''abor Csap''o 2106.04552 cs.SD 2021-06-14
宝莱坞音乐中的拉格曲:通过多重分形交叉相关方法的微观视角 Shankha Sanyal, Archi Banerjee, Souparno Roy, Sayan Nag, Ranjan Sengupta and Dipak Ghosh 1604.02243 cs.SD 2021-05-27
印度斯坦古典音乐中一个特定Gharana唱法的变化:非线性多分形研究 Archi Banerjee, Shankha Sanyal, Ranjan Sengupta and Dipak Ghosh 1604.02250 cs.SD 2021-05-27
用基于音素级混合密度网络的丰富韵律多样性建模 Chenpeng Du and Kai Yu 2102.00851 cs.SD 2021-05-25
基于历史支持的变分递归自编码器的音乐生成 Ivan P. Yamshchikov and Alexey Tikhonov 1705.05458 cs.SD 2021-05-21
走向智慧城市的公民科学:一种基于声音互联网实践的鸟鸣识别协作游戏框架 Emmanuel Rovithis and Nikolaos Moustakas and Konstantinos Vogklis and Konstantinos Drossos and Andreas Floros 2103.16988 cs.SD 2021-04-01