声音-arXiv论文预印本中文版

中文标题	作者	论文ID	分类简称	发布时间
流行音乐中的调制图表	Jason I. Brown and Ian George	2306.13691	cs.SD	2023-06-27
从音乐的多模态特性和流派相关性角度改进音乐流派分类	Ganghui Ru, Xulong Zhang, Jianzong Wang, Ning Cheng, Jing Xiao	2303.07667	cs.SD	2023-06-13
普通话-英语混合语音识别的语言特定声学边界学习	Zhiyun Fan, Linhao Dong, Chen Shen, Zhenlin Liang, Jun Zhang, Lu Lu, Zejun Ma	2306.05279	cs.SD	2023-06-09
学习本地到全局特征聚合用于语音情感识别	Cheng Lu, Hailun Lian, Wenming Zheng, Yuan Zong, Yan Zhao, Sunan Li	2306.01491	cs.SD	2023-06-05
HSD：一种分层歌唱注释数据集	Xiao Fu, Xin Yuan, Jinglu Hu	2209.15640	cs.SD	2022-10-03
微软公司参与2022年VoxCeleb发言人识别挑战的系统	Gang Liu, Tianyan Zhou, Yong Zhao, Yu Wu, Zhuo Chen, Yao Qian, Jian Wu	2209.11266	cs.SD	2022-09-26
检测真实音频录音中的合成语音篡改	Md Hafizur Rahman, Martin Graciarena, Diego Castan, Chris Cobo-Kroenke, Mitchell McLaren and Aaron Lawson	2209.07498	cs.SD	2022-09-16
自适应混合语音编码及MLP LPC结构	Marcos Faundez-Zanuy	2204.00245	cs.SD	2022-04-04
视觉文本转语音	Yoshifumi Nakano, Takaaki Saeki, Shinnosuke Takamichi, Katsuhito Sudoh, Hiroshi Saruwatari	2203.14725	cs.SD	2022-03-29
在未知条件下分析语言无关的说话人匿名化框架	Xiaoxiao Miao, Xin Wang, Erica Cooper, Junichi Yamagishi, Natalia Tomashenko	2203.14834	cs.SD	2022-03-29
midiVERTO：实时可视化音调的Web应用程序	Daniel Harasim, Giovanni Affatato and Fabian C. Moss	2203.13158	cs.SD	2022-03-25
日常家庭环境中使用可穿戴感应器自动检测前景语音：一种迁移学习方法	Dawei Liang, Zifan Xu, Yinuo Chen, Rebecca Adaimi, David Harwath, Edison Thomaz	2203.11294	cs.SD	2022-03-23
一种面向最大信号干扰比的新型盲源分离框架	Jianju Gu, Longbiao Cheng, Dingding Yao, Junfeng Li and Yonghong Yan	2110.03272	cs.SD	2022-03-09
基于场景语义上下文的声音事件检测	Noriyuki Tonami, Keisuke Imoto, Ryotaro Nagase, Yuki Okamoto, Takahiro Fukumori, Yoichi Yamashita	2110.03243	cs.SD	2022-02-18
可解释的呼吸音分析的原型学习	Zhao Ren, Thanh Tam Nguyen, Wolfgang Nejdl	2110.03536	cs.SD	2022-02-08
MLP歌手：迈向快速并行的韩语歌声合成	Jaesung Tae, Hyeongju Kim, Younggun Lee	2106.07886	cs.SD	2021-11-23
通过音高差指法匹配模型估计可弹奏的钢琴指法	Haoyue Zhao and Xin Guan and Qiang Li	2108.09058	cs.SD	2021-08-23
SpecMix：一种用于训练时频域特征的混合样本数据增强方法	Gwantae Kim, David K. Han, Hanseok Ko	2108.03020	cs.SD	2021-08-09
EIHW-GLAM深度关注的多模型融合系统用于DiCOVA 2021挑战中基于咳嗽的COVID-19识别	Zhao Ren, Yi Chang, Bj"orn W. Schuller	2108.03041	cs.SD	2021-08-09
基于超声静默语音界面的神经说话者嵌入	Amin Honarmandi Shandiz, L''aszl''o T''oth, G''abor Gosztolya, Alexandra Mark''o, Tam''as G''abor Csap''o	2106.04552	cs.SD	2021-06-14
宝莱坞音乐中的拉格曲：通过多重分形交叉相关方法的微观视角	Shankha Sanyal, Archi Banerjee, Souparno Roy, Sayan Nag, Ranjan Sengupta and Dipak Ghosh	1604.02243	cs.SD	2021-05-27
印度斯坦古典音乐中一个特定Gharana唱法的变化：非线性多分形研究	Archi Banerjee, Shankha Sanyal, Ranjan Sengupta and Dipak Ghosh	1604.02250	cs.SD	2021-05-27
用基于音素级混合密度网络的丰富韵律多样性建模	Chenpeng Du and Kai Yu	2102.00851	cs.SD	2021-05-25
基于历史支持的变分递归自编码器的音乐生成	Ivan P. Yamshchikov and Alexey Tikhonov	1705.05458	cs.SD	2021-05-21
走向智慧城市的公民科学：一种基于声音互联网实践的鸟鸣识别协作游戏框架	Emmanuel Rovithis and Nikolaos Moustakas and Konstantinos Vogklis and Konstantinos Drossos and Andreas Floros	2103.16988	cs.SD	2021-04-01