| 中文标题 | 作者 | 论文ID | 分类简称 | 发布时间 |
|---|---|---|---|---|
| 流行音乐中的调制图表 | Jason I. Brown and Ian George | 2306.13691 | cs.SD | 2023-06-27 |
| 从音乐的多模态特性和流派相关性角度改进音乐流派分类 | Ganghui Ru, Xulong Zhang, Jianzong Wang, Ning Cheng, Jing Xiao | 2303.07667 | cs.SD | 2023-06-13 |
| 普通话-英语混合语音识别的语言特定声学边界学习 | Zhiyun Fan, Linhao Dong, Chen Shen, Zhenlin Liang, Jun Zhang, Lu Lu, Zejun Ma | 2306.05279 | cs.SD | 2023-06-09 |
| 学习本地到全局特征聚合用于语音情感识别 | Cheng Lu, Hailun Lian, Wenming Zheng, Yuan Zong, Yan Zhao, Sunan Li | 2306.01491 | cs.SD | 2023-06-05 |
| HSD:一种分层歌唱注释数据集 | Xiao Fu, Xin Yuan, Jinglu Hu | 2209.15640 | cs.SD | 2022-10-03 |
| 微软公司参与2022年VoxCeleb发言人识别挑战的系统 | Gang Liu, Tianyan Zhou, Yong Zhao, Yu Wu, Zhuo Chen, Yao Qian, Jian Wu | 2209.11266 | cs.SD | 2022-09-26 |
| 检测真实音频录音中的合成语音篡改 | Md Hafizur Rahman, Martin Graciarena, Diego Castan, Chris Cobo-Kroenke, Mitchell McLaren and Aaron Lawson | 2209.07498 | cs.SD | 2022-09-16 |
| 自适应混合语音编码及MLP LPC结构 | Marcos Faundez-Zanuy | 2204.00245 | cs.SD | 2022-04-04 |
| 视觉文本转语音 | Yoshifumi Nakano, Takaaki Saeki, Shinnosuke Takamichi, Katsuhito Sudoh, Hiroshi Saruwatari | 2203.14725 | cs.SD | 2022-03-29 |
| 在未知条件下分析语言无关的说话人匿名化框架 | Xiaoxiao Miao, Xin Wang, Erica Cooper, Junichi Yamagishi, Natalia Tomashenko | 2203.14834 | cs.SD | 2022-03-29 |
| midiVERTO:实时可视化音调的Web应用程序 | Daniel Harasim, Giovanni Affatato and Fabian C. Moss | 2203.13158 | cs.SD | 2022-03-25 |
| 日常家庭环境中使用可穿戴感应器自动检测前景语音:一种迁移学习方法 | Dawei Liang, Zifan Xu, Yinuo Chen, Rebecca Adaimi, David Harwath, Edison Thomaz | 2203.11294 | cs.SD | 2022-03-23 |
| 一种面向最大信号干扰比的新型盲源分离框架 | Jianju Gu, Longbiao Cheng, Dingding Yao, Junfeng Li and Yonghong Yan | 2110.03272 | cs.SD | 2022-03-09 |
| 基于场景语义上下文的声音事件检测 | Noriyuki Tonami, Keisuke Imoto, Ryotaro Nagase, Yuki Okamoto, Takahiro Fukumori, Yoichi Yamashita | 2110.03243 | cs.SD | 2022-02-18 |
| 可解释的呼吸音分析的原型学习 | Zhao Ren, Thanh Tam Nguyen, Wolfgang Nejdl | 2110.03536 | cs.SD | 2022-02-08 |
| MLP歌手:迈向快速并行的韩语歌声合成 | Jaesung Tae, Hyeongju Kim, Younggun Lee | 2106.07886 | cs.SD | 2021-11-23 |
| 通过音高差指法匹配模型估计可弹奏的钢琴指法 | Haoyue Zhao and Xin Guan and Qiang Li | 2108.09058 | cs.SD | 2021-08-23 |
| SpecMix:一种用于训练时频域特征的混合样本数据增强方法 | Gwantae Kim, David K. Han, Hanseok Ko | 2108.03020 | cs.SD | 2021-08-09 |
| EIHW-GLAM深度关注的多模型融合系统用于DiCOVA 2021挑战中基于咳嗽的COVID-19识别 | Zhao Ren, Yi Chang, Bj"orn W. Schuller | 2108.03041 | cs.SD | 2021-08-09 |
| 基于超声静默语音界面的神经说话者嵌入 | Amin Honarmandi Shandiz, L''aszl''o T''oth, G''abor Gosztolya, Alexandra Mark''o, Tam''as G''abor Csap''o | 2106.04552 | cs.SD | 2021-06-14 |
| 宝莱坞音乐中的拉格曲:通过多重分形交叉相关方法的微观视角 | Shankha Sanyal, Archi Banerjee, Souparno Roy, Sayan Nag, Ranjan Sengupta and Dipak Ghosh | 1604.02243 | cs.SD | 2021-05-27 |
| 印度斯坦古典音乐中一个特定Gharana唱法的变化:非线性多分形研究 | Archi Banerjee, Shankha Sanyal, Ranjan Sengupta and Dipak Ghosh | 1604.02250 | cs.SD | 2021-05-27 |
| 用基于音素级混合密度网络的丰富韵律多样性建模 | Chenpeng Du and Kai Yu | 2102.00851 | cs.SD | 2021-05-25 |
| 基于历史支持的变分递归自编码器的音乐生成 | Ivan P. Yamshchikov and Alexey Tikhonov | 1705.05458 | cs.SD | 2021-05-21 |
| 走向智慧城市的公民科学:一种基于声音互联网实践的鸟鸣识别协作游戏框架 | Emmanuel Rovithis and Nikolaos Moustakas and Konstantinos Vogklis and Konstantinos Drossos and Andreas Floros | 2103.16988 | cs.SD | 2021-04-01 |