| 中文标题 | 作者 | 论文ID | 分类简称 | 发布时间 |
|---|---|---|---|---|
| 大词汇量下基于深度神经网络的自动和弦估计:设计框架、系统变化和限制 | Junqi Deng, Yu-Kwong Kwok | 1709.07153 | cs.SD | 2017-09-25 |
| 基于非平稳 Gabor 框架的相位变换器 | Emil Solsb{ae}k Ottosen and Monika D"orfler | 1612.05156 | cs.SD | 2017-09-14 |
| 通过多说话者表示改善源分离 | Jeroen Zegers, Hugo Van hamme | 1708.08740 | cs.SD | 2017-08-30 |
| 基于自编码器的不足通道信息下的说话人识别领域自适应 | Suwon Shon, Seongkyu Mun, Wooil Kim and Hanseok Ko | 1708.01227 | cs.SD | 2017-08-29 |
| 语言不匹配条件下的说话人识别的递归白化转换 | Suwon Shon, Seongkyu Mun and Hanseok Ko | 1708.01232 | cs.SD | 2017-08-29 |
| 基于加权预测误差和DNN的综合语音增强方法用于去混响和降噪 | Hao Li, Xueliang Zhang, Hui Zhang, Guanglai Gao | 1708.08251 | cs.SD | 2017-08-29 |
| 基于对象的音频渲染 | Philip Jackson, Filippo Fazi, Frank Melchior, Trevor Cox, Adrian Hilton, Chris Pike, Jon Francombe, Andreas Franck, Philip Coleman, Dylan Menzies-Gow, James Woodcock, Yan Tang, Qingju Liu, Rick Hughes, Marcos Simon Galvez, Teo de Campos, Hansung Kim, and Hanne Stenzel | 1708.07218 | cs.SD | 2017-08-25 |
| 基于复杂学生$t$分布的独立低秩矩阵分析在盲音频源分离中的应用 | Shinichi Mogami, Daichi Kitamura, Yoshiki Mitsui, Norihiro Takamune, Hiroshi Saruwatari, Nobutaka Ono | 1708.04795 | cs.SD | 2017-08-17 |
| 基于稀疏STFT框架和加权Laplacian方向建模的欠定源分离 | Thomas Sgouros and Nikolaos Mitianoudis | 1708.04821 | cs.SD | 2017-08-17 |
| 印度北方古典音乐中的自动拉格识别 | Sanchit Alekh | 1708.02322 | cs.SD | 2017-08-09 |
| 在恶劣的现实环境中,用于语音识别的稳健的基于一致性的频谱增强 | Hendrik Barfuss, Christian Huemmer, Andreas Schwarz, Walter Kellermann | 1604.03393 | cs.SD | 2017-08-08 |
| 相位感知的单通道语音增强与调制域卡尔曼滤波 | Nikolaos Dionelis, Mike Brookes | 1708.02171 | cs.SD | 2017-08-08 |
| 鲁棒二维多项式波束形成器的设计:一个凸优化问题及其在机器人听觉中的应用 | Hendrik Barfuss, Markus Bachmann, Michael Buerger, Martin Schneider, and Walter Kellerman | 1704.08953 | cs.SD | 2017-08-02 |
| 基于领域适应的变工作条件下的轴承故障诊断 | Bo Zhang, Wei Li, Zhe Tong and Meng Zhang | 1707.09890 | cs.SD | 2017-08-01 |
| 房间内单麦克风声源定位 | Helena Peic Tukuljac, Herve Lissek and Pierre Vandergheynst | 1707.04504 | cs.SD | 2017-07-17 |
| 卷积神经网络在无伴奏合唱声乐中基于得分的音节分割 | Jordi Pons, Rong Gong, Xavier Serra | 1707.03544 | cs.SD | 2017-07-13 |
| 通过结合音素和时长信息进行音频至乐谱匹配 | Rong Gong, Jordi Pons, Xavier Serra | 1707.03547 | cs.SD | 2017-07-13 |
| 统计参数语音合成在多任务学习框架下使用生成对抗网络 | Shan Yang, Lei Xie, Xiao Chen, Xiaoyan Lou, Xuan Zhu, Dongyan Huang, Haizhou Li | 1707.01670 | cs.SD | 2017-07-12 |
| 深度神经网络在因子语音处理模型中进行特征联合状态后验估计 | Mahdi Khademian, Mohammad Mehdi Homayounpour | 1707.02661 | cs.SD | 2017-07-11 |
| 基于新型三阶圆环超音段隐马尔可夫模型的呼喊环境下说话人识别 | Ismail Shahin | 1707.00686 | cs.SD | 2017-07-07 |
| pch2csd:一种将Nord Modular G2补丁转换为Csound代码的应用程序 | Gleb Rogozinsky, Mihail Chesnokov and Eugene Cherny | 1707.01653 | cs.SD | 2017-07-07 |
| 利用二阶隐马尔可夫模型进行口语条件识别 | Ismail Shahin | 1707.00679 | cs.SD | 2017-07-05 |
| 基于HMM、CHMM2和SPHMM的研究和增强压力和情绪对话环境中的对话条件识别 | Ismail Shahin | 1707.00680 | cs.SD | 2017-07-05 |
| 运用情绪线索验证情感交流环境中的发言者 | Ismail Shahin | 1707.00137 | cs.SD | 2017-07-04 |
| 基于新型三阶隐马尔可夫模型的喊叫环境下说话人识别 | Ismail Shahin | 1707.00138 | cs.SD | 2017-07-04 |