| 中文标题 | 作者 | 论文ID | 分类简称 | 发布时间 |
|---|---|---|---|---|
| 检测图像篡改的取证方法 | Jiwon Lee, Seungjae Jeon, Yunji Park, Jaehyun Chung, Doowon Jeong | 2308.04723 | cs.MM | 2023-09-01 |
| 恶劣环境下边缘辅助设备内视频分析模型更新 | Yuxin Kong, Peng Yang, Yan Cheng | 2308.16413 | cs.MM | 2023-09-01 |
| 车辆感知的边缘辅助轻量级感兴趣区域提取和传输 | Yan Cheng, Peng Yang, Ning Zhang, Jiawei Hou | 2308.16417 | cs.MM | 2023-09-01 |
| 低光视频分析的端边协同联合编码和神经增强 | Yuanyi He, Peng Yang, Tian Qin, Ning Zhang | 2308.16418 | cs.MM | 2023-09-01 |
| 利用大型语言模型的知识为视觉语言模型提供提示,用于基于知识的视觉问答 | Yang Zhou, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao | 2308.15851 | cs.MM | 2023-08-31 |
| VATP360:基于瓦片优先级的视口自适应360度视频流媒体 | Zhiyu Pang | 2307.15984 | cs.MM | 2023-08-29 |
| 音频-视觉-语言任务的参数高效迁移学习 | Hongye Liu, Xianhai Xie, Yang Gao, Size Li, Zhou YU | 2308.14274 | cs.MM | 2023-08-29 |
| 探索对比学习下视觉-语言预训练模型的多模态对抗样本的可迁移性 | Youze Wang, Wenbo Hu, Yinpeng Dong and Richang Hong | 2308.12636 | cs.MM | 2023-08-25 |
| AMD:自回归运动扩散 | Bo Han, Hao Peng, Minjing Dong, Yi Ren, Yixuan Shen, Chang Xu | 2305.09381 | cs.MM | 2023-08-22 |
| 竹子:通过在线分组联合迁移学习提升实时视频流的训练效率 | Qianyuan Zheng, Hao Chen, Zhan Ma | 2308.09948 | cs.MM | 2023-08-22 |
| 理解立体视频观看中的用户行为:数据集、分析与预测 | Kaiyuan Hu, Haowen Yang, Yili Jin, Junhua Liu, Yongting Chen, Miao Zhang, Fangxin Wang | 2308.07578 | cs.MM | 2023-08-17 |
| EMID: 一个音频-视觉模态下的情感对齐数据集 | Jialing Zou, Jiahao Mei, Guangze Ye, Tianyu Huai, Qiwei Shen, Daoguo Dong | 2308.07622 | cs.MM | 2023-08-16 |
| 近期基于视频的学习研究的深入探讨:视频特征、工具、技术和学习效果的全面综述 | Evelyn Navarrete, Andreas Nehring, Sascha Schanze, Ralph Ewerth, Anett Hoppe | 2301.13617 | cs.MM | 2023-08-15 |
| 合作式边缘缓存:一种基于元强化学习和边缘取样的方法 | Bowei He, Yinan Mao, Shiji Zhou, Chen Ma, Zhi Wang | 2308.04205 | cs.MM | 2023-08-09 |
| 中国公开:一个用于开放世界多模态学习的数据集 | Aozhu Chen, Ziyuan Wang, Chengbo Dong, Kaibin Tian, Ruixiang Zhao, Xun Liang, Zhanhui Kang, Xirong Li | 2305.05880 | cs.MM | 2023-08-08 |
| 不共享的线索提示:通过相互知识蒸馏的联邦线索提示语音识别框架 | Yuxuan Zhang, Lei Liu and Li Liu | 2308.03432 | cs.MM | 2023-08-08 |
| COPA:通过协作的目标和补丁文本对齐实现高效的视觉-语言预训练 | Chaoya Jiang, Haiyang Xu, Wei Ye, Qinghao Ye, Chenliang Li, Ming Yan, Bin Bi, Shikun Zhang, Ji Zhang, Fei Huang | 2308.03475 | cs.MM | 2023-08-08 |
| 蟒蛇:将多维自适应比特率引入WebRTC | Yueheng Li, Zicheng Zhang, Hao Chen, Zhan Ma | 2308.03643 | cs.MM | 2023-08-08 |
| 学习因果启发的表示一致性用于视频异常检测 | Yang Liu, Zhaoyang Xia, Mengyang Zhao, Donglai Wei, Yuzheng Wang, Liu Siao, Bobo Ju, Gaoyun Fang, Jing Liu, Liang Song | 2308.01537 | cs.MM | 2023-08-04 |
| 上下文感知的人头视频编辑 | Songlin Yang, Wei Wang, Jun Ling, Bo Peng, Xu Tan, Jing Dong | 2308.00462 | cs.MM | 2023-08-02 |
| 视觉语言模型的实例级自适应调整和缓存 | Chunjin Yang, Fanman Meng, Shuai Chen, Mingyu Liu and Runtong Zhang | 2307.15983 | cs.MM | 2023-08-01 |
| Boon:用于跨模态信息检索的神经搜索引擎 | Yan Gong, Georgina Cosma | 2307.14240 | cs.MM | 2023-07-27 |
| 基于神经网络的艺术品跨模态搜索与检索 | Yan Gong, Georgina Cosma, Axel Finke | 2307.14244 | cs.MM | 2023-07-27 |
| 面向文本的多模态强化网络用于非对齐多模态序列的情感分析 | Yuxuan Lei, Dingkang Yang, Mingcheng Li, Shunli Wang, Jiawei Chen, Lihua Zhang | 2307.13205 | cs.MM | 2023-07-26 |
| 点云的语义通信系统中的模型分割多址和可控编码速率 | Xiaoyi Liu, Haotai Liang, Zhicheng Bao, Chen Dong, Xiaodong Xu | 2307.06027 | cs.MM | 2023-07-13 |