多媒体-arXiv论文预印本中文版

中文标题	作者	论文ID	分类简称	发布时间
检测图像篡改的取证方法	Jiwon Lee, Seungjae Jeon, Yunji Park, Jaehyun Chung, Doowon Jeong	2308.04723	cs.MM	2023-09-01
恶劣环境下边缘辅助设备内视频分析模型更新	Yuxin Kong, Peng Yang, Yan Cheng	2308.16413	cs.MM	2023-09-01
车辆感知的边缘辅助轻量级感兴趣区域提取和传输	Yan Cheng, Peng Yang, Ning Zhang, Jiawei Hou	2308.16417	cs.MM	2023-09-01
低光视频分析的端边协同联合编码和神经增强	Yuanyi He, Peng Yang, Tian Qin, Ning Zhang	2308.16418	cs.MM	2023-09-01
利用大型语言模型的知识为视觉语言模型提供提示，用于基于知识的视觉问答	Yang Zhou, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao	2308.15851	cs.MM	2023-08-31
VATP360：基于瓦片优先级的视口自适应360度视频流媒体	Zhiyu Pang	2307.15984	cs.MM	2023-08-29
音频-视觉-语言任务的参数高效迁移学习	Hongye Liu, Xianhai Xie, Yang Gao, Size Li, Zhou YU	2308.14274	cs.MM	2023-08-29
探索对比学习下视觉-语言预训练模型的多模态对抗样本的可迁移性	Youze Wang, Wenbo Hu, Yinpeng Dong and Richang Hong	2308.12636	cs.MM	2023-08-25
AMD：自回归运动扩散	Bo Han, Hao Peng, Minjing Dong, Yi Ren, Yixuan Shen, Chang Xu	2305.09381	cs.MM	2023-08-22
竹子：通过在线分组联合迁移学习提升实时视频流的训练效率	Qianyuan Zheng, Hao Chen, Zhan Ma	2308.09948	cs.MM	2023-08-22
理解立体视频观看中的用户行为：数据集、分析与预测	Kaiyuan Hu, Haowen Yang, Yili Jin, Junhua Liu, Yongting Chen, Miao Zhang, Fangxin Wang	2308.07578	cs.MM	2023-08-17
EMID: 一个音频-视觉模态下的情感对齐数据集	Jialing Zou, Jiahao Mei, Guangze Ye, Tianyu Huai, Qiwei Shen, Daoguo Dong	2308.07622	cs.MM	2023-08-16
近期基于视频的学习研究的深入探讨：视频特征、工具、技术和学习效果的全面综述	Evelyn Navarrete, Andreas Nehring, Sascha Schanze, Ralph Ewerth, Anett Hoppe	2301.13617	cs.MM	2023-08-15
合作式边缘缓存：一种基于元强化学习和边缘取样的方法	Bowei He, Yinan Mao, Shiji Zhou, Chen Ma, Zhi Wang	2308.04205	cs.MM	2023-08-09
中国公开：一个用于开放世界多模态学习的数据集	Aozhu Chen, Ziyuan Wang, Chengbo Dong, Kaibin Tian, Ruixiang Zhao, Xun Liang, Zhanhui Kang, Xirong Li	2305.05880	cs.MM	2023-08-08
不共享的线索提示：通过相互知识蒸馏的联邦线索提示语音识别框架	Yuxuan Zhang, Lei Liu and Li Liu	2308.03432	cs.MM	2023-08-08
COPA：通过协作的目标和补丁文本对齐实现高效的视觉-语言预训练	Chaoya Jiang, Haiyang Xu, Wei Ye, Qinghao Ye, Chenliang Li, Ming Yan, Bin Bi, Shikun Zhang, Ji Zhang, Fei Huang	2308.03475	cs.MM	2023-08-08
蟒蛇：将多维自适应比特率引入WebRTC	Yueheng Li, Zicheng Zhang, Hao Chen, Zhan Ma	2308.03643	cs.MM	2023-08-08
学习因果启发的表示一致性用于视频异常检测	Yang Liu, Zhaoyang Xia, Mengyang Zhao, Donglai Wei, Yuzheng Wang, Liu Siao, Bobo Ju, Gaoyun Fang, Jing Liu, Liang Song	2308.01537	cs.MM	2023-08-04
上下文感知的人头视频编辑	Songlin Yang, Wei Wang, Jun Ling, Bo Peng, Xu Tan, Jing Dong	2308.00462	cs.MM	2023-08-02
视觉语言模型的实例级自适应调整和缓存	Chunjin Yang, Fanman Meng, Shuai Chen, Mingyu Liu and Runtong Zhang	2307.15983	cs.MM	2023-08-01
Boon：用于跨模态信息检索的神经搜索引擎	Yan Gong, Georgina Cosma	2307.14240	cs.MM	2023-07-27
基于神经网络的艺术品跨模态搜索与检索	Yan Gong, Georgina Cosma, Axel Finke	2307.14244	cs.MM	2023-07-27
面向文本的多模态强化网络用于非对齐多模态序列的情感分析	Yuxuan Lei, Dingkang Yang, Mingcheng Li, Shunli Wang, Jiawei Chen, Lihua Zhang	2307.13205	cs.MM	2023-07-26
点云的语义通信系统中的模型分割多址和可控编码速率	Xiaoyi Liu, Haotai Liang, Zhicheng Bao, Chen Dong, Xiaodong Xu	2307.06027	cs.MM	2023-07-13