加载中 . . .
中文标题 作者 论文ID 分类简称 发布时间
检测图像篡改的取证方法 Jiwon Lee, Seungjae Jeon, Yunji Park, Jaehyun Chung, Doowon Jeong 2308.04723 cs.MM 2023-09-01
恶劣环境下边缘辅助设备内视频分析模型更新 Yuxin Kong, Peng Yang, Yan Cheng 2308.16413 cs.MM 2023-09-01
车辆感知的边缘辅助轻量级感兴趣区域提取和传输 Yan Cheng, Peng Yang, Ning Zhang, Jiawei Hou 2308.16417 cs.MM 2023-09-01
低光视频分析的端边协同联合编码和神经增强 Yuanyi He, Peng Yang, Tian Qin, Ning Zhang 2308.16418 cs.MM 2023-09-01
利用大型语言模型的知识为视觉语言模型提供提示,用于基于知识的视觉问答 Yang Zhou, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao 2308.15851 cs.MM 2023-08-31
VATP360:基于瓦片优先级的视口自适应360度视频流媒体 Zhiyu Pang 2307.15984 cs.MM 2023-08-29
音频-视觉-语言任务的参数高效迁移学习 Hongye Liu, Xianhai Xie, Yang Gao, Size Li, Zhou YU 2308.14274 cs.MM 2023-08-29
探索对比学习下视觉-语言预训练模型的多模态对抗样本的可迁移性 Youze Wang, Wenbo Hu, Yinpeng Dong and Richang Hong 2308.12636 cs.MM 2023-08-25
AMD:自回归运动扩散 Bo Han, Hao Peng, Minjing Dong, Yi Ren, Yixuan Shen, Chang Xu 2305.09381 cs.MM 2023-08-22
竹子:通过在线分组联合迁移学习提升实时视频流的训练效率 Qianyuan Zheng, Hao Chen, Zhan Ma 2308.09948 cs.MM 2023-08-22
理解立体视频观看中的用户行为:数据集、分析与预测 Kaiyuan Hu, Haowen Yang, Yili Jin, Junhua Liu, Yongting Chen, Miao Zhang, Fangxin Wang 2308.07578 cs.MM 2023-08-17
EMID: 一个音频-视觉模态下的情感对齐数据集 Jialing Zou, Jiahao Mei, Guangze Ye, Tianyu Huai, Qiwei Shen, Daoguo Dong 2308.07622 cs.MM 2023-08-16
近期基于视频的学习研究的深入探讨:视频特征、工具、技术和学习效果的全面综述 Evelyn Navarrete, Andreas Nehring, Sascha Schanze, Ralph Ewerth, Anett Hoppe 2301.13617 cs.MM 2023-08-15
合作式边缘缓存:一种基于元强化学习和边缘取样的方法 Bowei He, Yinan Mao, Shiji Zhou, Chen Ma, Zhi Wang 2308.04205 cs.MM 2023-08-09
中国公开:一个用于开放世界多模态学习的数据集 Aozhu Chen, Ziyuan Wang, Chengbo Dong, Kaibin Tian, Ruixiang Zhao, Xun Liang, Zhanhui Kang, Xirong Li 2305.05880 cs.MM 2023-08-08
不共享的线索提示:通过相互知识蒸馏的联邦线索提示语音识别框架 Yuxuan Zhang, Lei Liu and Li Liu 2308.03432 cs.MM 2023-08-08
COPA:通过协作的目标和补丁文本对齐实现高效的视觉-语言预训练 Chaoya Jiang, Haiyang Xu, Wei Ye, Qinghao Ye, Chenliang Li, Ming Yan, Bin Bi, Shikun Zhang, Ji Zhang, Fei Huang 2308.03475 cs.MM 2023-08-08
蟒蛇:将多维自适应比特率引入WebRTC Yueheng Li, Zicheng Zhang, Hao Chen, Zhan Ma 2308.03643 cs.MM 2023-08-08
学习因果启发的表示一致性用于视频异常检测 Yang Liu, Zhaoyang Xia, Mengyang Zhao, Donglai Wei, Yuzheng Wang, Liu Siao, Bobo Ju, Gaoyun Fang, Jing Liu, Liang Song 2308.01537 cs.MM 2023-08-04
上下文感知的人头视频编辑 Songlin Yang, Wei Wang, Jun Ling, Bo Peng, Xu Tan, Jing Dong 2308.00462 cs.MM 2023-08-02
视觉语言模型的实例级自适应调整和缓存 Chunjin Yang, Fanman Meng, Shuai Chen, Mingyu Liu and Runtong Zhang 2307.15983 cs.MM 2023-08-01
Boon:用于跨模态信息检索的神经搜索引擎 Yan Gong, Georgina Cosma 2307.14240 cs.MM 2023-07-27
基于神经网络的艺术品跨模态搜索与检索 Yan Gong, Georgina Cosma, Axel Finke 2307.14244 cs.MM 2023-07-27
面向文本的多模态强化网络用于非对齐多模态序列的情感分析 Yuxuan Lei, Dingkang Yang, Mingcheng Li, Shunli Wang, Jiawei Chen, Lihua Zhang 2307.13205 cs.MM 2023-07-26
点云的语义通信系统中的模型分割多址和可控编码速率 Xiaoyi Liu, Haotai Liang, Zhicheng Bao, Chen Dong, Xiaodong Xu 2307.06027 cs.MM 2023-07-13