音频-视觉-语言任务的参数高效迁移学习

摘要:一种用于视频理解任务中的长短期三模态适配器(LSTTA)方法

作者:Hongye Liu, Xianhai Xie, Yang Gao, Size Li, Zhou YU

论文ID:2308.14274

分类:Multimedia

分类简称:cs.MM

提交时间:2023-08-29

PDF 下载: 英文版 中文版pdf翻译中