视频2动作：减少应用教程视频中的人类交互行为注释-arXiv论文预印本中文版

视频2动作：减少应用教程视频中的人类交互行为注释

摘要：移动应用程序的教程视频已成为用户学习陌生应用程序功能的流行和引人注目的方式。为了让用户能够访问视频，视频创建者总是需要对视频中的操作进行注释，包括执行了哪些操作以及在哪里点击。然而，这个过程可能耗时且劳动密集。在本文中，我们介绍了一种轻量级的自动生成动作场景并预测视频中动作位置的方法Video2Action，该方法使用图像处理和深度学习方法。自动化实验表明Video2Action在从视频中获取动作方面表现良好，而用户研究则显示了我们生成的动作提示对帮助视频创建者进行动作注释的有用性。

作者：Sidong Feng, Chunyang Chen, Zhenchang Xing

论文ID：2308.03252

分类：Human-Computer Interaction

分类简称：cs.HC

提交时间：2023-08-08

PDF 下载： 英文版中文版pdf翻译中