山和鼹鼠之间有何区别?线状图中视觉特征的语义标记的量化

摘要:使用描述图表中的视觉特征的相关语言可以帮助作者撰写关于图表的标题和摘要,以帮助读者理解。为了更好地理解描述视觉特征的概念之间的相互作用以及这些概念之间的语义关系(例如,“急剧增加”与“逐渐上升”),我们进行了一项众包研究,以收集关于单变量折线图的标签和视觉特征对。利用这个众包数据集中带有标签的视觉特征,本文提出了一种基于将特征-词分布与图表的视觉特征和数据领域相结合的方法来标注视觉图表特征的新方法。这些特征-词-主题模型识别了与语义上类似但微妙不同的词关联,例如“平坦”,“高原”和“停滞”,以及与视觉特征相关的描述词,例如“急剧增加”,“缓慢攀升”和“高峰”。我们的特征-词-主题模型使用了量化语义方法和受信号处理启发的最小误差形状相似度方法进行计算。最后,我们展示了该数据集在注释图表和生成文本数据摘要方面的应用。

作者:Dennis Bromley and Vidya Setlur

论文ID:2308.01370

分类:Human-Computer Interaction

分类简称:cs.HC

提交时间:2023-08-04

PDF 下载: 英文版 中文版pdf翻译中