SQRQuerier:跨国调查数据的可视化查询框架

摘要:公共舆论调查作为一种研究人们在比较视角下的态度和行为的有力工具。然而,即使是全球范围内的调查也只提供了部分的地理和时间覆盖,这阻碍了全面的知识产出。为了扩大比较的范围,社会科学家们转向对不同人口和/或年份的类似主题的数据集进行的后期变量调和。由此产生的新数据集可以作为一个单一的数据源进行分析,并可以通过许多数据门户进行灵活访问。然而,这些门户在深入探索数据或根据用户自定义需求查询数据方面提供的指导很少。因此,社会科学家们仍然很难高效地确定与他们的研究相关的数据,并根据切片数据评估他们的理论模型。为了解决这些问题,在Survey Data Recycling(SDR)国际合作研究项目中,我们提出了SDRQuerier并将其应用于被协调的SDR数据库,该数据库涵盖了22个著名国际项目中的1721个全国调查,采访了200多万名受访者。我们设计了SDRQuerier来解决社会科学家经常面临的三个实际挑战。首先,基于BERT模型提供通过研究问题或关键词进行自定义数据查询的方式。其次,我们提出了一种新的可视化设计,展示了不同级别的协调数据的可用性,从而帮助用户判断是否存在实证数据来回答给定的研究问题。最后,SDRQuerier揭示了数据库中实质性变量和方法变量之间的潜在关系模式,以帮助社会科学家严谨评估甚至改进他们的回归模型。通过与多个社会科学家合作解决日常挑战的案例研究,我们证明了SDRQuerier的新颖性和有效性。

作者:Yamei Tu, Olga Li, Junpeng Wang, Han-Wei Shen, Przemek Powalko, Irina Tomescu-Dubrow, Kazimierz M. Slomczynski, Spyros Blanas, J. Craig Jenkins

论文ID:2201.11125

分类:Human-Computer Interaction

分类简称:cs.HC

提交时间:2023-06-09

PDF 下载: 英文版 中文版pdf翻译中