使用引述模型预测调查回应:对美国的赞同度案例研究

摘要:用机器学习分析引语来预测调查回应的先导性方法的研究称为公众舆论研究中获得调查回应的重要组成部分。然而,调查数据收集可能是艰难、耗时和昂贵的,没有确保得到足够的回应率。在本文中,我们提出了一种开拓性的方法,通过机器学习来分析引语来预测调查回应。我们的研究重点是评估对美国的好感程度,这是许多组织和政府感兴趣的话题。我们利用来自不同国籍和时间段的个人的大量引语语料库来提取他们的好感程度。我们采用自然语言处理技术和机器学习算法的组合来构建调查回应的预测模型。我们研究了两种情景:第一,当一个国家没有进行调查时;第二,当调查已经进行但只涵盖特定年份而不涵盖所有年份时。我们的实验结果表明,我们提出的方法可以高准确度地预测调查回应。此外,我们全面分析了对模型性能做出贡献的关键特征。该研究有潜力通过显著减少进行调查所需的成本和时间,同时提供准确的公众意见预测,来影响数据科学领域的调查研究。

作者:Alireza Amirshahi, Nicolas Kirsch, Jonathan Reymond and Saleh Baghersalimi

论文ID:2305.14086

分类:Computers and Society

分类简称:cs.CY

提交时间:2023-05-30

PDF 下载: 英文版 中文版pdf翻译中