增加对新数据来源的信任：生态学中的众包图像分类-arXiv论文预印本中文版

增加对新数据来源的信任：生态学中的众包图像分类

摘要：公众众包方法促进了非专家生产科学信息。这种公民科学形式正逐渐成为许多领域中补充数据的关键来源，以支持数据驱动决策和研究挑战性问题。然而，有关这些数据有效性的担忧经常限制它们的实用性。本文着重研究公民科学数据在环境保护中应对复杂挑战的应用。我们从三个角度考虑了这个问题。首先，我们对已在生态学中使用公民科学进行贝叶斯模型的文献进行了研究。其次，我们比较了几种流行的多数投票算法，并介绍了一种贝叶斯项目反应模型，用于估计和考虑参与者的能力，同时调整其对图片的难度进行分类。该模型还可以将参与者基于能力聚类成群组。第三，我们将该模型应用于澳大利亚大堡礁的水下图像中的珊瑚分类案例研究。我们展示了该模型在整体上取得了优异结果，并且在困难任务中，仅使用专家和有经验的参与者群组的加权共识方法表现出更好的性能度量。此外，我们发现参与者在更多的分类机会中学习，这在很大程度上提高了他们的能力。总体而言，本文展示了当这些数据得到适当分析时，公众众包在回答复杂和具有挑战性的生态学问题方面的可行性。这为未来工作提高这一新兴数据来源的效能和可信度提供了动力。

作者：Edgar Santos-Fernandez, Julie Vercelloni, Aiden Price, Grace Heron, Bryce Christensen, Erin E. Peterson, Kerrie Mengersen

论文ID：2305.01144

分类：Applications

分类简称：stat.AP

提交时间：2023-05-03

PDF 下载： 英文版中文版pdf翻译中