遥测数据的数据挖掘:揭示驾驶行为中的隐藏模式

摘要:使用先进技术,车辆行驶信息的遥测数据正变得更加可用于更多保险公司。由于这些数据捕捉到了实际驾驶行为,人们对于驾驶风险的理解预计会得到改善,并有助于更准确的汽车保险费率制定。在这篇论文中,我们分析了从一家主要欧洲保险公司收集的遥测数据所形成的汽车保险数据集。通过对遥测数据结构和相关数据质量问题的详细讨论,我们阐述了在损失建模和费率制定过程中处理和整合遥测信息所面临的实际挑战。然后,通过探索性数据分析,我们证明了个体驾驶行为的异质性的存在,即使在有索赔和无索赔的保单持有人群体中,这也支持了对遥测数据的研究。我们的回归分析重申了在索赔建模中遥测数据的重要性;特别是,我们提出了描述离散记录的速度时间序列并为索赔次数生成具有统计意义的预测变量的速度转变矩阵。我们得出结论,较大的速度转变,以及更高的最大速度,夜间驾驶和过度刹车均与增加的索赔次数相关联。此外,我们在实证上展示了驾驶行为中的学习效应:我们表明,检测到的严重刹车事件和预计的索赔次数与驾驶时间或距离并非成正比,而是以递减的速度增加。

作者:Ian Weng Chan, Spark C. Tseung, Andrei L. Badescu, X. Sheldon Lin

论文ID:2304.10591

分类:Applications

分类简称:stat.AP

提交时间:2023-04-24

PDF 下载: 英文版 中文版pdf翻译中