使用M-Lab的大数据比较宽带ISP性能
摘要:比较宽带速度方面的ISP具有挑战性,因为测量结果可能会因用户属性(如操作系统)和测试条件(如访问能力、服务器距离、TCP窗口大小、时间等因素)而有所不同。本文从医学观察研究中汲取灵感,这些研究面临类似的挑战,即比较不同特征的患者在不同治疗下的效果,并通过“因果推断”技术对医疗记录进行事后分析来成功解决这个问题。我们的第一个贡献是开发一个工具,对M-Lab上数百万个数据点进行预处理和可视化,以初步了解影响宽带性能的因素。接下来,我们分析了涉及三个国家的十二个ISP的24个月数据,并证明了数据中由于ISP之间的属性分布差异而存在观察偏差。作为我们的第三个贡献,我们应用多变量匹配方法来识别可以进行无偏比较的适当队列,发现ISP在性能上更接近以前的认识。我们最后的贡献是通过开发一种估计速度分级的方法来改进我们的模型,并重新应用匹配方法来比较ISP的性能。我们的研究结果挑战了传统的ISP排名,为全球范围内无偏比较ISP的数据驱动方法铺平了道路。
作者:Xiaohong Deng and Yun Feng and Thanchanok Sutjarittham and Hassan Habibi Gharakheili and Blanca Gallego and Vijay Sivaraman
论文ID:2101.09795
分类:Performance
分类简称:cs.PF
提交时间:2021-01-26