氧唑烯和氧唑烷高维分子描述符数据集中的异常值识别及主成分离群点检测算法和其他鲁棒估计器的比较数值研究
摘要:异常点检测在过去十年中已经开始使用。异常点检测是一个新兴的主题,并且在医学科学和制药科学中有着强大的应用。异常点检测用于检测数据的异常行为。生物信息学中的典型问题可以通过异常点检测来解决。本文展示了一种快速检测异常点的计算方法,该方法在高维空间中特别有效。PrCmpOut算法利用主要成分的简单属性在转换空间中检测异常点,从而在高维数据中具有显著的计算优势。与现有的异常点检测方法相比,这种方法所需的计算时间较少。通过模拟研究,分析并比较了这种评估器的性质(异常点错误率(FN)、非异常点错误率(FP)和计算成本)与文献中其他鲁棒性评估器的性质。基于氧唑烷和氧唑烯分子描述符数据集的数值证据表明,所提出的方法在各种实际应用情况下表现良好。因此,它是现有异常点检测方法的有价值的辅助工具。
作者:Doreswamy and Chanabasayya .M. Vastrad
论文ID:1312.2861
分类:Computational Engineering, Finance, and Science
分类简称:cs.CE
提交时间:2013-12-13