非参数方法应用于N个样本序列的比较
摘要:多维序列中的异常和相似性检测具有悠久的历史,并在医学、网络和金融等许多不同领域找到实际应用。异常检测对许多不同学科非常吸引人;例如,数学家寻求基于概率的统一数学公式,统计学家寻求误差界限估计,计算机科学家则试图设计快速算法等。总之,我们有两个贡献:首先,我们提供了一个自包含的调查,介绍了机器学习、统计学和生物信息学领域目前使用的最有前景的方法。其中包括讨论符合预测、希尔伯特空间中的核、科尔莫戈洛夫信息度量以及非参数累积分布函数比较方法(NCDF)。其次,基于这个基础,我们为具有小维数的序列提供了一种强大的NCDF方法。通过数据组织和统计测试的组合,我们描述了随着维数增加而良好扩展的扩展性。
作者:Paolo D'Alberto and Chris Drome and Ali Dasdan
论文ID:1205.1880
分类:Computation
分类简称:stat.CO
提交时间:2012-05-10