在线中心点异常检测的安全性分析

摘要:机器学习应用中的安全问题非常关键,尤其是在处理人类活动而不是自然现象的情况下(例如信息排名、垃圾邮件检测、恶意软件检测等)。在这种情况下,学习算法很可能会处理被操纵的数据,以阻碍决策。虽然先前的一些工作解决了在监督学习的背景下处理恶意数据的问题,但关于在这种情况下异常检测方法的行为几乎没有研究。在本文中,我们分析了一种特定方法(在线质心异常检测方法)在存在对抗噪声的情况下的性能。我们的分析涉及以下与安全相关的问题:学习和攻击过程的形式化,最优攻击的推导,效率和约束的分析。我们针对质心异常检测方法在不同条件下(有界和无界的流量百分比,以及有界的误报率)的中毒攻击的效果得出了界限。我们的界限表明,虽然在无约束的情况下可以有效地发动中毒攻击,但如果合理利用外部约束条件,就可以使其难度任意提高(攻击者获益的严格上限)。我们在实际的HTTP和攻击追踪中进行的实证评估验证了我们理论界限的严密性和我们保护机制的实用性。

作者:Marius Kloft and Pavel Laskov

论文ID:1003.0078

分类:Machine Learning

分类简称:stat.ML

提交时间:2010-03-02

PDF 下载: 英文版 中文版pdf翻译中