针对具有不确定意图的攻击者进行传感器配置优化:一种最坏情况后悔最小化方法
摘要:多阶段攻击中探测资源(传感器)的最优分配,考虑了防御者对攻击者意图的不确定性。 我们使用马尔可夫决策过程对攻击计划问题进行建模,并使用有限集合的奖励函数来描述攻击者意图的不确定性 - 每个奖励代表攻击者的一种类型。 基于这个建模框架,我们采用鲁棒博弈理论中的最差情况绝对遗憾最小化范式,并开发了求解两类攻击防御互动的最差情况遗憾最小化传感器分配策略的混合整数线性规划(MILP)模型:一个是防御者和攻击者进行零和博弈,另一个是非零和博弈。 我们使用随机网格世界示例证明了我们框架的有效性。
作者:Haoxiang Ma, Shuo Han, Charles A. Kamhoua and Jie Fu
论文ID:2304.05962
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2023-06-26