操作风险损失描述的文本分析

摘要:金融机构通过执行法规所要求的活动来管理运营风险(OpRisk),例如收集损失数据,计算资本要求和报告。为此,为每个OpRisk事件,在OpRisk数据库中记录损失金额、日期、涉及的组织单位、事件类型和描述。近年来,运营风险职能要求超越其监管任务,以主动管理运营风险,防止或减轻其影响。由于OpRisk数据库中还包含事件描述,从这些文本中提取信息是一个机遇领域。本研究首次引入了一个结构化工作流程,用于将文本分析技术(自然语言处理的主要任务之一)应用于OpRisk事件描述,以识别作为潜在风险根本原因的管理集群(比监管类别更细化)。我们补充和丰富了基于定量数据的统计方法的已建立框架。具体来说,在数据清理、文本向量化和语义调整等细致任务之后,我们应用了降维方法和多个聚类模型,使用算法比较它们的性能和弱点。我们的结果改进了对损失事件的回顾性知识,并能够减轻未来的风险。

作者:Davide Di Vincenzo, Francesca Greselin, Fabio Piacenza, Ricardas Zitikis

论文ID:2212.01285

分类:Applications

分类简称:stat.AP

提交时间:2023-06-07

PDF 下载: 英文版 中文版pdf翻译中