主成分分析和因子分析在信用评级中的特征选择

摘要:信用评级是对公司信用风险的评估,评估其偿还债务的能力和债务人违约的可能性。有许多影响信用评级的因素。因此,选择实质性的特征来探索信用评级变化的主要原因是至关重要的。为了解决这个问题,本文利用主成分分析和因子分析作为特征选择算法,选择重要的特征,将相似的特征归纳到一起,并获得金融、能源、医疗保健和消费自由度四个领域的特征的最小集合。本文使用了两个数据集,财务比率和资产负债表,采用了两种映射方法,详细映射和粗映射,将目标变量(信用评级)转化为分类变量。为了测试信用评级预测的准确性,使用了随机森林分类器来测试和训练特征集。结果表明,财务比率特征集的准确性高于资产负债表特征集。此外,因子分析可以显著减少特征的数量,获得几乎相同的准确性,可以大大减少分析数据所需的时间;我们还利用因子分析总结了财务比率和资产负债表中影响信用评级变化的七个主要因素和十个主要因素,这可以更好地解释信用评级变化的原因。

作者:Shenghuan Yang, lonut Florescu, Md Tariqul Islam

论文ID:2011.09137

分类:Statistical Finance

分类简称:q-fin.ST

提交时间:2020-12-22

PDF 下载: 英文版 中文版pdf翻译中