基于LightGBM和特征工程的商业银行客户信用风险评估的高效方法

摘要:有效控制信用风险是商业银行稳定运作的关键环节。本文主要基于Kaggle上的外国商业银行的客户信息数据集,使用LightGBM算法构建一个分类器来对客户进行分类,以帮助银行判断客户违约可能性。本文主要涉及特征工程,如缺失值处理、编码、样本不平衡等,大大提高了机器学习效果。本文的主要创新是在原始数据集的基础上构建新的特征属性,使分类器的准确率达到0.734,AUC达到0.772,这超过了许多基于相同数据集的分类器。该模型可以为商业银行的信贷授予提供一些参考,并为其他类似研究提供一些特征处理思路。

作者:Yanjie Sun, Zhike Gong, Quan Shi, Lin Chen

论文ID:2308.08762

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-21

PDF 下载: 英文版 中文版pdf翻译中