机器学习在在线借贷风险预测中的应用
摘要:在线领先公司通过更有效的贷款处理打破了传统的消费者银行业务,风险预测和监测对业务模式的成功至关重要。传统的信用评分模型在利用大数据技术构建风险模型方面有所欠缺。在本文中,从公共网站、第三方机构和客户贷款申请信息数据中收集了多种格式和大小的数据,并将其组装起来。采用了集成机器学习模型——随机森林模型和XGBoost模型,并使用历史交易数据进行构建和训练,随后使用分离的数据进行测试。XGBoost模型显示了更高的K-S值,表明在这项任务中具有更好的分类能力。从这两个模型中选出的前10个重要特征表明,外部数据如芝麻分、多平台叠加贷款信息和社交网络信息是预测贷款违约概率的重要因素。
作者:Xiaojiao Yu
论文ID:1707.04831
分类:Risk Management
分类简称:q-fin.RM
提交时间:2017-07-18