InProC:行业和产品/服务代码分类
摘要:通过AI代理预测公司的产业和产品/服务代码可以显著降低成本,并消除人为偏见和错误。由于缺乏标注数据集以及在金融领域内需要高精度的结果,这是一个具有挑战性的问题。在这项工作中,我们提出了一个分层多类产业代码分类器和一个针对性的多标签产品/服务代码分类器,利用无监督表示学习技术的进展。我们展示了如何使用非常有限的标记数据集构建一个高质量的产业和产品/服务代码分类系统。我们对超过20,000个公司的数据集进行了评估,并实现了超过92%的分类准确率。此外,我们还将我们的方法与由专业主题专家提供的350个手动标记的产品/服务代码数据集进行了比较,结果显示了超过96%的准确率,从而在金融领域内实际使用。
作者:Simerjot Kaur, Andrea Stefanucci, Sameena Shah
论文ID:2305.13532
分类:Computational Finance
分类简称:q-fin.CP
提交时间:2023-05-24