原油价格预测结合新闻文本
摘要:稀疏和简短的新闻标题可能是任意的、嘈杂的和模糊的,这使得经典的主题模型LDA(潜在狄利克雷分配)难以从中发现知识,因为它设计用来处理长文本。然而,一些与基于文本的原油预测相关的现有研究使用LDA来探索新闻标题的主题,导致短文本和主题模型之间的不匹配,进一步影响预测性能。从新闻标题中构建高质量特征的先进方法变得至关重要。为了解决这个问题,本文引入了两个新的指标,用于短且稀疏的文本数据的主题和情感分析。实证实验表明,使用我们提出的文本指标的AdaBoost.RT,能够更全面地观察和表征短而稀疏的文本数据,优于其他基准模型。另一个显著优点是,我们的方法在应用于其他期货商品时也能产生良好的预测性能。
作者:Yun Bai, Xixi Li, Hao Yu, and Suling Jia
论文ID:2002.02010
分类:Statistical Finance
分类简称:q-fin.ST
提交时间:2021-07-02