一个用于具有MGARCH和小交易成本的线性二次组合优化的深度神经网络算法
摘要:固定点算法的分析证明了一种基于多元广义自回归条件异方差设置下最优投资组合均值-方差偏好的强化学习理论, 其中对交易进行了轻微的惩罚。通过在递归强化学习环路中使用神经网络(NN)架构得出了数值解。固定点定理证明了NN逼近误差具有一个与NN参数数量增加而减小的大O界限。交易惩罚的函数形式具有一个参数epsilon>0,该参数控制交易成本的大小。当epsilon较小时,我们可以基于epsilon的幂级数展开实现NN算法。这个展开式具有一个基项,等于具有显式形式的目光短浅解,并且还包括一个我们在强化学习环路中计算的一阶修正项。我们基于展开的算法是稳定的,计算速度快,并输出显示良好测试性能的解决方案。
作者:Andrew Papanicolaou, Hao Fu, Prashanth Krishnamurthy, Farshad Khorrami
论文ID:2301.10869
分类:Computational Finance
分类简称:q-fin.CP
提交时间:2023-02-17