强化学习与基于深度轨迹的随机控制代理在逐步均值方差对冲中的比较

摘要:数据驱动对冲的两种方法:强化学习和基于深度轨迹的随机最优控制。在离散交易计划下,我们比较了它们在交易成本存在下对欧式看涨期权的表现。在此设置中,股票价格遵循Black-Scholes-Merton动力学,期权的“记账”价格由具有相同参数的Black-Scholes-Merton模型给出。这个模拟数据设置提供了一个“消除噪声”的实验室环境,具备足够简单的特性,可以对这两种方法的优势、特点、问题和限制进行详细研究。然而,该表述是无模型的,可以适用于任何具有可用记账价格的情景。我们认为这项研究是开发、测试和验证自主对冲代理的第一步,并提供了解决各种关注和要求的蓝图。

作者:Ali Fathi and Bernhard Hientzsch

论文ID:2302.07996

分类:Computational Finance

分类简称:q-fin.CP

提交时间:2023-02-17

PDF 下载: 英文版 中文版pdf翻译中