利用机器学习模型预测头颈部鳞状细胞癌的生存情况

摘要:头颈部鳞状细胞癌(HNSCC)是一种最令人苦恼的癌症类型,导致急性疼痛,影响言语和基本的生存功能,如吞咽和呼吸。尽管在手术和放射治疗方面取得了进展,HNSCC患者的发病率和死亡率并未显著改善。高死亡率可能归因于临床结果的复杂性和显著变化。因此,提高癌症生存预测的准确性非常重要。到目前为止,已经提出了几种HNSCC癌症生存预测模型。在本研究中,将基因组数据(全外显子测序)与临床数据集成,以提高预测模型的性能。使用多重分形分析(MFDFA)算法处理每位患者的体细胞突变,并将分形维数(Dq)的参数值与临床数据一起用于癌症生存预测。特征排名证明新的工程特征是预测模型中的重要特征之一。为了提高模型的性能指标,还调整了所考虑的所有分类器的超参数。实施了10折交叉验证,XGBoost(98%的AUROC,94%的精确度和93%的召回率)证明是最佳的模型分类器,其次是随机森林(93%的AUROC,93%的准确度和93%的召回率),支持向量机(84%的AUCROC,79%的精确度和79%的召回率)和逻辑回归(80%的AUROC,77%的精确度和76%的召回率)。

作者:Saurav Mandal, Akshansh Gupta and Waribam Pratibha Chanu

论文ID:2105.07390

分类:Genomics

分类简称:q-bio.GN

提交时间:2021-05-18

PDF 下载: 英文版 中文版pdf翻译中