基于miRNA的肺癌诊断的计算基因组算法:机器学习的潜力
摘要:基于大规模、高通量基因组筛查技术的出现,引入了一系列用于诊断的测试方法。其中,利用miRNA表达水平的测试方法备受关注。基因组学和蛋白质组学现在可以同时提供数百个miRNA的表达水平。然而,为了将实际的诊断工具转化为现实,需要同时开发一种能够解释从单个患者样本生成的大量miRNA表达数据的方法。由于这些数据以数字形式表示,所以必须开发定量的分析方法。统计学方法,如p值和对数折叠变化,可以提供一些洞察力,但首先必须评估每个miRNA测试的诊断效果。本文作者开发了一种基于传统的敏感性和特异性的算法,以及一种现代机器学习算法,并对其在肺癌方面的诊断潜力进行了评估,使用了一个公开可用的数据库。研究结果表明,机器学习算法在准确性方面表现更好(癌组织样本为97%,正常样本为73%),此外还提供了可提供有价值的诊断支持的置信区间。机器学习算法在扩展到更复杂的肺癌亚型诊断以及其他癌症和非癌症疾病方面也具有重要潜力。这两种算法都可以在Github仓库上找到:https://github.com/neerja-g/machine-learning-miRNA.
作者:Neerja Garikipati
论文ID:1610.09423
分类:Genomics
分类简称:q-bio.GN
提交时间:2016-11-08