多项研究整合脑癌转录组揭示器官级别的分子特征
摘要:藉由丰富的转录组数据,我们研究了仅基于分子数据就能同时分离出所有这些脑癌的可行性。这些特征基于本文中报道的一种新方法,导致了一个包含44个独特基因的脑癌标记物组合。其中许多基因与所研究的脑癌具有相关性,而其他基因在癌症生物学中也有已知的作用。对于来自多个来源的大规模数据的分析必须处理与不同发表研究之间的异质性相关的重要挑战,因为观察到个别研究之间的变异往往对转录组的影响大于表型差异,这是典型的情况。我们发现,在多个数据集上学习特征能够大大提高在真正独立的验证集上的预测性能的再现性和准确性,即使保持训练集的大小不变。这很可能是因为元特征包含了来自不同来源和条件的更多异质性,并通过重复的表型全局特征放大信号。当从所有当前可用的微阵列数据构建脑癌的分子特征时,发现90%的表型预测准确度,即从所有表型中识别特定脑癌的准确性。展望未来,我们讨论了我们的方法在将来从外周液体(如血液)中开发器官特异性的分子特征的背景下。
作者:Jaeyun Sung, Pan-Jun Kim, Shuyi Ma, Cory C. Funk, Andrew T. Magis, Yuliang Wang, Leroy Hood, Donald Geman, and Nathan D. Price
论文ID:1308.0551
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2013-08-05