转录组数据标准化对生存风险预测的性能评估

摘要:处理效应是转录组数据中一个关键特征,由不同的实验处理方式所引起。各种数据标准化方法被开发出来,以减轻处理效应在差异表达分析中的不良影响。然而,在转录组数据在生物医学研究中的生存结果预测中,很少有研究评估它们的性能。利用同一组肿瘤样本的两个独特数据集,一个带有处理效应,另一个没有,我们开发了一个基准工具,用于在microRNA微阵列上进行这种评估。我们应用这个工具来评估三种流行的标准化方法-分位数标准化,中位数标准化和方差稳定标准化-在使用各种模型构建方法和样本分配设计的生存预测中的性能。我们显示处理效应可能对生存预测产生强烈影响,并且当前实践中最受欢迎的分位数标准化方法往往表现不佳,而中位数标准化和方差稳定标准化则较优。我们通过一个小例子展示了分位数标准化在这种情况下性能差的原因。我们的发现强调了将标准化评估置于下游分析设置中的重要性,以及通过应用中位数标准化来改善生存预测器的开发潜力。我们提供了一个基准工具,用于在与预测建模方法联系起来的其他标准化方法上进行这种评估。

作者:Ai Ni and Li-Xuan Qin

论文ID:2102.04001

分类:Genomics

分类简称:q-bio.GN

提交时间:2021-02-09

PDF 下载: 英文版 中文版pdf翻译中