RNA-Seq中的生物平均化
摘要:RNA-seq用于测量基因表达已经成为事实上的标准。传统上,RNA-seq实验是通过数学平均的方式进行的 - 它们对来自不同处理组的个体的mRNA进行测序,希望将表型与感兴趣的共享位点的算术读数平均差异相关。或者,可以在测序之前将来自相同个体的组织混合,我们称之为生物平均设计。由于数学平均对所有个体进行了控制,因此它可以控制生物和技术变异。然而,获得的统计解析度是否总是值得额外的成本?为了比较生物和数学平均,我们对统计效率和相对成本效率进行了理论和实证估计。尽管在固定样本大小下效率较低,但我们发现生物平均可以比数学平均更具成本效益。在这个基础上,我们开发了一种差异表达分类器ICRBC,可以检测生物平均样本之间的差异表达基因。在模拟研究中,我们发现生物平均和使用我们的分类器进行的后续分析与现有方法(如ASC,edgeR和DESeq)的表现相当,特别是当个体均匀混合,并且预计大约不到20%的调控基因组会发生差异调控时。在两个技术上不同的小鼠数据集和一个植物数据集中,我们发现我们的方法与edgeR在100个最显著特征上的一致性率超过了87%。因此,我们得出结论,生物平均可能足够控制生物变异的水平,以便可以检测到基因表达的差异。在这种情况下,ICRBC可以以较低的成本实现可靠的探索性分析,特别是当兴趣点在于差异表达最明显的位点时。
作者:Surojit Biswas, Yash N. Agrawal, Tatiana S. Mucyn, Jeffery L. Dangl, Corbin D. Jones
论文ID:1309.0670
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2013-09-05