基因表达数据中的多样相关结构及其在改善统计推断中的作用

摘要:微阵列数据中的相关性是研究基因选择过程性能下降的一个严重干扰因素。本文旨在证明微阵列数据的相关结构提供了丰富的有用信息。我们讨论了通过适当地对基因进行排序所揭示的微阵列基因表达数据中的不同相关子结构。这些子结构包括在所有基因对中表达信号的随机比例成正比,隐藏在有序基因三元组中的负相关性,以及与有序基因对相关的弱相关随机变量的长序列。报告的引人注目的规律对生物学有普遍的兴趣,同时对微阵列数据分析的统计方法的理论和实践也有深远的影响。我们以一种用于测试非重叠基因对差异表达的方法来说明后一点。虽然设计用于测试不同的零假设,但与传统的单个基因表达分析方法相比,此方法在控制第一型错误率方面提供了数量级更准确的控制。此外,此方法对技术噪声具有鲁棒性。对相关结构的定量推断有可能将微阵列数据的分析扩展到目前所使用的方法之外。

作者:Lev Klebanov, Andrei Yakovlev

论文ID:0712.2130

分类:Applications

分类简称:stat.AP

提交时间:2007-12-18

PDF 下载: 英文版 中文版pdf翻译中