高度相关数据的Hotelling检验
摘要:基于基因表达集的分析,特别是在寻找两个表型之间的差异表达基因集方面,我们的研究动机得以表达。基因$log_2$表达水平高度相关,并且很可能近似正态分布。因此,对于这样的数据,使用两样本Hotelling检验似乎是合理的。我们发现了一些对测试有意外影响的性质,使其与以前用于这种数据的大多数检验方法不同。似乎Hotelling检验并不总是在所有边缘分布都差异表达时达到最大功效。对于高度相关的数据,只有约一半边缘分布基本不同时,其最大功效才能得到实现。对于相关系数大于0.5的情况,如果只有一个边缘分布发生偏移,Hotelling检验将更有力量,比起所有边缘分布都发生相等偏移的情况。此外,当相关系数增加时,Hotelling检验的功效也会增加。
作者:Peter Bubeliny
论文ID:1007.1094
分类:Other Statistics
分类简称:stat.OT
提交时间:2010-07-08