基因和基因间DNA序列的统计分析
摘要:基于DNA序列的统计分析主要集中在估计编码和非编码区域的特征,可能允许区分这些区域。在当前的方法中,我们特别关注基因和基因间区域。为了估计这些区域的相关性水平和类型,我们应用了来自非线性时间序列分析的各种统计方法,即元组概率分布、互信息和相同邻居拟合。这些方法经过适当修改以适用于符号序列,并首先在来自已知简单确定性和随机模型的序列上进行验证。然后,它们被应用于{em arabidopsis thaliana}的染色体1的DNA序列。结果表明,DNA序列中存在相关性,但是相关性较弱,基因间序列比基因序列更相关。用伪数据进行的统计检验确立了这些结果。
作者:D. Kugiumtzis and A. Provata
论文ID:q-bio/0404024
分类:Genomics
分类简称:q-bio.GN
提交时间:2009-11-10