重新考虑基因组词频的重要性

摘要:DNA词在基因组序列中的分布可以主要通过双Pareto对数正态分布来描述,这解释了在所有已知基因组中发现的对数正态和幂律特征。这样的分布可能是完全随机序列演化通过复制过程的结果。基因组词频的参数化可以评估频繁或罕见的序列基序的重要性。

作者:Mikl''os CsH{u}r"os, Laurent No''e and Gregory Kucherov

论文ID:q-bio/0609022

分类:Genomics

分类简称:q-bio.GN

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中