T细胞受体序列库的生成概率的统计推断

摘要:免疫系统多样性的起源在于VDJ重组对生殖细胞基因组DNA的随机重排。这个过程通过一系列涉及基因选择和基因之间的随机核苷酸插入和缺失的随机分子事件来实现。我们使用人类CD4+ T细胞受体β链可变CDR3区域的大型序列库来推断这些基础生化事件的统计特性。由于任何给定的CDR3序列可以通过多种方式产生,因此无法直接从观察到的序列推断隐藏的重组事件的概率分布;因此,我们开发了一种最大似然推断方法来实现这一目标。为了将生化重排机制的特性与选择的影响分离开来,我们将重点放在T细胞DNA中的非生产性CDR3序列上。我们推断了创建新的T细胞受体基因时发生的各种生成事件的联合分布。我们发现了丰富的相关性图像(以及其缺失),从而揭示了涉及的分子机制。生成事件的统计数据在个体之间是一致的,这表明了一种普遍的生化过程。我们的分布可以预测原始重组过程生成任何特定CDR3序列的概率,从而使我们能够量化T细胞库的潜在多样性并理解为什么某些序列在个体之间是共享的。我们认为使用类似本文中介绍的正式统计推断方法对于量化理解适应性免疫系统多样性的生成和演化至关重要。

作者:Anand Murugan, Thierry Mora, Aleksandra M. Walczak, Curtis G. Callan Jr

论文ID:1208.3925

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2012-11-12

PDF 下载: 英文版 中文版pdf翻译中