使用快速组合LARS联合分割多个aCGH剖面

摘要:基于阵列的比较基因组杂交(aCGH)是一种用于搜索拷贝数变异的基因组区域的方法。对于给定的aCGH谱图,一个挑战是将其准确地分割为具有恒定拷贝数的区域。共享相同疾病状态的个体,例如某种癌症,其aCGH谱图通常具有类似的拷贝数变异,这是由于与该特定疾病相关的重复和缺失。我们引入了一种约束优化算法,可以同时分割多个个体的aCGH谱图。该算法同时惩罚了谱图集合从一个恒定拷贝数水平跳转到另一个水平的自由度。已知的基因组位置称为断点。我们证明,由多个不同谱图共享的断点往往会首先被算法发现,即使存在大量噪音。该算法可以被形式化为一个组LARS问题。我们提出了一种极快的方法来找到解决路径,即按照重要性顺序列出共享的断点序列。算法不需要额外的成本,可以将所有的aCGH谱图平滑成拷贝数相等的分段恒定区域,给出原始数据的低维版本。这些可以在单个图上显示出所有谱图,以便直观解释。我们提供了在膀胱癌aCGH谱图上的模拟和算法实现。

作者:Kevin Bleakley (CBIO), Jean-Philippe Vert (CBIO)

论文ID:0910.1167

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2009-10-08

PDF 下载: 英文版 中文版pdf翻译中