利用分类方法预测遗传调控响应

摘要:学习基于分类的新方法,用于预测基因调控反应。基于在简单生物体(如酿酒酵母)中学习决策规则的假设,我们可以预测基因在特定实验中是否上调或下调,该决策规则基于基因调控区域中结合位子亚序列(“motifs”)的存在以及实验中转录因子等调控因子的表达水平(“parents”)。因此,我们的学习任务整合了两种不同的数据来源:多个扰动和突变实验中全基因组的cDNA微阵列数据以及调控序列中的motif数据。我们将预测实数值基因表达测量转化为预测+1和-1标签的分类任务,分别对应于微阵列测量中超过生物和测量噪音水平的上调和下调。所采用的学习算法是基于边缘的决策树的增强,交替决策树。这种大边缘分类器足够灵活,可以处理复杂的逻辑函数,并且足够简单,可以揭示基因调控的组合机制。我们观察到在基于Gasch S. cerevisiae数据集的实验中有令人鼓舞的预测准确性,并且我们展示了我们可以在预留实验中准确预测上调和下调。因此,我们的方法提供了预测假设,建议生物学实验,并提供了对遗传调控网络结构的可解释洞察。

作者:Manuel Middendorf, Anshul Kundaje, Chris Wiggins, Yoav Freund, Christina Leslie

论文ID:q-bio/0411028

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中