预测基因调控响应的分类方法:酵母应激响应
摘要:基于分类的基因预测响应的新算法 GeneClass。该方法基于以下假设:在简单的生物体,如酿酒酵母,我们可以学习一个决策规则,根据(1)基因调控区域的结合位子子序列("motifs")的存在和(2)实验中调控因子,如转录因子的表达水平("parents"),来预测基因在特定实验中是否上调或下调。因此,我们的学习任务整合了两种定性不同的数据源:跨多个干扰和突变实验的全基因组cDNA微阵列数据以及调控序列中的motif剖面数据。GeneClass不是专注于预测实值基因表达度量的回归任务,而是执行分类任务,即预测+1和-1标签,对应于超过微阵列测量中的生物和测量噪声水平的上调和下调。GeneClass使用Adaboost学习算法,结合一种基于边际的决策树的泛化方法,称为交替决策树。在基于Gasch S. cerevisiae数据集的计算实验中,我们展示了GeneClass方法在预测预留实验中的上调和下调方面具有很高的准确性。我们探索了与环境应激响应相关的一系列实验设置,并找到了已知与特定应激响应途径相关的重要调控因子、结合位点motif和调控因子与结合位点之间的关系。因此,我们的方法提供了预测性假设,建议进行生物实验,并提供了关于基因调控网络结构的可解释见解。
作者:Manuel Middendorf, Anshul Kundaje, Chris Wiggins, Yoav Freund, and Christina Leslie
论文ID:q-bio/0406016
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2007-05-23