用机器学习推进调控基因组学
摘要:从DNA序列本身仅仅预测基因表达和表观遗传信号的几种机器学习方法近年来已经被提出。这些模型通常用于推断,并在某种程度上评估关于基因调控的潜在新生物学见解,并且它们在调控基因组学方面取得了非常有趣的进展。本文综述了一些这些方法,从线性模型到随机森林,核方法和更高级的深度学习模型。具体来说,我们详细介绍了可以用于从这些模型中提取新的基因调控假设的不同技术和策略。此外,由于这些潜在见解需要通过湿实验得到验证,我们强调了与提取的假设相关的置信度的重要性。我们回顾了为不同类型的机器学习模型提出的度量这种置信度的程序,并讨论了它们不提供相同类型的信息的事实。
作者:Laurent Br''eh''elin
论文ID:2304.12963
分类:Genomics
分类简称:q-bio.GN
提交时间:2023-04-26