RNA-seq数据科学:从原始数据到有效解读

摘要:RNA-sequencing (RNA-seq)在过去十年中已成为现代生物学和临床应用中的典范技术。近年来,由于生物信息学社区不断努力开发准确可伸缩的计算工具,它在近年来获得了极大的流行。RNA-seq是一种利用现代测序平台分析样本中RNA含量的方法。它以核苷酸序列形式产生大量转录组数据,称为reads。RNA-seq分析能够探测基因和对应的转录本,这对于回答重要的生物学问题非常关键,比如检测新的外显子、转录本、基因表达以及研究替代剪接结构。然而,由于现代测序技术的局限性,利用计算方法从原始数据中获得有意义的生物学信号是具有挑战性的。需要克服这些技术挑战的需求推动了许多新颖计算工具的快速发展,并随着技术进步的演变和多样化而进一步发展,导致了目前众多的RNA-seq工具。我们的综述提供了从2008年到2020年间RNA-seq技术及235个可用的RNA-seq工具在各个领域的系统概述,讨论了涉及RNA测序、分析和软件开发的跨学科性质的生物信息学。

作者:Dhrithi Deshpande, Karishma Chhugani, Yutong Chang, Aaron Karlsberg, Caitlin Loeffler, Jinyang Zhang, Agata Muszynska, Jeremy Rotman, Laura Tao, Brunilda Balliu, Elizabeth Tseng, Eleazar Eskin, Fangqing Zhao, Pejman Mohammadi, Pawel P Labaj, Serghei Mangul

论文ID:2010.02391

分类:Genomics

分类简称:q-bio.GN

提交时间:2021-02-17

PDF 下载: 英文版 中文版pdf翻译中