基于计数的RNA测序数据差异表达分析:使用R和Bioconductor
摘要:RNA-Seq在生物学的许多领域中已经迅速被采用用于转录组的分析,包括基因调控、发育和疾病研究。尤其重要的是发现在不同条件下(例如组织、扰动)的差异表达基因,同时可选地调整其他影响数据收集过程的系统因素。这些分析中有一些微妙但关键的方面,如读数计数、生物变异的适当处理、质量控制检查和统计建模的适当设置。文献中提出了几种变体,现有需要有关当前最佳实践的指导。该协议介绍了基于自由开源的R语言和Bioconductor软件的“尖端”计算和统计RNA-Seq差异表达分析工作流程,特别是两个广泛使用的工具DESeq和edgeR。对于典型的小型实验(例如4-10个样本),实际操作时间可以小于1小时,计算时间可以小于1天,使用标准桌面个人电脑进行。
作者:Simon Anders, Davis J. McCarthy, Yunshen Chen, Michal Okoniewski, Gordon K. Smyth, Wolfgang Huber, Mark D. Robinson
论文ID:1302.3685
分类:Genomics
分类简称:q-bio.GN
提交时间:2016-07-26