NGS 样本的单碱基错配分析
摘要:基因测序样本的预处理流程中,其单碱基错配集合是最早的结果之一,与正确对齐的读取数量一起。这两个集合的并集提供了一个4x4矩阵(称为Single Base Indicator, SBI),代表了样本及其预处理成分(如测序仪、对齐软件、流程参数)的蓝图。在本文中,我们证明,在相同技术条件下,SBI与样本的生物性质之间存在强关联。为了达到这个目标,我们需要引入一种SBIs之间的相似度度量:我们还展示了机器学习中常用的两种度量在这个背景下的帮助作用。
作者:Marco Chierici and Giuseppe Jurman and Marco Roncador and Cesare Furlanello
论文ID:1109.1108
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2011-09-07