交叉熵测试允许对t-SNE和UMAP表达进行定量统计比较
摘要:在生物医学科学中,高维单细胞数据的出现需要开发降维工具。t-SNE和UMAP是最常用的方法,可以清晰地可视化高度复杂的单细胞数据集。尽管这些方法普遍存在,并且需要对单细胞数据集进行定量比较,但由于缺乏可靠的统计方法,t-SNE和UMAP主要仍然是数据可视化工具。在本研究中,我们利用Kolmogorov-Smirnov检验对降维数据集之间交叉熵的分布进行了统计检验,以评估降维数据集之间的差异。由于该方法使用单细胞之间的相互关系进行比较,所得到的统计量是稳健的,能够区分真实的生物变异和降维过程中的旋转对称生成。此外,该检验提供了单细胞数据集之间的有效距离,允许将多个样本组织成一颗树状图,以定量比较复杂的数据集。这些结果展示了降维工具在生物医学数据分析中除可视化外的潜在潜力。
作者:Carlos P. Roca1, Oliver T. Burton, Julika Neumann, Samar Tareen, Carly E. Whyte, St''ephanie Humblet-Baron and Adrian Liston
论文ID:2112.04172
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2021-12-09