利用持续同调在细胞学数据中确定临床相关特征

摘要:COVID-19患者和健康对照组的非幼稚型CD8+ T细胞蛋白表达中存在系统性的结构差异。我们通过基于决策树的分类器识别感兴趣的蛋白质,并从这些样点随机计算持续图。持续图能够识别细胞图数据集中密度不同的区域,并确定`肘部'等凸起结构。我们计算健康对照组和COVID-19患者的持续图之间的Wasserstein距离,并发现在T-bet、Eomes和Ki-67的表达数据中存在系统性的结构差异。进一步分析表明,在COVID-19患者的非幼稚型CD8+ T细胞中,T-bet和Eomes的表达显著下调,与健康对照组相比。这个反直觉的发现可能表明在COVID-19患者中,典型的效应性CD8+ T细胞不如健康对照组普遍存在。这种方法适用于任何细胞图数据集,通过拓扑数据分析发现否则难以通过标准的分组策略或现有的生物信息工具获得的新见解。

作者:Soham Mukherjee, Darren Wethington, Tamal K. Dey and Jayajit Das

论文ID:2203.06263

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2022-05-04

PDF 下载: 英文版 中文版pdf翻译中