从单细胞数据中表示和提取知识

摘要:单细胞分析是目前研究生物学的最高分辨率技术之一。生成的大型复杂数据集催生了计算生物学的众多发展,特别是统计学和机器学习的应用。该综述试图解释当前最先进分析方法的深层理论概念。从单个细胞、仪器到当前和即将到来的模型都对单细胞分析进行了覆盖。尽管使用了最少的数学和统计,但读者被假设具备单细胞分析工作流程的基本知识或坚实的统计学知识。本综述的目的是传播尚未普及使用的概念,特别是拓扑学和生成过程,以及如何开发新的统计模型来更加捕捉生物学的特征。这引发了关于我们本体论和模型的认识论问题,并且提供了一些指针,说明自然语言处理(NLP)如何帮助我们克服认识单细胞数据的认知限制。

作者:Ionut Sebastian Mihai, Sarang Chafle, Johan Henriksson

论文ID:2304.13084

分类:Genomics

分类简称:q-bio.GN

提交时间:2023-04-27

PDF 下载: 英文版 中文版pdf翻译中