使用Bio-LDA在最近的PubMed文章中发现复杂的生物关系
摘要:生命科学中可获得的大量学术文献对于科学家想要跟上与其研究相关的重要进展提出了重大挑战,但也为发现有关基因、疾病、化合物及其之间相互作用的最新信息提供了有用的资源。在本文中,我们描述了一种称为Bio-LDA的算法,它利用提取的生物术语来自动识别潜在主题,并提供各种度量来揭示主题和生物术语之间可能的关系。使用这些方法鉴定出的关系与生命科学数据集中的现有数据相结合,以提供额外的见解。通过三个案例研究,我们展示了Bio-LDA模型的实用性,包括关联预测、关联搜索和连接图生成。这种综合方法为在包括目标识别、引物跳跃和药物再利用在内的许多生物学领域的知识发现提供了新机会。
作者:Huijun Wang, Ying Ding, Jie Tang, Xiao Dong, Bing He, Judy Qiu, David J. Wild
论文ID:1103.5181
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2011-03-29