进一步分析包含GD和GX穿山甲冠状病毒的宏基因组数据集,表明广泛污染,削弱了穿山甲宿主归属。

摘要:研究SARS-CoV-2相关冠状病毒(SARS2r-CoV)感染的唯一除蝙蝠之外的动物是穿山甲。在2020年初,多篇论文报道了在穿山甲中发现的感染GD和GX两个SARS2r-CoV的克隆。然而,支持穿山甲基因组组装的RNA-Seq数据集广泛受到污染,包含合成载体或被大量富集或过滤,仅剩下少量冠状病毒序列。在这里,我们研究了由Li等人提供的支持穿山甲在广东感染GD PCoV的两个粪便样本的测序结果,并发现读取分布与PCR引物污染和SARS-CoV-2污染一致,进一步确认了合成质粒序列的存在。我们还在Lam等人(2020年)的数据集GX/P3B的基础上进行了进一步分析,这是唯一一个由Lam等人(2020年)测序的非富集/过滤的穿山甲组织数据集。我们发现了合成载体,并证实了数据集中的人类基因组来源样本。最后,我们发现了所有穿山甲器官数据集中的人类线粒体序列,以及由Liu等人(2019年)测序的选定穿山甲器官数据集中的鼠和老虎线粒体序列。我们推测,人类和鼠的基因组来源序列可能源于测序之前的污染,而老虎源序列的污染可能是由于测序过程中的交叉污染。这些观察结果对于将穿山甲归因为SARS2r-CoV宿主的数据集是有问题的。我们在这里开发和使用的法医学方法可以应用于检查任何第三方SRA数据集。

作者:Adrian Jones, Steven E. Massey, Daoyu Zhang, Yuri Deigin and Steven C. Quay

论文ID:2207.03288

分类:Genomics

分类简称:q-bio.GN

提交时间:2022-07-12

PDF 下载: 英文版 中文版pdf翻译中