生命的边缘:病毒RNA中核苷酸序列的分布
摘要:通过分析病毒RNA中核苷酸序列的分布参数,本研究旨在分析病毒。为了寻求输入数据的同质性,我们只分析单链RNA病毒。获取核苷酸序列采用两种方法:第一种方法是考虑等长的碎片(四个核苷酸)。在第二种方法中,整个RNA基因组被腺嘌呤或最频繁的核苷酸划分为多个部分。研究了两种情况下的等级-频率分布。在第一种方法中,Polya分布和负超几何分布拟合效果最好。对于第二种方法得到的分布,我们计算了一组参数,包括熵、平均序列长度及其离散度。计算得到的参数成为病毒分类的基础。我们观察到,在各种参数对应的平面上,病毒的接近程度与其相关的物种相对应。在某些情况下,不相关物种也可以观察到这种接近程度,因此需要扩大分类中使用的参数集。我们还观察到,在第二种方法中获得的第四个最频繁的核苷酸序列在人类冠状病毒的情况下具有不同的性质(MERS、SARS-CoV和SARS-CoV-2的核苷酸不同,而其他四种冠状病毒的核苷酸相同)。我们期望我们的发现在与病毒引起的疾病的严重程度和传染性相关的RNA病毒分类方面能成为一个补充工具。
作者:Mykola Husev and Andrij Rovenchak
论文ID:2009.09702
分类:Other Quantitative Biology
分类简称:q-bio.OT
提交时间:2022-04-25