SARS-CoV2高频率编码过早截断蛋白的无意义峰基因

摘要:新冠病毒(SARS-CoV-2)的复制是一个容易出错的过程,最终可能产生一定比例无功能的受损蛋白质副本。例如,在RNA错误复制之后,可能出现一个非常早期的终止密码子(UAG,UAA,UGA),编码为一个过早截断(无意义突变)的刺突蛋白。 在通过细胞感染的自然病毒复制过程中,无意义基因组会被病毒的校正酶修复,受到自然选择的严重惩罚,并且被宿主细胞的mRNA监测机制判处极短的寿命。然而,对于长度为1273密码子的非常长的刺突基因组来说,即使每个核苷酸的低突变率存在,截断的非功能性刺突蛋白仍有可能以高频率发生。 本文提供了一种对SARS-CoV-2刺突序列进行高保真后加工的方法:在来自患者的离体样本中,由于插入/删除导致截断(无意义突变)刺突基因组序列的比率令人印象深刻地高达26%,而在体外细胞培养中仅为9.7%。 同时也对人工合成的SARS-CoV-2刺突基因组进行了潜在高截断刺突蛋白序列的警告,这些基因组没有相关的自然校正/选择,可能包括疫苗制备过程。 最后,提出了一种基于截断和“正常”基因组之间比率的度量标准,作为一种潜在的独立于宿主的变异观察工具,能够分类新的刺突突变的传染性。

作者:Alessio D'Alessandro

论文ID:2105.10074

分类:Genomics

分类简称:q-bio.GN

提交时间:2021-06-08

PDF 下载: 英文版 中文版pdf翻译中