关于真核生物蛋白质组中的未知蛋白质
摘要:三大真核生物谱系已建立起一个参考系统,以尽可能多样的36个蛋白质组成,来研究大规模的未知蛋白质。随后,对362个真核蛋白质组中没有已知同源物的蛋白质进行了分析,重点关注了无同源物的未知蛋白质。根据Uniprot的数据显示,在给定物种中,这些单体样本中已知蛋白质的比例不超过12\%。此外,由于依赖于同源序列的比对信息,AlphaFold2对它们的三维结构的预测通常是有限的。在后生动物物种中,单体样本的数量似乎随着与参考系统的进化距离的增加而增加。有趣的是,在绿色植物和真菌的情况下,并没有发现这种趋势,似乎单体样本添加到蛋白质组的时间尺度在后生动物和其他真核生物界有所不同。然而,为了确认这一现象,还需要进一步研究更接近参考系统的蛋白质组。
作者:Yves-Henri Sanejouand
论文ID:2209.11001
分类:Genomics
分类简称:q-bio.GN
提交时间:2022-09-23