长链非编码RNA作为新肽的来源

摘要:长链非编码RNAs(lncRNAs)是指许多缺乏长或保守开放阅读框的转录本,深度转录组测序已经揭示了它们的存在。尽管已经有几种已知功能,在基因表达调控中发挥作用的lncRNAs,但绝大多数lncRNAs的功能尚不清楚。鉴于存在多个物种的核糖体剖面数据,我们检验了一个假设,即它们可能作为新肽段合成的库,并使用人类、小鼠、斑马鱼、果蝇、拟南芥和酵母的数据进行了测试。核糖体保护模式与大量lncRNAs中被翻译的开放阅读框(ORFs)的存在一致。大多数核糖体保护的ORFs长度小于100个氨基酸,通常只覆盖转录本的一半以上。这些ORFs的核糖体密度很高,与3'非翻译区(3UTR)形成鲜明对比,3UTR区域通常没有明显的核糖体结合,类似于真正的蛋白编码基因。使用六核苷酸频率测量,核糖体保护的ORFs的编码潜力显著高于随机选择的内含子ORFs,类似于进化年轻的编码序列。与典型蛋白编码基因相比,lncRNAs中的核糖体保护的ORFs的选择性约束较低,但与年轻蛋白类似。这些结果强烈提示lncRNAs在新蛋白质的进化中起重要作用。

作者:Jorge Ruiz-Orera, Xavier Messeguer, Juan A. Subirana and M.Mar Alb`a

论文ID:1405.4174

分类:Genomics

分类简称:q-bio.GN

提交时间:2014-10-02

PDF 下载: 英文版 中文版pdf翻译中