2019年2月11日,Nucleic Acids Research在线发表了我室殷平教授解析PPR code的最新研究成果。成果论文以“Delineation of pentatricopeptide repeatcodes for target RNA prediction”为题,系统鉴定了PPR code和四种RNA碱基的对应识别关系,并以此为基础,开发了一个PPRCODE server(http://yinlab.hzau.edu.cn/pprcode),该网站可以预测PPR蛋白的重复单元,PPR code以及每一个重复单元和RNA碱基的潜在对应识别关系,为促进PPR蛋白靶标预测及其功能研究奠定了基础。
研究人员介绍,PPR蛋白在植物中是一类非常大的蛋白质家族,在拟南芥,水稻,玉米等植物中有400多个成员。其主要定位于植物线粒体和叶绿体中。PPR蛋白是一类RNA结合蛋白,广泛参与RNA各类代谢,包括RNA剪接,RNA编辑,RNA稳定性,翻译等。PPR蛋白由一系列重复单元组成;典型的P类型重复单元包含35个氨基酸,由一对反平行的螺旋构成。PPR蛋白和RNA的复合物结构揭示了每一个重复单元的第5和35位的氨基酸残基决定了RNA碱基识别的特异性,这两个位置的氨基酸组合也被称作是PPR code。在众多的天然PPR蛋白成员中,有大量的PPR重复单元。而在第5和35位各有20种氨基酸存在的可能性,因此在理论上天然PPR蛋白中有400种PPR code。目前,人们对PPR code的理解数量非常有限,只有7个PPR code对应的RNA碱基比较清楚,这限制了对PPR蛋白识别靶标RNA的预测以及PPR蛋白功能的研究。
为此,研究人员首先对65种陆生植物中P类型PPR重复单元的PPR code的分布频率进行了统计,选取其中62种分布频率高的PPR code进行系统的解析。通过天然PPR蛋白解析这些PPR code和RNA碱基的识别关系非常困难。该团队前期构思了一个人工设计PPR蛋白的策略并以此解析了PPR code识别RNA碱基的分子机制。然而,通过商业合成大量含有重复单元的PPR蛋白难度很大,非常耗时,而且成本高昂。为此,研究人员开发了一个高效的PPR蛋白模块化组装的方法,该方法可以高通量合成PPR蛋白模块,省时省力而且实验成本大大降低。基于此,组装了62个PPR蛋白模块,并进行了大量的表达纯化。然后通过凝胶阻滞实验系统筛选了这62个蛋白和四种RNA靶标的识别关系。并进一步通过等温滴定量热法对这62个蛋白和四种RNA靶标的亲和力进行了相对定量分析。综合以上结果,鉴定了这些PPR code和RNA碱基的对应识别关系。基于此,该团队开发了PPRCODE在线预测网站,其可以对PPR蛋白进行PPR重复单元分析,PPR code提取以及PPR重复单元对应RNA碱基的预测。
据悉,这是殷平教授在解析植物PPR蛋白参与RNA代谢研究领域的系列工作。前期解析了玉米PPR10和RNA复合物结构(Yinet al., 2013, Nature; Li et al.,2014, Journal of Biological chemistry);揭示PPRcode特异性识别RNA碱基的分子机制(Shenet al., 2015, Molecular Plant; Shenet al., 2016, Nature Communications);揭示RNA编辑因子MORF蛋白调控PLS类型PPR蛋白对靶标RNA识别的分子机制(Yanet al., 2017, Nature Plants)。
文章链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkz075/5314021