6月22日,我室水稻研究团队联合广西大学、美国堪萨斯州立大学等多所高校合作完成籼稻珍汕97和明恢63的无缺口(gap-free)参考基因组,系统分析了着丝粒结构和位于11号染色体末端水稻抗性相关的结构变异区域。相关研究以“Two Gap-free Reference Genomes and a Global View of the Centromere Architecture in Rice”为题发表于Molecular Plant。
图1:截图
亚洲栽培稻主要分籼稻和粳稻两大类,其中,籼稻占全球水稻产量70%以上,且比粳稻具有更多遗传多样性。过去30年中,籼稻品种ZS97和MH63已成为水稻育种和基因组学重要模型系统,其杂交后代汕优63(SY63)是我国迄今种植面积最广的杂交水稻。本研究以ZS97和MH63为对象,采用高深度HiFi和CLR测序,结合多种组装方法和策略,完成它们无缺口基因组的组装解析,并对新的序列进行了精确注释,为阐明杂种优势机理夯实了基础。
图2:两套无缺口参考基因组的共线性比较
通过比较两个水稻基因组各条染色体上的变异区域,研究团队发现在两者在11号染色体长臂末端存在大量结构变异(SVs),MH63中存在一个820 kb扩展区域(MH-E)和一个860 kb插入区域(MH-I),富含大量抗性相关基因。进一步在15个高质量水稻基因组中比较分析,发现它们均没有同时含有完整的MH-E和MH-I区域,MH63的独特基因组特征可部分地解释其对水稻病害的优良抗性。
研究团队首次定位了水稻完整的着丝粒区域,发现ZS97和MH63不同染色体的着丝粒区长度从0.6 Mb到1.8 Mb不等,差异很大。ZS97和MH63中着丝粒周边区域(着丝粒特异组蛋白CenH3的ChIP-Seq信号富集区)分别含有395和539个non-TE基因,其中约41%的基因转录并在多个组织中表达,而富含CentO重复序列的区域non-TE基因转录比例极低,表明大多数活跃转录的基因位于着丝粒的周围区域。在ZS97和MH63着丝粒区域分别鉴定到40和25个在其他水稻基因组中没有的基因,其中一些基因是这两个基因组所特有的,而有些则是由于其他水稻参考基因组的组装不完整而被遗漏的基因。CentO系统发育树分析表明,相同染色体之间比不同染色体之间的CentO相似性更高,支持CentO序列局部同质化的重复扩增事件模型。对着丝粒结构和基因含量的详细研究,尤其是对功能性着丝粒区的基因及其家族分析,将为解析杂种优势机理提供更全面的基础。
水稻是全世界主要主食之一,也是植物基因组学和育种的模型系统,是近20年前第一个测定基因组的作物。然而,迄今为止所有正式发表的高等生物参考基因组都包含缺口/缺失序列,我校水稻团队早在2020年底即在BioRxiv预印公布了两个籼稻的无缺口参考基因组序列,填补了全球基因组学领域空白。此次正式见刊报道的成果是植物中首例无缺口参考基因组,不仅为全面解析水稻着丝粒的结构和功能提供机会,促进了解植物的基因组结构和功能,而且对利用基因组育种手段培育21世纪农业气候适应性品种具有长期和持久影响。