南湖新闻网(通讯员 姚梦婷 )1月28日,我室玉米团队在Molecular Plant上发表了题为“GEFormer: a Genomic Prediction Method of Genotype-Environment Interaction in Maize by Integrating Gating Mechanism MLP and Linear Attention Mechanism”的研究论文。该研究开发了一种融合门控机制MLP与线性注意力机制的玉米基因型与环境互作的基因组预测方法GEFormer。

https://doi.org/10.1016/j.molp.2025.01.020
众所周知,玉米、水稻等作物的田间表型是由基因型与环境共同作用的结果。基因组预测算法研究有助于缩短育种周期和提高田间育种效率。然而,现有的方法并未考虑环境对作物生长的影响,导致在多环境实验中基因组预测的效果有待于提升。因此,有必要在基因组预测中考虑基因型与环境的相互作用,进而提高作物田间表型预测的准确率。
我室玉米团队研究开发的GEFormer方法包括三个功能模块,其中,门控机制MLP模块(gMLP)用于局部和全局两个维度提取基因型(SNP)数据特征,进而捕获SNP位点间的长距离依赖关系。时序特征模块(TimeFeatureBlock)通过完全动态卷积(ODconv)融合每天内不同环境因子间的特征,并采用线性注意力机制提取作物生育期内每天之间环境因子的时序性特征。交互门控多层感知器(CrossGatedMLP)用于融合提取的基因型特征与环境特征,进而捕获不同组学数据间隐藏的复杂非线性关系(图1)。

图1. GEFormer模型流程图
结果表明,GEFormer在未测试基因型在测试环境(M1)、未测试环境下测试基因型(M2)和未测试环境下未测试基因型(M3)三种实验方案的多个物种(玉米、水稻、小麦)多套群体的预测准确率优于现有的基因组预测方法。GEFormer可以捕获影响玉米复杂性状的基因型和环境因子特征,在不同环境的预测性能较为稳定,且在不同环境和不同材料的预测中有较好的泛化能力。研究人员利用三个应用场景剖析了GEFormer在真实作物育种中的应用潜力。第一,提出了一种优化训练群体的最优环境组合策略,进而较精准的预测未知环境的表型。基于预测的多环境中的表型值,进而辅助筛选在多环境中高产且稳产的玉米材料(图2)。实验结果表明,GEFormer模型筛选高产材料的准确率远高于随机筛选结果。

图2. GEFormer预测玉米CUBIC1404自交系未知环境中产量的结果分析
第二,在玉米自交系预测杂交种表型方面具有潜力。研究人员基于玉米亲本材料构建训练群体,以及利用杂交F1材料构建测试群体,并将训练群体分为仅用母本材料和父母本材料两种情况进行实验。结果表明,基于父母本材料构建的模型预测杂交种F1群体(6210)株高(PH)、产量(EW)和开花期(DTA)的平均准确率高于仅用母本材料训练的模型。研究人员通过t-SNE将GEFormer不同特征提取层捕获的特征降为2维平面特征,解析不同材料的特征在空间距离中的复杂变化。此外,通过t-test检验解析不同特征提取层捕获的特征对玉米表型影响的显著性进行分析。结果表明通过使用母本和父本数据训练的模型能够捕获基因型、环境因子和基因型-环境交互更复杂的非线性特征,因此预测准确率更高(图3)。最后,通过GEFormer模型实现跨群体预测杂交种的表型,结果表明结合自交系和杂交种材料可以显著提高自交系或杂交种材料的表型预测准确率。

图3. GEFormer不同特征提取层捕获的材料特征的二维可视化和特征-表型(玉米6210群体的产量)的显著性分析结果
综上,该研究从基因型与环境互作的角度,提出了一种融合门控机制MLP与线性注意力机制的基因组预测方法GEFormer。与现有的基因组预测方法相比,GEFormer在不同表型的预测中具有更高的准确性,且在不同环境和材料的预测中具有较好的泛化能力。同时,该研究开展了GEFormer预测未知环境表型的准确率、基于自交系预测杂交种的表型、跨群体表型预测三个场景中的应用,并对预测模型捕获的生物学特征进行了分析。未来可以集成更多群体的数据集,有望突破不同遗传背景群体间的瓶颈。
该研究得到了作物遗传改良全国重点实验室严建兵教授和肖英杰教授的支持、指导和帮助。博士研究生姚州、本科生姚梦婷为论文的共同第一作者,刘建晓副教授为论文通讯作者。课题组王创、李可、郭竣豪等参与了该研究。课题组朱力、丁新茹、谢傲、李全等同学为研究提供了帮助。该研究得到了农业生物育种国家科技重大专项等项目的资助。
审核:刘建晓
论文链接:https://doi.org/10.1016/j.molp.2025.01.020
南湖新闻网链接:https://news.hzau.edu.cn/info/1010/26338.htm