我国科学家利用人工智能加速葡萄育种,效率提
从中国农科院基因组所官方
然而,要实现精准“设计”,一个基因组数据远远不够。在此基础上,周永锋团队又陆续对包括野生种和栽培品种在内的 9 个二倍体葡萄品种进行测序、组装,得到 18 个端粒到端粒的单倍型基因组,并整合已有的基因组数据,构建了目前首个最全面、最准确的葡萄泛基因组,总长度达 1.43Gb,是单个参考基因组大小的近 3 倍。
为了进一步弄清楚葡萄基因与性状之间的关联,周永锋团队从近万份葡萄品种中选取了 400 多份有代表性的葡萄品种,连续 3 年对包括果穗大小、浆果中代谢物含量、浆果大小和果皮颜色等在内的 29 个农艺性状进行调查,构建了葡萄基因型图谱和性状图谱。在此基础上,周永锋团队利用数量遗传学分析,鉴定到 148 个与农艺性状显著相关的位点,其中 122 个位点为首次发现。研究发现,调控不同性状的位点间存在关联性,如可溶性固形物含量和浆果宽度相关位点邻近。此外,不同葡萄群体之间存在显著分化的区域,这些区域中存在与浆果颜色、果皮涩味、浆果形状、果穗重量、果肉硬度、果实大小等相关的多个性状相关的遗传位点,表明对农艺性状歧化选择促进了酿酒与鲜食葡萄的分化。
全面、准确的基因组数据是精准“设计”育种的基础,而如何深入挖掘这些数据来优化育种策略并指导育种?是智能育种必须回答的问题。在本研究中,研究人员将包含了性状和基因型的数据划分为三个子集:训练集、验证集和测试集。利用机器学习算法解析基因型与性状数据间的复杂网络关系,运用训练数据集构建了首个葡萄全基因组选择模型,研究进一步通过验证集调整模型参数,对模型进行优化,最后测试数据集评估最终模型的性能。研究结果表明,通过这一模型,育种家可以快速准确地评估大量育种材料的遗传潜力,从而更好地选择优良品种。与杂交育种需要根据葡萄成熟后的表型作出判断相比,目前,相关研究成果已申请获批国家发明专利 6 项,已申请国际专利 1 项。