文献解读|茶树泛基因组助力基因挖掘和基因组辅助育种
文献标题:Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia Sinensis
发表期刊:Nature plants
影响因子:18.0
发表时间:2023.11.27
研究背景
茶是世界上最古老的农作物之一,富含多种利于身体健康的化合物,具有重要的经济价值。不同茶树品种的开花时间、叶色、挥发性和非挥发性成分含量等特性均会影响加工后的经济价值。然而茶树关键农艺性状的遗传机制仍不清楚,因此构建核心种质的泛基因组并将其应用于关键经济性状的遗传结构解析,对茶树的遗传育种具有重要意义。
研究思路
研究结果
1. 多个优质茶树品种的从头组装和注释
此研究选择了18个知名的茶树品种进行基因组测序和从头组装,这些品种分布在3个茶树类群中(图1a-b)。此外,加上4个已发表的茶树基因组,总计22个基因组用于本研究的分析。这些茶树基因组组装结果显示,它们的基因组大小相似并且大多数的基因组区域有着高度的一致性。基于这22个代表性茶树品种的新组装,构建了一个图形泛基因组,这些品种代表了茶树广泛的遗传多样性。
图1 选择22个代表性的茶树品种进行泛基因组分析
2. TEs通过介导结构变异(SVs)导致茶树基因组出现大量的非必需序列
高度活跃的转座子(TEs)可能会导致基因组不稳定以及不同茶树基因组之间广泛的SVs的产生。以TGY为参考基因组,与剩余的21个基因组进行比对,共鉴定出887,986个SVs,均匀地分布在15条染色体上(图2a)。这些SVs覆盖了5,959Mb的基因组序列(图2b),约占茶树基因组(约3GB)的200%。5MB滑动窗口分析显示,每个窗口中平均79.8%的SVs与TEs重叠(图2c),这些结果表明SVs和TEs之间存在显著的相关性,TEs在驱动遗传变异中起重要作用。
此外,本研究综合了不同茶树基因组的等位基因,建立了一个包含40,461个代表基因和432,597个等位基因的泛基因集,可细分为core基因(29.8%),shell基因(43.9%)以及private基因(26.3%)三大类(图2d),其中core等位基因显示出更长的CDS长度(图2e)。相比非必需基因,core基因的Ka/ks比例显著下降(图2f)而表达水平更高(图2g),这表明核心基因的功能是保守的。
图2 基于22个从头组装的茶树基因组的SVs检测和泛基因组的构建
3. 结构变异对茶树不同叶色的影响
进一步收集不同叶色茶树品种的转录组和代谢组数据集,探究SVs对叶片颜色的影响。结果发现,白叶品种(AJBC)和金叶品种(HJY)叶片的叶绿素含量较低,而HJY叶片的玉米黄质含量较高,表明这些品种叶色差异与这些途径相关基因的SVs密切相关。不同品种相关基因序列比对结果表明,GluRS、GluTR、ChID和CYP97A3HJY等7个关键酶基因存在多个SVs(图3a-b)。比如,CYP97A3HJY等位基因在不同叶片颜色的样品中表现出不同的突变,这些突变发生在CDS区,包括7个SNP和2个Indel。这些变异会导致CYP97A3HJY等位基因编码蛋白的氨基酸序列发生变化。CYP97A3HJY蛋白结构分析表明,蛋白结构变化会间接影响与底物的结合能力。此外,RNA-seq结果还显示CYP97A3HJY等位基因在HJY中高表达(图3c),推测其对玉米黄质的积累起到重要作用。此外,与花青素生物合成途径相关的基因(MYB114和MYB90)表达水平升高,表明花青素的积累可能导致紫叶品种JMZ和ZJ的叶色呈紫色。这些品种的CsMYB114基因的序列比对显示,CDS区没有明显差异,而在CsMYB114上游约200bp出现了一个LTR/Gypsy插入,此插入仅存在于紫叶品种中(图3f-g),这表明SV可能参与了叶色的调控。
图3 SVs对茶树叶色的调控
4. 泛基因组助力茶树芽萌发时间性状基因的挖掘
泛基因组可以处理分析复杂性状的GWAS,比如该研究针对早期芽萌发(EBF)的这一性状,对155个重测序的个体进行了GWAS分析,鉴定了35个SNP与此性状显著相关(图4a)。3个显著的SNP与一段38.45Mb数量性状位点(QTL)(qSPI4)重叠,这使QTL进一步细化为607kb的基因组区域。通过泛基因组和GWAS的联合分析,发现此位点存在一个与DREB2A-like基因重叠的SV,此基因显示出显著的差异表达。
对不同品种的DREB2A-like等位基因进行比对,发现一个A到C的非同义突变,此突变导致在EBF品种中形成异亮氨酸,而在LBF品种中形成亮氨酸(图4b),由此形成的蛋白质三级结构的改变,可能影响到该基因的功能。此外,基于DREB2A-like CDS序列的系统发育树分析,发现EBF和LBF品种明显分开,这表明DREB2A-like等位基因可能参与调控茶树的EBF性状。
图4 基于泛基因组图谱挖掘茶树芽萌发时间性状相关的关键基因
5. 茶树泛基因组助力基因组学辅助育种
本研究结合代谢组数据和泛基因组数据,鉴定到495个基因(≥1个突变)与儿茶素含量显著相关(图5a)。其中CsCYB-561 (C到T)、CsWDR (G到A)和CsDELLA (A到C)中检测到的单碱基突变与儿茶素含量显著相关(图5b)。此外,本研究发现一个参与调控儿茶素生物合成的关键基因——CsDIOX,在该基因的氨基酸序列中有两个相邻的非同义突变(A-A到G-G),导致丝氨酸残基(S-S类型)被甘氨酸残基(G-G类型)替换,三维蛋白结构预测和底物结合模拟分析表明,G-G类型的结合位点更少,限制了儿茶素的合成(图5c-d)。进一步分析发现CsDIOX位于3号染色体具有合成儿茶素的基因簇中。该基因簇在茶花属中是保守的,并且由6个核心基因组成, 其中CsSCPL4 和 CsSCPL5 与儿茶素的合成密切相关(图5e)。
图5 泛基因组助力基因组辅助育种
结论
该研究对22个具有代表性的茶树品种进行了全基因组测序,并构建了首个茶树泛基因组。通过深入分析泛基因组,挖掘出与茶叶品质等重要农艺性状相关的基因及其变异形式,为理解茶树的生物学特性和进化历程提供了重要参考。此外,该研究有力推动茶树的基因组辅助育种工作,从而更加精准高效的培育高品质的新品种。