NC文献详解 | 牦牛基因组结构变异的进化起源
文章题目:Evolutionary origin of genomic structural variations in domestic yaks
发表期刊:Nature Communications(IF=16.6)
发表时间:2023.09
2023年9月《Nature Communications》以"Evolutionary origin of genomic structural variations in domestic yaks"为题在线发表了兰州大学生态学院刘建全教授与中国农科院兰州牧药所阎萍研究员等团队合作完成的研究结果。通过构建牛属图谱基因组,并结合群体数据,获得了牛属物种的高质量结构变异数据集;详细分析了野牦牛、家牦牛和黄牛的高海拔适应、驯化和杂交渐渗,重点研究了家牦牛基因组结构来源的多样性,揭示了家养牦牛基因组结构进化来源的复杂性及其导致的表型变异。
研究背景
牦牛是牛属(Bovini)物种,牛属由其他几种大型家养或野生反刍动物组成,表现出不同程度的杂交繁殖和不同的气候适应能力。野牦牛现在大约有15000只,它们在500万年前就已经适应了青藏高原的环境,国内的家牦牛现在大约有1800万头。牦牛在进化过程中经历了自然选择、人类驯化和种间渗透,这些过程所支持的遗传变异并没有被区分出来。基因组的组装以及泛基因组的构建研究深入能够促进牦牛结构变异以及进化研究,有利于对哺乳动物的极端环境适应性以及复杂驯化机制的探索。
主要研究结果
1.28个牛属物种基因组组装
作者利用三代+二代测序技术结合的方法,从头组装了6头野牦牛和15头家牦牛、2头低海拔亚洲瘤牛、4头高海拔黄牛以及1头高海拔牛-瘤牛-牦牛杂交牛的全基因组序列(表1),这些基因组BUSCO评估平均值在97.4%,平均注释到24,368个蛋白编码基因。将这些数据与已发表的19个牛属动物基因组数据结合成基因组数据集,检测的SNPs用于系统进化树的构建(图1a),以单拷贝核心基因为基础构建物种树(每个种选择一个个体)(图1b),进化树和物种树都与先前的研究结果一致。
构建牛属物种的泛基因组,该泛基因组在基因组个数n = 20时接近饱和,核心基因家族50.18%,近核心基因家族10.91%和可变基因家族38.91%。家牦牛组合平均包含119个野牦牛组合中不存在的基因,其中56个基因通过基因渐渗(图1c-e),功能富集显示这些基因与疾病防御、发育和繁殖相关。
表1 28个牛的基因组组装数据统计
图1 牛属系统发育树及泛基因组构建
2.386头牛属个体的结构变异(SVs)图谱与特征分析
利用47个牛属物种基因组构建了基于图谱的基因组,检测到293,712个SVs ,其中97,258个SVs位于潜在表达调控区,38,090个多等位SVs影响54.4%的相关基因,表明SVs对基因的完整性和表达具有显著的影响(图2)。386头牛属个体重测序(6X),获得了57,432个高质量的SVs(图2a)。
图2 47个牛基因组的图谱基因组及SVs的特征
3.野牦牛特有的SVs与高海拔适应有关
计算野牦牛和近缘低海拔牛之间的群体分化指数(FST)和组间差异指数(ΦST),结果表现出较高的一致性(图3a)。检测到1051个与SVs(FST>1)重叠的基因,功能注释富集在缺氧通路、血管生成、细胞对紫外线应激等反应中(图3b)。
其中野牦牛EPAS1基因有254 bp的插入与LINE1元件重叠(图3c),LINE1和EPAS1 的DNA甲基化已被证明与安第斯人的高海拔适应有关,EPAS1 (HIF2a)是已知的缺氧诱导通路相关基因,这种变异在所有野牦牛中是固定的,但在其他牛中不是(图3g)。肌红蛋白编码基因(MB)的第二个内含子区域都在野生和家养牦牛中出现了155 bp的缺失(MB-hap-1) (图3d, h),MB可能调控着野牦牛和家牦牛对缺氧的适应反应。
此外,还在几个高海拔适应基因中也发现了SVs,如编码与脂肪肝疾病和脂质代谢紊乱相关的转录因子的基因PPARA,细胞凋亡调节基因BCL2,表皮生长因子受体基因EGFR,胰岛素生长因子基因IGF1R等。
图3 SVs对牦牛的高原适应起着重要作用
4.家牦牛的SVs来自牛和白牦牛的起源
利用30头家牦牛和青海高原高海拔黄牛的SVs附近有强关联的SNPs构建进化树,追踪了SVs的物种起源,共鉴定出26,591个SVs参与牦牛和高海拔黄牛之间的基因渐渗。
KIT基因已证实与多种哺乳动物肤色相关,花黄牛中KIT的两个序列易位产生了两个新等位基因,Cs6(6号染色体上)和Cs29(29号染色体上),这些等位基因渐渗导致了牦牛白色被毛性状的出现。花黄牛Cs6等位基因渐渗到有色牦牛6号染色体(Hap2-Cs6),白牦牛的Hap1-SCs6由花黄牛的Hap2-Cs6的三个拷贝组成;牦牛25号染色体上的Wt25/Cs25也可能是由于黄牛的Cs29的基因渐渗(图4e-h)。
图4 由黄牛渐渗KIT基因的易位导致牦牛的被毛呈白色
5.SVs对牦牛驯化的贡献
动物的亲和行为和攻击性抑制是选择驯化的主要目标,作者认为野牦牛和家牦牛之间等位基因频率差异较大的SVs可能与驯化有关(图5a),保留了多个未渐渗的SVs,确定了654个候选驯化基因。发现了与精神分裂症相关的DISC1基因的内含子中277 bp的插入在家牦牛中很常见,但在野牦牛中却很少见(图5b)。野牦牛的VWC2和SNX3的内含子中分别发现了1070 bp和88 bp的固定缺失,在家牦牛中不存在,VWC2调控小鼠神经前体细胞的发生,而SNX3在哺乳动物神经管闭合中起重要作用,还能影响小鼠面部尺寸,这与家牦牛的颅面尺寸比野牦牛小一致。VWC2和SNX3中的SV缺失降低了其表达水平(图5c, d)。
图5 SVs对牦牛的驯化起着重要作用
参考文献:
Liu, X, et al. Evolutionary origin of genomic structural variations in domestic yaks. Nat Commun. 2023.