Nature Genetics文献详解|猫科动物单倍型比较基因组为其进化过程中谱系特有的变异提供了新见解
文章题目:Single-haplotype comparative genomics provides insights into lineage-specific structural variation during cat evolution
发表期刊:Nature Genetics(IF=30.8)
发表时间:2023.11
2023年11月,美国德克萨斯农工大学William J. Murphy和密苏里大学Wesley C. Warren小组合作在《Nature Genetics》上在线发表了题为“Single-haplotype comparative genomics provides insights into lineage-specific structural variation during cat evolution”的文章,该文章第一作者为Kevin R. Bredemeyer,通讯作者为Wesley C. Warren和William J. Murphy。本研究组装了五个猫科动物的单倍型基因组,重点关注了猫科动物关键重复序列以及基因家族的进化动态,为探索猫科动物生态位适应表型和结构变异提供了新的见解。
研究背景
猫科动物(Felidae)是一种食肉动物,其物种丰富,分布于全球各种生境,其中大型成员往往是各地的顶级食肉动物。已有的猫科动物比较基因组研究揭示了其物种分化、基因渐渗以及种群变化对遗传多样性的影响,但是此前的比较基因组研究中都缺少与遗传多样性和进化相关的卫星阵列、着丝粒、片段重复(SDs)和复杂基因家族的研究,这些复杂的遗传结构对染色体的功能和物种形成的影响目前尚未报道。
主要研究结果
1.单倍型基因组组装及比较基因组分析
本研究使用亲本的二代数据(~30×)、F1代PacBio HiFi(90-158×)以及Hi-C数据(~78×),使用Canu v1.8(TrioCanu)的trio-binning方法组装了三个F1代杂交个体的单倍型基因组,分别获得了五只猫科动物(家猫,豹猫,乔氏虎猫,老虎,狮子)的六个单倍型基因组(图1a,c)。基因组组装的contig N50 为77-104 Mb,平均每个基因组存在53个gap(图1b表1)。六个基因组中约61%的染色体可以检测到两个端粒。
该研究对六个单倍型基因组进行共线性分析,结果显示染色体结构几乎一致,唯一的染色体变化是两个小的近端染色体(chrF1和chrF2)发生了一次罗伯逊易位(Robertsonian translocation),在着丝粒处融合产生一个中心着丝粒染色体(chrC3)(图1d-g),该变异为新热带虎猫属物种所共有。作者对染色体倒位的统计发现,在相似的进化尺度上类人猿基因组的重排比猫科多7.7倍,表明类人猿基因组在结构上比猫科更容易发生染色体重排(图2a,显示固定倒位数)。
片段重复(SDs)被认为是类人猿分化以来染色体进化和疾病易感性的主要驱动因素。本研究发现每个猫科单倍型基因组中SD的碱基总数占每个基因组的1%~1.5%,而人类T2T基因组的SD频率(7%)是猫科动物基因组的5-7倍。与类人猿相比,猫科动物基因组中染色体重排和较低的SD频率支持了SD总频率是这两个谱系中染色体进化的主要驱动因素的假设。
表1 猫科动物单倍型基因组组装统计
图1 五种猫科动物基因组的组装与共线性比较
2.X染色体上结构变异丰富
该研究发现,猫科动物X染色体上的倒位发生频率比常染色体更高,并且不均匀地富集在一个约45 Mb重组冷点(即低重组频率区域)(图2b, c, d);该区域内固定的X连锁倒位,可能含有有益的等位基因,因为该区域较长且富含编码蛋白质的基因,这可能是支撑猫科动物生殖隔离的一个重要的X连锁超基因座,值得后续进行比较基因组分析。
图2 猫科动物结构变异
3.猫科动物DXZ4基因进化分析
猫的chrX存在哺乳动物唯一的X连锁的物种形成基因- DXZ4。人类DXZ4由一个3 kb串联重复序列组成,每个重复包含一个CTCF结合位点(图3a),而猫科动物的DXZ4是由两个高度分散的重复序列RA和RB组成,RA和RB都包含CTCF结合位点,也都具有拷贝数变异(图3b),拷贝数介导的表达效应可能在物种形成中发挥重要作用。
此外,StainedGlass点图反映了DXZ4序列分化速度(图3c)。对28,312个5 kb窗口进行全基因组间成对遗传差异分析,DXZ4 RA被分到进化速度前0.5%的区域内(图3d),确定了其作为物种形成基因的作用。作者对不同超目的物种的DXZ4序列检索发现,灵长总目动物只有RA或RB,而劳亚兽总目既有RA又有RB,表明RA和RB存在于北方真兽高目最近的共同祖先中。此外,鉴于这种不寻常的进化保守性(CTCF结合位点)以及极快的序列进化速率,作者认为DXZ4可能为维持哺乳动物类群界限发挥了更广泛的作用。
图3 胎盘哺乳动物DXZ4的进化
4.着丝粒结构和大小的变化
作者对着丝粒卫星序列进行注释,发现猫亚科的SINE插入率比豹亚科高约2.7倍,而豹亚科的LINE插入率比猫亚科高约1.6倍;通过已有研究确定猫科动物基因组中的着丝粒序列,猫科着丝粒由一个高度重复的中心卫星阵列组成,主要的重复卫星序列长度为113 bp,比类人猿着丝粒典型的α卫星序列(151 bp)短约25%。对候选卫星阵列进行StainedGlass分析,发现分化程度高的单体位于同一性更高的单体的两侧(图4a)。乔氏虎猫的大多数染色体拥有最大的着丝粒重复序列,chrC3着丝粒区域与祖先的chrF1着丝粒卫星阵列保持高度相似性(图4b)。六个猫科基因组的三对常染色体(B4、D4和E2)着丝粒区域都是gapless的,这可能反映了常染色体着丝粒的卫星阵列复杂性不高。
图4 着丝粒注释和进化
5.感觉超基因家族的进化创新
嗅觉受体基因家族(ORGs)编码探测气味的受体,作者通过高质量基因组量化了功能性ORG和犁鼻器1受体(V1R)基因的基因谱,发现在不同物种间存在较大的ORG拷贝差异(图5a,b),其中猫科动物保留了超70%的功能性ORG,老虎拥有最广泛的功能ORG和最多的II类ORG拷贝数,这可能反映了他们在捕食过程中敏锐的嗅觉和追踪能力,相比之下家猫拥有最少的ORG拷贝,这可能与家养动物的驯化史有关。
渔猫顾名思义有着高水生适应性,它是水生功能性ORG比例(75%)最高的猫科动物之一(图5c)。此外,作者还发现老虎基因组拥有最多功能性V1R位点(图5b),可能归因于老虎探测气味标记等能力,并且老虎和狮子基因组中的基因重复也可能与它们在独居和群居生活中对环境的不同适应性有关。
图5 猫科动物中ORG和V1R基因的进化
总结
本研究通过对3个种间杂交F1代个体的基因组进行trio-binning分型组装,获得了6个gap-less的单倍型基因组,通过比较基因组分析,揭示了猫科基因组的片段重复较少,解释了其显著的核型稳定性。此外该研究发现X染色体是结构变异的热点区域,并且X染色体连锁的DXZ4进化速率较快,表明它在猫科杂交不亲和中的作用。作者通过对感觉超基因家族进行分析,揭示了功能基因拷贝数改变与物种生态形态学适应、社会性和驯化等相关。该研究突出了高质量gapless基因组在研究物种进化及结构变异解析中的重要价值。
参考文献:
Bredemeyer, K.R, et al. Single-haplotype comparative genomics provides insights into lineage-specific structural variation during cat evolution. Nat Genet 55. 2023. //doi.org/10.1038/s41588-023-01548-y