国自然热点|动植物泛基因组研究思路
泛基因组(Pan-genome)即某一群体全部基因的总称,包括核心基因(所有样本中均存在的基因)、非必需基因(部分样本中存在的基因),以及特有基因(仅在某个样本中存在的基因)。核心基因反映物种稳定性,通常与物种生物学功能和主要表型相关;非必需基因和特有基因一般反映物种特有的生物学特征以及对特定环境的适应性。
在泛基因组研究基础篇中,小编整理了泛基因组研究的发展历程,而构建物种泛基因组图谱,不仅能够得到该物种较为完整的遗传信息,还可以通过测序个体间的基因组比对,获得每个个体或群体样本的基因组变异情况,包括SNP、InDel、SV、PAV等。此外,还可以通过对核心/非核心基因的功能进行比较分析,对物种的表型产生机制进行深入探究。
小编整理了目前已发表的泛基因组文章的研究思路,一起来看看吧~
研究思路:
01
泛基因组样本选择
样本量及样本特性对泛基因组研究的检测效率和完整性有十分重要的影响,随着测序样本数量的增加,鉴定出的新基因数量趋于恒定;而样本亲缘关系的远近、野生种、栽培种的选择,对泛基因组规模以及非必需基因、特有基因的比例有十分重要的影响。
推荐选择10-50个样本,包含具有代表性的野生种、栽培种。能够在不低估泛基因组大小的情况下,包含更多的非必需基因、特有基因。
500份水稻泛基因组、核心基因组、基因家族数量的变化(Wang et al., 2018)
02
样本基因组测序和组装
方案1:推荐选择1个核心样本进行T2T基因组构建,其余样本进行高质量染色体水平基因组构建,以高质量的T2T基因组为参考基因组,其余样本基因组进行比对及变异鉴定,为构建高质量的物种泛基因组提供条件。
方案2:推荐对所有样本进行单倍型基因组构建。
龙8总区基因推荐测序策略:
03
结构变异检测
构建泛基因组的核心是检测个体基因组间的结构变异,了解物种中的SVs变异,对于了解SVs在性状定位和分子育种中的作用至关重要。
32个黍稷基因组中SV鉴定及统计(Chen et al., 2023)
04
泛基因组构建
构建泛基因组的核心是检测个体之间的变异,对所有样本进行基因组De novo组装,通过基因组之间的相互比较来构建泛基因组,并基于变异信息进行图形泛基因组构建。
图谱泛基因组构建的一般过程(Wang et al., 2023)
05
比较基因组研究
很多物种进化和多样性的研究相对较少,而通过泛基因组可以为物种进化与多样性研究提供有力帮助。Liu et al., 2023,从头组装了6头野牦牛和15头家牦牛、2头低海拔亚洲瘤牛、4头高海拔黄牛以及1头高海拔牛-瘤牛-牦牛杂交牛的全基因组序列。作者将这些数据与已发表的19个牛属动物基因组数据结合成基因组数据集,检测的SNPs用于系统进化树的构建,以单拷贝核心基因为基础构建物种树,进化树和物种树都与先前的研究结果一致。
牛属系统发育树及泛基因组构建(Liu et al., 2023)
06
SV-GWAS研究
SV是最主要的遗传力来源。利用单一参考基因组对SV的检测能力有限,而利用图泛基因组的遗传变异,可以将估计的遗传力提高,真正发挥SV的研究效应。Gui et al., 2022基于玉米泛基因组进行SV-GWAS研究发现相比于常用的SNP和插入缺失(InDel)等遗传变异,结构变异能解释更多的表型变异,更有可能是功能变异位点,同时,有37%的结构变异是不能被之前的高密度SNP或者InDel标记所代替的;Li et al., 2023基于番茄泛基因组进行SV-GWAS研究得到同样的结论,21.3%的QTL只能被SV识别。泛基因组与SV-GWAS相结合达到了对图谱式泛基因组的充分利用,充分提高了GWAS的检测能力。
番茄SV-GWAS分析鉴定与果实风味相关信号(Li et al., 2023)
07
基于SV的进化研究
长期以来,结构变异(SV)一直被认为与物种的起源、适应和驯化有关。Jin et al., 2023,通过构建泛基因组和全基因组关联分析解析了结构变异对四倍体棉花栽培种形成与分化的影响。Jin et al., 2023,整合已发表的11个异源四倍体棉花基因组,构建了一个包含2,236倒位, 97,398插入和82,959个缺失的图形泛基因组。其中,有98个大于1Mb的大片段倒位。最大的倒位事件(~32 Mb)位于A06染色体上,毛棉、黄褐棉、达尔文棉和海岛棉(Tanguis、3-79和Pima90)都存在,Hi-C数据也得到验证。此外,在(新海21×Tanguis)的F2群体里,该区域内的重组被抑制。上述结果表明,在棉花种间/种内分化过程中,基因组序列发生了极大的变化,这些变化可能导致了农艺性状、环境适应性的改变、物种的分化。
棉花 Pan-SV 在种群结构和基因组分析中的实用性(Jin et al., 2023)
08
泛基因家族研究
基因家族(Gene family),是来源于同一个祖先,由一个基因通过基因复制或者加倍而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。基因家族一直是比较基因组学研究的常用手段,基于不同物种基因家族基因的具体情况(包括基因成员、结构和功能)的比较,有助于进一步解析不同物种差异的生物学特性(抗逆、发育调控、组织特异性等)。泛基因组的研究中,基于大量同种近缘品种或同属近缘种的基因组,为基因家族结构差异和功能进化研究提供了契机,为近缘物种生物学特性的细致解析提供了基础。Shang et al., 2022,基于水稻泛基因组,构建了水稻泛NLRome,确定了泛NLRs家族基因的共线性,为抗病基因功能和进化研究提供了基础,给群体水平的复杂基因家族或者复杂的染色体区域研究提供了全新见解。
水稻超级泛基因组中NLRs的特征展示(Shang et al., 2022)
09
泛基因组数据库
近年来,随着测序技术的不断提高,测序成本逐渐降低,使一些重要物种的测序数据呈指数级增加,而这些数据中蕴含着巨大的价值,有力的推动了构建物种数据库的新浪潮。物种数据库的构建,能为解答基因组进化、系统发育等问题提供参考,对分子育种具有重要意义。例如柑橘属泛基因组数据库,包括 17 个柑橘品种的 23 个基因组、13 个园艺品种的 4038 个样本(其中 3769 个已发表)的基因表达数据。
//citrus.hzau.edu.cn/(Liu et al., 2022)
10
泛基因组研究技术路线图
泛基因组研究技术路线
小编还整理了目前已发表的泛基因组文章合集,请需要文献包的读者联系当地销售进行领取哟~
龙8总区基因紧跟基因组研究发展趋势,已率先完成T2T基因组、单倍型基因组以及泛基因组的分析研发工作,结合Nanopore及PacBio三代测序平台,已为全球学者提供数千个物种的基因组测序及分析服务。
龙8总区基因基因组研究咨询热线
1.咨询当地所在销售
2.拨打官方电话:027-62435310/15337161420
3.扫码添加下方二维码添加工作人员微信咨询
参考文献:
1. Wang W, et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice. Nature. 2018.
2. Chen J, et al. Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet. Nat Genet. 2023.
3. Wang S, et al. Graph-based pan-genomes: increased opportunities in plant genomics. J Exp Bot. 2023.
4. Liu X, et al. Evolutionary origin of genomic structural variations in domestic yaks. Nat Commun. 2023.
5. Gui S, et al. A pan-Zea genome map for enhancing maize improvement. Genome Biol. 2022.
6. Li N, et al. Super-pangenome analyses highlight genomic diversity and structural variation across wild and cultivated tomato species. Nat Genet. 2023.
7. Jin S, et al. Structural variation (SV)-based pan-genome and GWAS reveal the impacts of SVs on the speciation and diversification of allotetraploid cottons. Mol Plant. 2023.
8. Shang L, et al. A super pan-genomic landscape of rice. Cell Res. 2022.
9. Liu H, et al. Citrus Pan-Genome to Breeding Database (CPBD): A comprehensive genome database for citrus breeding. Mol Plant. 2022.