NAR独家揭秘|RNA-seq与ATAC-seq共探小鼠肝脏染色质重塑,揭示遗传变异深刻影响转录调控
英文标题:Genetic variation is a key determinant of chromatin accessibility and drives differences in the regulatory landscape of C57BL/6J and 129S1/SvImJ mice
发表期刊:Nucleic Acids Research
发表时间:2023.12.12(IF:14.9)
通讯作者:Sami Heikkinen,Faculty of Health Sciences, University of Eastern Finland
研究背景
全基因组关联研究(GWAS)揭示了大量与肥胖等复杂疾病相关的非编码区域单核苷酸多态性(SNP),但对其如何具体影响转录因子结合和基因调控的机制理解仍不充分。通过对比C57BL/6J和129S1/SvImJ小鼠品系间的遗传差异与它们对饮食诱导肥胖及胰岛素抵抗的不同响应,可以揭示基因调控的遗传变异影响。尽管已有案例成功识别了潜在的非编码调控SNP(rSNP),但对于环境因素如饮食如何调节由遗传决定的增强子功能和转录因子结合的研究尚不够深入。
在本项研究中采用了多种测序技术:首先通过ATAC-seq评估染色质可及性;其次利用H3K27ac ChIP-seq鉴定活性增强子;接着采用RNA-seq检测基因表达差异;并通过CTCF ChIP-seq验证活性增强子的定位,并以TCF7L2 ChIP-seq作为代谢相关转录因子作用位点,揭示了小鼠肝脏中候选调控SNPs(rSNPs)的作用机制。
图1 遗传变异在小鼠肝脏调控景观差异中起着关键作用
研究结果
1. 遗传因素在决定肝脏转录组差异上的作用相较于饮食更为显著
高脂饮食下,B6小鼠体重增长明显大于129小鼠,并且B6小鼠的脂肪肝程度更高。通过RNA-seq分析(样本数5-7只/组),研究发现影响基因表达差异的主要因素是品系而非饮食。在8224个差异表达基因(DEGs)中,有大部分(58.3%)为品系特异性,而只有15.6%与饮食有关。两种饮食比较中,约43.0%的品系特异性DEGs是共有的。Panther GO富集分析揭示品系特异性的DEGs主要富集于免疫相关通路,而饮食特异性的DEGs则集中于脂质和肝脏代谢过程。同时受饮食和品系影响的DEGs多与代谢进程相关。
图2 大部分基因的表达差异存在于不同品系之间
2. 加权基因共表达网络分析揭示了B6和129小鼠在代谢基因调控上的差异
为了深入研究基因表达差异背后的生物机制,本研究进行了加权基因共表达网络分析(WGCNA),识别出14个具有显著GO Panther通路富集的共表达模块(M1-M14)。这些模块在不同品系及饮食条件下显示出不同的功能富集特性。
通过利用BisqueRNA反卷积技术和Tabula Muris数据中的细胞类型特异性标记基因分析了肝脏样本的细胞组成。结果显示,肝细胞占主导(约50%),其次是肝窦内皮细胞(约25%-30%)和Kupffer巨噬细胞(约10%)。有趣的是,B6小鼠的肝脏相较于129小鼠拥有更高比例的Kupffer巨噬细胞,同时肝细胞的比例相对较低。进一步对网络模块中的细胞类型标志基因富集情况进行分析发现,B6小鼠肝脏表现出的较高免疫相关基因表达水平可能与其较高比例的Kupffer巨噬细胞有关,而并非由于肝细胞内的转录激活作用增强所致。
图3 基因共表达分析揭示了不同品系在代谢相关基因共表达模块中的差异。
3. 联合分析染色质可及性和H3K27ac ChIP-seq数据,揭示了B6和129小鼠之间活性调控区域的差异
为了研究B6和129小鼠在常规饮食与高脂肪饮食条件下肝脏的染色质可及性差异,进行了ATAC-seq(每组N=5-7只小鼠),识别出大量不重叠的无核小体区域(NFRs),这些区域主要位于启动子和非编码基因组区域。结果发现不同品系间存在大量差异活性区域(strain-DARs),而饮食诱导产生的NFR变化则相对较少。同时,结合H3K27ac ChIP-seq数据,分析得到大量H3K27ac标记的共识区域,并识别出品系特异性和饮食相关的DHARs。
综合分析显示,活跃NFR在增强子识别中的关键作用,ATAC信号与H3K27ac信号在DARs上的正相关性揭示了二者之间的紧密联系。此外,motif富集和ChIP-seq证实,TCF7L2结合位点主要与活跃NFRs重叠。相反,CTCF的大多数结合位点发生在活跃和非活跃NFR之外的区域,有24.0%的非活跃NFR被CTCF所结合,表明CTCF可能扮演转录绝缘子的角色。这些结果共同描绘了由转录因子介导的、在不同品系及饮食条件下调控肝脏功能的复杂染色质景观图谱。
图4 不同品系之间增强子活性和可及性的差异相较于饮食诱导效应更为显著。
4. 差异可及区域富含遗传变异,并与代谢相关性状相联系
研究发现,不同品系小鼠间染色质可及性的差异主要与遗传变异相关。strain-DARs(差异活性区域)更频繁地与SNPs、插入和删除等遗传变异重叠,尤其是高置信度DARs与遗传变异关联更为显著,表明遗传变异对附近染色质可及性有直接影响,并能扩散影响至周围基因组区域。
此外,携带变异的DAR在与代谢和免疫应答相关的QTL中显著富集,尤其是在体重增加这一表型上尤为明显。特别关注来自129和B6品系的QTL时,还发现了这些变异区域与氧化应激和骨密度增加等表型的强烈关联。这些结果强调了遗传变异与染色质可及性之间的紧密联系,并提示有必要深入探究遗传变异如何通过调控染色质可及性进而影响肥胖及相关代谢表型的机制。
图5 差异可及区域富含遗传变异。
5. 差异性TCF7L2结合与染色质景观的差异相关
评估遗传变异与转录因子结合之间的关联发现,尽管TFs的结合可能受到位于与其相似或可能共同作用的其他TFs motif上的遗传变异的影响,但TFs的结合主要还是通过它们自身特异的binding motif来介导的。
接下来研究了差异性TCF7L2结合如何反映在染色质结构上,其中近一半与活跃的非编码RNA基因座重叠,并且这部分通常包含TCF7L2的motif。此外,差异结合区域(DBRs)的变化与染色质可及性和组蛋白修饰紧密相关,反映出整体染色质状态变化对转录调控的影响。
图6 遗传决定的转录因子结合的染色质景观。
6. 差异可及性和组蛋白乙酰化水平可以预测邻近基因的表达情况
本研究通过探究NFRs(无核小体区域)在染色质可及性、组蛋白乙酰化以及TCF7L2转录因子结合与基因表达相互作用的模式,揭示了在多种实验条件下,活跃的NFRs、H3K27ac标记区域和TCF7L2结合位点倾向于聚集在差异表达基因(DEGs)附近。值得注意的是,具有品系特异性的DARs(差异染色质可及区域)主要关联于由遗传决定的strain-DEGs,而非受饮食影响生成的diet-DEGs。此外,本研究还评估了不同数据集对于解释基因差异表达程度的能力,这些发现凸显了在染色质结构层面存在的品系间差异对基因差异表达的核心作用,特别是在调控转录过程和功能通路方面。
图7 差异表达基因(DEGs)与差异可及区域(DARs)、遗传变异以及转录因子结合motif之间的关系。
7. 候选rSNP与DEGs的联合分析揭示转录因子与基因间的调控相互作用
本研究发现活性NFRs(无核小体区域)的差异可及性与基因表达差异之间显著相关,并且这些区域常常包含影响转录调控的motif。通过分析带有破坏motif变异的活性DARs与DEGs之间的联系,我们识别了潜在的调控目标基因,并利用TRRUSTv2数据库确认了部分已知TF-基因相互作用。例如,在Cenpl位点上的rs45630040变异影响了HNF4 α 的结合motif强度,该区域还涉及到两个上调DEGs:Gas5和Dars2,提示这一增强子区域受SNPs调控。
图8 已知的肝脏调节因子及其靶基因的候选rSNPs的示例基因座。
8. 人类eQTL SNPs与肝脏特异性代谢功能相关的候选rSNP基因座
本研究通过将小鼠模型中功能SNPs相关的活跃DARs映射到人类基因组,并结合GWAS和eQTL数据,探索了这些变异可能影响人类代谢性状的机制。基于转录因子-gene对保守性的策略,本研究筛选出了数百个与代谢通路相关的GWAS阳性结果所对应的候选功能性SNPs,为后续深入探究和验证这些SNP的功能性提供了方向。
研究结论
本研究利用C57BL/6J和129S1/SvImJ两种小鼠品系,在常规饮食和高脂肪饮食条件下的比较模型,采用了H3K27ac ChIP-seq、ATAC-seq和RNA-seq等多组学方法来揭示调控变异如何影响TF结合及邻近基因表达。
结果显示,在不同饮食条件下,品系特异性的调控差异比饮食引起的差异更为显著。尤为突出的是,大量具有显著统计学意义的差异可及区域主要由遗传变异决定,并且与差异表达基因紧密相关。此外,实验验证表明,TCF7L2和CTCF这两种TF的结合位点确实受到遗传变异的影响。本研究深入解析了非编码遗传变异如何重塑基因调控网络,并为识别影响TF结合的关键遗传变异提供了有效策略。
参考文献:
Juho Mononen, et al. Genetic variation is a key determinant of chromatin accessibility and drives differences in the regulatory landscape of C57BL/6J and 129S1/SvImJ mice, Nucleic Acids Research, 2023.