文献解读|纳米孔测序揭示冷激活下小鼠棕色脂肪组织转录组的复杂性
文章题目:Nanopore sequencing unveils the complexity of the cold-activated murine brown adipose tissue transcriptome
发表期刊:iScience
发表时间:2023.6
研究背景
可变转录(AT, Alternative transcription)是一种转录后过程,通过转录起始位点变化、可变多聚腺苷酸化和可变剪切等过程从单个基因位点产生多个转录本,从而增加转录和翻译的复杂性。脂肪组织大致分为白色脂肪组织和棕色脂肪组织,并且发挥不同的功能。在冷刺激下,棕色脂肪组织通过上调脂解作用来产生热量。已有研究表明,基因的差异表达影响细胞脂肪产热,此外RNA结合蛋白对差异转录利用(DTU)的调控也在脂肪细胞产热过程中发挥关键作用。目前多数关于可变转录和差异转录的研究均使用Illumina短读长测序,其在isoforms的准确组装及定量方面存在一定问题,因此可以将短读长及长读长测序结合,来改善转录组分析准确性。本研究通过比较了不同建库测序方法在转录本检测、定量和差异表达利用鉴定方面的效果;同时鉴定了在冷激活下小鼠棕色脂肪组织(BAT)中多个发生差异转录利用的isoforms,为研究小鼠脂肪组织可变转录调控提供了基础。
研究结果
1. 不同建库测序方法数据产出比较
选取20周龄的雄性小鼠进行低温处理和室温培养,提取棕色脂肪组织(BAT)的RNA,基于不同的建库方法,分别使用2个cell进行建库测序:(1)无需PCR扩增,基于ONT平台,进行直接cDNA测序;(2)使用特异性引物富集和多重扩增,基于ONT平台构建TeloPrime文库进行测序;(3)混样后,基于ONT平台进行Direct RNA测序;(4)基于Illumina平台构建链特异性文库作为对照进行双端测序。下机数据进行质控过滤后,尽管使用的cell相同,但是不同建库测序方式得到的reads数有所不同,不同条件培养的小鼠棕色脂肪组织样本的reads数量也存在显著差异。此外,同种文库下不同样本和不同cell产生的reads长度分布相似,并且reads的平均质量可能取决于使用的cell。以上结果表明,建库方式不同可能会导致相同的cell产生技术差异(图1)。
图1 不同建库测序方法数据产出的比较
2. 不同建库测序方法转录本覆盖度的比较
使用minimap2将过滤后的reads比对到小鼠的基因组(GRCm38.p6)和转录组(GENCODE M22),结果显示不同方法之间比对率均较高并且相似(表1)。比较不同测序方法对转录本的reads覆盖度发现,直接cDNA测序倾向较短reads,而TeloPrime测序和Direct RNA测序的reads分布更加平均。另外,研究结果表明,随着转录本长度的增加,覆盖度和全长reads的比例显著降低(图2)。
表1 不同建库测序方法数据比对情况统计
图2 不同建库测序方法转录本覆盖度的比较
3. 不同建库测序方法转录本检出率的比较
比较不同测序方法检测基因和转录本的能力,发现直接cDNA测序和Direct RNA测序检测到的feature数量与短读长相似,在任何测序深度下均优于TeloPrime测序。按转录本的长度和类型进行比较可以发现,Illumina测序、直接cDNA测序和Direct RNA测序的检出率随着转录本的长度而变化,并且直接cDNA测序和Direct RNA测序在长链RNA及非编码RNA的检出方面更加具有优势,而TeloPrime测序的检出率较低,与转录本长度呈非线性相关(图3)。
图3 不同建库测序方法转录本检出率的比较
4. Direct RNA测序和直接cDNA测序在定量方面优于TeloPrime测序
RNA测序和cDNA测序在基因水平和转录本水平上表现出较高的相关性,然而,在比较长读长和短读长测序时,情况却有所区别:虽然直接cDNA测序和Direct RNA测序与Illumina测序得到的基因水平的丰度的相关性较好,但是在转录本水平上存在较大差异,推测是同一基因有多个转录本,使得短读长测序reads匹配不够准确(图4)。TeloPrime测序的定量结果与其他方法的结果相关性较低,表明TeloPrime测序定量有所偏颇,可能是测序过程中的PCR扩增导致的。因此可以说明,Direct RNA测序和直接cDNA测序能够更加客观地定量表征转录组。
图4 Direct RNA测序和直接cDNA测序在定量方面优于TeloPrime测序
5. 不同建库测序方法中冷激活小鼠棕色脂肪组织的差异表达基因和转录本分析
对不同处理的小鼠棕色脂肪组织进行测序,比较基于不同测序方法的结果,发现Illumina测序检出的差异表达基因和转录本数量最多,其次是TeloPrime测序和直接cDNA测序,并且上述方法检出大多数的差异表达feature均属于蛋白质编码基因。
随后比较ONT测序和Illumina测序的差异表达基因分析结果,发现Illumina测序得到的差异基因在两种测序方法结果中均低表达。此外,通过ONT测序得到的差异基因在短读长测序和长读长测序方法中表达水平相似,然而同时使用两种测序方法得到的差异基因或转录本在Illumina测序中差异倍数更大。同时,研究发现相较于Illumina测序,TeloPrime测序差异倍数也会更大,说明TeloPrime测序可能放大了差异表达的变化。
图5 不同建库测序方法中冷激活小鼠棕色脂肪组织的差异表达基因和转录本分析
6. ONT长读长测序注释揭示小鼠棕色脂肪组织转录组的新feature
长读长能够准确识别isoforms的能力有助于分析涉及多个外显子的复杂剪接事件。为了揭示小鼠BAT中新鉴定转录本的类型和大小,分别使用两种算法FLAIR和StringTie来鉴定和注释转录本。结果显示StringTie重新注释得到的转录本数量更多,并且无论采用哪种注释算法,直接cDNA测序得到的转录本数量最多,Direct RNA测序得到的转录本数量最少,表明转录本的鉴定受到ONT测序方法的影响。在所有的注释结果中,大多数重新注释的转录本与参考注释完全匹配,而与StringTie相比,在FLAIR注释结果中,新转录本占比第二。在3’端或5’端缺失外显子的转录本(ISM)则是第三大类,值得注意的是,在Teloprime测序的FLAIR注释结果中几乎没有ISM,推测可能是因为建库过程会对全长RNA进行选择性富集。比较不同测序方法的共有注释结果发现,大量转录本要么被两种算法均检测到,要么仅被StringTie注释检测到。有趣的是,在已知的和新的转录本中,可变剪切比可变转录更为常见。因此,可以说明ONT测序方法和组装注释算法的异同会同时影响新转录本的数量和结构。
图6 ONT长读长测序注释揭示小鼠棕色脂肪组织转录组的新feature
7. 差异转录利用(DTU)分析揭示冷激活小鼠BAT基因表达变化
由于可变转录起始位点和可变剪切,差异表达分析在转录本水平往往不够准确和敏感。因此采用DTU分析来鉴定冷激活处理下BAT使用不同转录本的基因,而DTU有效可靠的鉴定取决于转录本准确的定量和注释。与差异表达基因分析相同,使用Illumina测序得到的DTU数量更多,并且可变剪切是驱动DTU的主要机制,其次是可变转录起始位点变化。与室温对照相比,分析发现存在部分BAT基因在冷激活处理中出现显著的isoform转换,其中包括激活产热的磷酸二酯酶4D(Pde4d)和调节产热的酶雄激素依赖性TFPI调节蛋白(Adtrp)。Cars2是线粒体胱氨酸-tRNA合成酶,对线粒体编码基因的翻译非常重要,其同时可以在翻译后的胱氨酸和蛋白质动态硫化中起作用,最终影响线粒体呼吸。将此前的ChIP-seq结果与FLAIR注释相结合,发现Cars2基因从两个不同的启动子进行转录,进而形成完整的转录本(Cars2-FL)和5’端有缺失的转录本(Cars2-AT),进一步研究发现在室温下Cars2-FL启动子占主导地位,而在冷激活处理中,Cars2-AT启动子则会被使用。预测发现两种转录本均可编码成蛋白质,与Cars2-FL完整蛋白相比,Cars2-AT蛋白可能会在N末端缺失244个氨基酸,导致发生截断。在完整的Cars2蛋白N端预测发现存在线粒体定位信号,而在截断的蛋白质则有缺失,进一步预测缺少的部分为与Zn2+和吡啶醛磷酸酯(PLP)有关的保守结合位点,表明其可能存在功能差异。以上说明长读长测序有助于鉴定和定量DTU的生物学相关变化。
图7 ONT差异转录利用(DTU)分析揭示冷激活小鼠BAT基因表达变化
研究结论
本研究以Illumina建库测序方法为对照,比较了三种不同的ONT建库测序方法用于冷激活处理下小鼠棕色脂肪组织的转录本检测、定量和差异表达利用鉴定方面的表现。结果表明纳米孔测序在转录组组装和注释方面优于Illumina测序,可以减少假阳性结果和鉴定发生DTU的isoform,为研究棕色脂肪细胞活性的调控及可变转录在复杂基因调控的作用提供了有效参考。
参考文献:
Engelhard C A, Khani S, Derdak S, et al. Nanopore sequencing unveils the complexity of the cold-activated murine brown adipose tissue transcriptome[J]. iScience, 2023, 26(8).