Adv Sci文献解读|Direct RNA测序结合LAFITE软件精确鉴定低表达关键转录本
英文标题:LAFITE Reveals the Complexity of Transcript Isoforms in Subcellular Fractions
发表期刊:Advanced Science
影响因子:15.1
发表时间:2023.1
研究背景
转录本在生物体内分布不均匀是一个普遍现象,对转录后调控至关重要,它影响特定细胞结构中蛋白质的积累,对维持细胞的基本生命活动有重要意义。当RNA的亚细胞定位发生异常时,往往与多种疾病的发病机制有关,因此研究RNA分子的亚细胞定位有助于揭示组织发育和疾病发展的潜在机制。然而现有的技术手段在解析RNA分子的亚细胞定位方面尚存局限。Nanopore Direct RNA测序(DRS)技术由于能够直接对RNA进行测序,并检测RNA修饰,为复杂转录组的解析提供了新的可能,尤其是在动态和广泛的RNA修饰在转录本亚细胞定位调控中的核心作用方面。然而,目前尚未有关于使用DRS技术进行亚细胞转录组学分析的报道,特别是在识别低丰度转录本方面仍面临挑战。
针对上述问题,本研究团队开发一种名为“LAFITE”的新的RNA计算方法,并将其应用于4种肺癌细胞系的亚细胞全长转录组分析,旨在精准识别低丰度的关键转录本,以深入探究肺癌形成、发展及转移过程中的潜在机制。
主要研究结果
1. 亚细胞全长转录组测序
对A549, H1975, H358和HCC4006这4种肺腺癌细胞系进行亚细胞分离和DRS测序(图1A)。并通过RT-qPCR验证各细胞系亚细胞成分分离的有效性,结果显示各细胞系的亚细胞组分分离程度较好(图1B)。考虑到DRS测序通量的限制,可能难以捕捉到低丰度转录本,本研究开发了LAFITE流程,以准确鉴定不同的转录本,尤其是提高鉴定低丰度转录本的准确性(图1C)。
图1 使用LAFITE分析亚细胞全长转录组
2. LAFITE性能评估与低丰度转录本检测
通过对SIRV标准品的DRS数据集进行基准测试,以及使用拟南芥和秀丽隐杆线虫等7个生物样本的DRS数据评估LAFITE性能,结果显示,LAFITE在召回率和精度上均优于现有工具,特别是在识别全长转录本和低丰度转录本方面表现卓越(图2A-D和2F-G)。进一步通过RT-qPCR和二代Illumina短读长数据验证了这些由LAFITE鉴定出的低丰度新转录本的真实性(图3A和2F-G)。
图2 LAFIFT性能评估
图3 LAFITE鉴定的低丰度转录本的功能验证
3. 构建全长亚细胞转录组谱
运用LAFITE方法分析了经过亚细胞分离后的DRS数据,揭示了不同亚细胞结构中转录本表达的多样性。通过SQANT13软件将转录本的剪接结构与GENCODE V38数据库进行对比分类,结果显示,大部分转录本能够精确匹配参考注释,从而验证了LAFITE在转录本识别方面的高精确性(图4A)。
进一步比较细胞质和细胞核之间的转录组特征,发现在4种细胞系中,细胞核内转录本的整体长度大于细胞质,但外显子和内含子的长度分布无显著差异(图4F)。此外,细胞核内转录本表现出更多的多聚腺苷酸化位点,导致其3’UTR显著延长。同时也观察到细胞核转录本的整体Poly(A)尾长度大于细胞质(图4I)。这些观察为理解转录本在细胞内不同区域的特异调控及功能差异提供了新的见解。
图4 全长亚细胞转录组生物信息学分析
4. DRS测序分析亚细胞中RNA修饰
本研究通过Illumina短读长数据分析了细胞质和细胞核中不同类型RNA的分布情况。根据转录本在两种亚细胞组分中的相对表达水平,将其划分为细胞质或细胞核富集型。结果显示,mRNA并非均匀分布在细胞质和细胞核之间,而lncRNA在细胞核内显著富集(图5A),且其表达模式具有样本特异性(图5B)。进一步筛选发现,大部分mRNA倾向于在细胞质中高度富集,而lncRNA则主要在细胞核中富集(图5C)。
此外,通过LAFITE分析DRS数据,探索转录本在不同亚细胞组分中的m6A修饰模式。结果显示,细胞质和无显著亚细胞定位特征的转录本,其m6A修饰位点主要富集在终止密码子附近,而在细胞核富集的转录本,其m6A位点则在3’UTR中部显著富集(图5D)。量化每个碱基的修饰率发现,细胞核转录本的m6A修饰率最高(图5E)。这些结果表明m6A修饰存在显著的亚细胞组分差异,可能决定了RNA分子的亚细胞定位。
图5 亚细胞转录组和表观转录组联合分析
5. 细胞质和细胞核中可变剪接事件的特征
使用LAFITE软件对细胞质和细胞核中的可变剪接事件进行了全面注释,并通过SUPPA2软件,将可变剪接事件分成A3、A5和AL等7种类型,其中外显子跳跃(SE)是最常见的类型,而内含子保留(RI)主要发生在细胞核(图6A)。针对RI事件的特征,对其频率、位置分布、长度和GC含量进行深入探究。结果显示,细胞核内的RI事件复杂度相对较高,存在多个RI事件的转录本占比更大(图6B)。位置分析揭示,细胞质中的RI事件倾向于靠近3'端,而细胞核内的RI事件更多地分布在转录本中部(图6C)。此外,细胞核的整体RI事件涉及的内含子长度长于细胞质中的RI事件,同时,含有RI的转录本GC含量低于无内含保留(NRIs)的转录本(图6D-E)。
图6 各亚细胞组分可变剪接事件的特征
6. 各亚细胞组分富集的RI与肿瘤发生相关
本研究通过评估TCGA-LUAD肺癌队列中596个RNA测序数据集中的RI事件的表达量特征(PIR),以探究这些事件对癌症恶化过程可能产生的影响。对比原发性肿瘤和邻近正常组织样本,共鉴定到255个差异表达的RI(图6G)。其中,发现一个新的RI事件,即PLK1基因的第7个RI,该事件产生了一个新的转录本(PLK1-N1),在所有的核组分样品中均有检测到(图6H、I)。进一步分析患者病理阶段与PIR值的关系,结果显示PIR与肿瘤的病理阶段呈现负相关关系(图6J)。Kaplan-Meier生存分析结果也显示PIR值低的患者的生存率和病情发展情况较差(图6K)。以上表明,PLK1第7个内含子的变化可能对肿瘤发生具有重要影响。
结论
综上,本研究利用LAFITE工具系统性地揭示了在亚细胞层面低丰度转录本的多样性和动态变化特性,为深入理解基因表达调控机制、转录后修饰过程以及癌症等疾病发生发展机理提供了重要的新见解和研究方向。
参考文献:
Zhang J, Lin X, Chen Y, et. al. LAFITE Reveals the Complexity of Transcript Isoforms in Subcellular Fractions[J]. Adv Sci (Weinh). 2023 Jan;10(3).
文献链接://doi.org/10.1002/advs.202203480