前沿研究|创新融合:Direct RNA测序携手自适应采样策略,揭示转录组中目标RNA的奥秘
在细胞中,转录组测序所得绝大多数reads通常是丰度较高的转录本,低丰度转录本如长链非编码RNA(lncRNA)及新转录本的检测往往十分困难。本研究采用牛津纳米孔测序技术中的自适应采样策略,在无需生化处理的情况下实现对目标RNA的选择性去除或富集。实验表明,通过自适应采样技术,体外转录的混合RNA中目标转录本的比例提升了22%至30%。应用该技术对不同比例的白色念珠菌(Candida albicans)进行转录组测序,目标转录本的reads数增加了11%至13.5%,同时发现较长且高表达的转录本更易被有效去除,此外还揭示了26个先前未被识别的转录本和剪接异构体,其中17个是已知转录本的反义转录本。
文章标题:Direct RNA sequencing coupled with adaptive sampling enriches RNAs of interest in the transcriptome
发表杂志:Nature Communications(IF=16.6)
发布时间:2024年1月11日
研究背景
近年来,直接RNA测序技术的进步,使研究者能够在无需反转录的情况下实现转录本鉴定和定量分析,其原理是原始RNA分子在电压差的作用下可以按照3′端到5′端方向穿过纳米孔,并将电流信号变化解码为相应的碱基信息和修饰信息,从而全面表征RNA的各种异构体、剪接变体、融合转录本及3′端多腺苷酸化等结构特征及其甲基化修饰情况。然而,由于直接RNA测序的通量低于纳米孔DNA测序,因此对低丰度转录本的检测效率不高。
纳米孔测序的“read until”的功能,可根据需要选择性地测定或跳过特定序列。利用自适应采样策略时,在单个纳米孔中,一旦RNA链的部分序列被检测到并比对上预设的关注序列,可以适时调整电压以排斥不相关的RNA片段,促使纳米孔重新准备接受目标RNA链。这一机制简化并增强了对目标转录本的选择性富集或去除过程。
主要研究结果
1、自适应采样技术能够富集RNA群体中的目标RNA
为了测试自适应采样在直接RNA测序中的应用效果,研究人员首先合成了三种不同的RNA(18S rRNA、β-肌动蛋白和GAPDH),以及牛津纳米孔技术公司的直接RNA测序试剂盒中提供的ENO2 RNA,形成四种RNA的混合池,随后进行文库制备和直接RNA测序。结果显示,自适应采样能够有效富集RNA群体中的目标转录本。
为了优化对低丰度GAPDH RNA的富集,研究者调整了决策时间参数(1秒、3.5秒和6.5秒)。结果显示,较短的决策时间可能导致鉴定的准确性不足,而过长的决策时间则会增加冗余的测序碱基,降低采样效率。在优化条件下,相较于常规批量测序方法,采用3.5秒决策时间时GAPDH序列reads数增加了22%,而在6.5秒决策时间下增长了7%;同时,匹配到GAPDH上的碱基数分别提高了26.5%和8%。此外,该策略对GAPDH的错误拒绝率保持在较低水平,表明自适应采样具有良好的准确性。
图1 纳米孔自适应采样工作流程示意图
2、自适应采样技术可以减少RNA群体中的目标RNA
作者进一步测试了自适应采样在去除高丰度转录本方面的效果。作者选取了ENO2这一最丰富的转录本作为去除目标,在不同的决策时间(2秒至4.5秒)下进行实验。结果显示,从2秒决策时间起,自适应采样成功地降低了ENO2转录本的reads数,从批量测序时的54,580下降到了12,730,与此同时,非ENO2转录本的reads数增加了34%。表明,在适宜的决策时间内,自适应采样技术能够有效地去除高丰度转录本,进而揭示更多关于低丰度转录本的信息。
图2 自适应采样减少目标转录本
3、自适应采样技术能够对转录组中的特定RNA分子进行选择性去除或富集
作者将自适应采样策略运用在白色念珠菌(Candida albicans)的转录组研究中。常规直接 RNA 测序,鉴定到3877个转录本,但其中最丰富的前150个转录本占总测序reads的55%,这显著阻碍了低丰度转录本的有效检测。
图3 自适应采样技术在转录组中富集特定的RNA分子
作者挑选了319个表达量位于第80~90百分位的转录本作为目标,其中包括41个与形态转变和感染过程密切相关的基因,占到全部转录本的5.4%。采用3.5秒决策时间的自适应采样策略,精准地富集了这319个目标转录本,仅1.9%误入拒绝池,体现出高精度的选择性能。尽管富集模式下,目标转录本的绝对reads数未明显增多,但在去除模式中,目标转录本的reads数提高了13.4%。通过去除前述中的150个高丰度转录本,剩余转录组的测序深度提升了11.15%,由此说明这一策略有助于发现新转录本尤其是低表达转录本。实验结果还显示,在自适应采样过程中,较长的转录本更易于被有效去除或富集。
图4 转录组中的较长转录本更易被富集
自适应采样技术能够根据决策时间的设定,有效调整Candida albicans中特定基因ENO2、GAPDH、18S rRNA和ACTB在测序数据中的reads分布。例如,在3.5秒决策时间时,该技术成功减少了ENO2和GAPDH基因在拒绝池中的reads数,实现对目标转录本的有效去除或富集调控。
总结
总之,本研究表明自适应采样技术可以应用于直接RNA测序,不仅能够针对性地富集捕获目标RNA,也能高效选择去除特定转录本,从而提高整个转录组中低丰度转录本的检测效率和覆盖范围。随着该技术的不断改进,未来有望广泛应用于各类转录组中特定RNA的研究。
参考文献:
Wang, J., Yang, L., Cheng, A. et al. Direct RNA sequencing coupled with adaptive sampling enriches RNAs of interest in the transcriptome. Nat Commun 15, 481 (2024).
文献下载链接://www.nature.com/articles/s41467-023-44656-3