案例分享 全长转录组测序构建迄今为止最大的人体组织全长转录本变异图谱(Nature, IF=69.504)
该研究使用Nanopore平台的全长转录组测序,开展了迄今为止最大的长reads RNA数据集研究,鉴定了70,000多个注释基因的新转录本,并使用质谱验证了10%的新转录本的蛋白表达。开发了程序包LORALS,通过长reads等位基因特异性分析,解析罕见和常见变异对转录组的遗传效应。此项研究表明使用长reads对转录组进行高分辨率表征将是发现疾病相关变异调控机制的重要途径。
材料选择:来自GTEx项目的90个组织样品和4个K562细胞株。
研究结果:
对来自GTEx项目的90个组织样品和4个K562细胞株进行全长转录组测序和二代转录组测序。从长reads数据获得的基因或转录本的定量与川lumina RNA-seq的高度一致。
使用FLAIR对转录本进行定量分析并鉴定新的转录本,在21,067个基因中发现了93,718个转录本,其中77%是新转录本。在这些新转录本中,47,678个与注释转录本共享至少一个剪接位点,21,620个含有内含子。并使用蛋白质组数据验证了2,575个新转录本。
转录本表达相关性和PCA分析,表明新转录本具有组织特异性表达模式。成千上万的转录本只在一个组织中表达,或者在所有9个组织中有不同的转录率。组织特异性转录本比例最高的组织是小脑半球、肝脏和成纤维细胞(占所有差异表达转录本的8%)。
作者比较了敲除样本和对照样本中的等位基因事件,揭示细胞环境的变化如何改变剪接调控,从而影响遗传变异的分子功能。作者用73,599个转录本补充了GENCODE v.26注释,并使用VEP37从GTEx-WGS数据中重新注释遗传变异。长reads的等位基因数据提供了解释破坏转录调控的罕见变异的证据。
参考文献:
Glinos, et al. Transcriptome variation in human tissues revealed by long-read sequencing. Nature 2022.