首发!龙8总区基因宏Hi-C完成图新品亮相!
从宏基因组数据中恢复高质量微生物基因组对于探索微生物组成和微生物表型关联至关重要。
宏Hi-C完成图,使用MetaHi-C技术辅助宏基因组分箱,对ONT宏基因组分箱(Binning)进行优化,得到更多高质量的宏基因组组装基因组(MAG),甚至是宏基因组中不可培养微生物的完成图,从而更好的对宏基因组中不同MAG丰度、系统发育关系及新菌基因组进行深入探讨。同时,基于MetaHi-C互作信号,揭示宿主-质粒/宿主-病毒的潜在关联关系。与此同时,不同处理或环境样本中的MAG,还可以进行变异位点及甲基化研究,以期达到对宏基因组的更深入的解析。
宏基因组分箱是将宏基因组测序得到的混合了不同微生物的序列按物种分开归类的过程,这些分开归类的序列被称为宏基因组组装基因组(MAG)。宏基因组分箱技术有助于获得不可培养微生物的全基因组序列,获得新物种的基因组序列和功能等。
基于染色体空间构象捕获研究的三维基因组技术,能够很好的“绑定”细胞内空间构象彼此靠近的DNA片段。利用MetaHi-C技术开展宏基因组研究,可以基于Hi-C的交联关系,确定来源于同一个细胞的序列,即通过与不同细胞(微生物)相比,来源于同一个细胞(微生物)内的DNA分子互作更强,基于此原理可将来自于同一种微生物的contigs序列聚类到同一个group中,并对group进行物种鉴定。基于宏基因组测序获得单菌的基因组信息,深化宏基因组研究。
其通过菌株内染色体片段间的交互信息对序列进行分类。相较于其他分箱技术,基于Hi-C的binning不仅可以获得更多高质量的MAGs,发现复杂环境样本中的新物种;同时也可以界定环境样品中细菌与质粒和病毒之间的宿主关系,研究复杂微生物组样本中诸如抗生素抗性基因等的宿主来源。目前已有50余篇高水平文章将Hi-C应用于宏基因组研究中。
MetaHi-C可应用于复杂微生物样本中单菌基因组的高质量组装及功能注释,打破难以分离培养单菌的技术瓶颈。在人类肠道数据集上(Du et al., 2022),基于Hi-C的分箱方法HiCBin获得了67个Near-complete MAGs、33个substantially complete和12个moderately complete MAGs,而常规分箱方法MetaBat2只获得了30个Near-complete MAGs、25个substantially complete和22个moderately complete MAGs(下图a);总的来说对比于常规分箱方法,依赖于Hi-C的分箱获得了2倍以上的高质量MAGs,同时总MAGs的数目也达到了常规方法的1.4倍。
其他研究在人类肠道和污水中也得到了类似的结果(Du et al., 2023)。
基于中高质量的MAG进行系统进化树的构建,可推测出属于新菌的基因组。Mantas等在 2023年通过分箱得到了103个HQ-MAG和195个MQ-MAG,其中ENR产生66个环状MAG。经过重组装进一步得到了5个中高质量MAG,包括基于ENR组装得到的Ca. Electronema aureum(ENR-cMAG)、基于BRK得到的新菌Ca. Electronema halotolerans(BRK-cMAG)与基于MAR得到的新菌Ca. Electrothrix laxa(MAR-scMAG)。
Bickhart等于2022年通过对绵羊粪便样品进行高深度的三代宏基因组测序及Hi-C测序,得到了428个完整度超过90%的MAGs,其中包括了44个细菌基因组完成图,确定了1400个完整的和350个部分完整的生物合成基因簇,并且基于MetaHi-C数据,分别确认了424与298个存在潜在关联的宿主-病毒与宿主-质粒。
龙8总区肠道样品实测研究
基于Hi-C的方法得到的高质量的MAGs的数目远大于无Hi-C的分箱方法,并且得到的中高质量的总MAGs数目也较高;同时基于三代测序的宏基因组Hi-C能够获得更多完成图水平的细菌基因组。
使用plasflow共鉴定出1153条质粒的contigs,使用VirSorter2鉴定出454个高质量的病毒contigs,基于Hi-C信号将其关联与高质量的MAGs上,可以了解其对应的宿主信息,如下图(绿色的点表示MAG;红色的点表示鉴定为质粒的contigs;蓝色的点表示鉴定为病毒的contigs)