细菌基因组测序

结果展示

质量控制

1. 组装前质控

三代测序最基本的优势特征,是其独特的测序读长,因此足够长的测序读长,是保证三代测序组装质量的基础。平均10K以上的测序读长,可以解决绝大部分重复序列,保证了细菌基因组完成图的质量。

2、组装后质控

基因组覆盖的均匀性,也是组装质量的重要指标,测序覆盖越均匀,每个单碱基的重复次数越好,最终结果的准确性也就越高。以三代测序为例,全基因组范围测序数据覆盖是较为均匀的(见下图)。

基因组结构注释

基因组结构注释的结果,通过一系列软件算法,解密基因组结构信息,如编码基因(ORF)、非编码RNA、重复序列、基因岛等基因组基本结构,都是通过基因组结构注释获得的。特别是编码基因的预测,得到了基因组中功能基因编码信息,是后续基因功能注释和致病性研究的基础。

基因功能注释

通过一系列基本功能数据库的注释,
可获得编码基因在不同数据库中的同源信息,以解释编码基因在细菌生理钟的功能。
以KEGG、GO、COG为例,可以在将基因的功能归属到丰富的功能分类中去。

基因组结构总览(限精细图/完成图)

用于展示全基因组范围的基因分布、KEGG、GO、COG等基本基因功能分布、ncRNA分布、
基因组GC含量及GC-skew值分布,可以提供基因组整体信息的总览和概括。

全基因组修饰图(仅完成图提供)

使用PacBio三代测序的数据中,可以根据碱基读取的脉冲信息获得基因组上的碱基修饰信息。
我们的三代完成图可以对这些信息进行收集整理,获得全基因组甲基化修饰情况。

一对一比较基因组研究

通过软件比对分析,可以解析目标基因组和参考基因组之间的共线性关系,并进而检测基因组间的变异。

基因组进化分析

基于多个基因组间的单拷贝基因信息,可以构建菌株间的系统进化树,用于解析菌株之间的进化关系。