全基因组甲基化测序

产品介绍常见问题经典案例结果展示


结果展示

数据质控

严格的质控过程保证数据的质量

测序得到的原始测序序列raw reads,里面含有带接头的、低质量的reads。为了保证信息分析的可靠性,必须对raw reads过滤,得到clean reads,后续分析都是基于clean reads。数据处理的步骤如下:
1.截去低质量reads;
2.截去reads首尾质量低于3或者N(表示无法确定碱基信息)的reads;
3.截去接头污染的reads;
4.舍弃修剪后短于36nt的reads;
5.舍弃不能形成paired的reads。

与参考基因组比对

严格的比对率、覆盖深度、甲基化位点分析

比对率是指比对到参考基因组上的reads数目除以测序获得的clean reads数,是测序获得的有效数据。通过软件比对,进行甲基化位点分析,获得样本中可靠的甲基化位点信息。

甲基化的分布

反应不同样本的不同上下文环境中甲基化的水平

不同序列环境(CpG, CHH, CHG,其中H代表A、C、T)下甲基化位点比例,不同种类物种甲基化的主要环境不同,根据不同环境的甲基化情况判定测序的可信性。而不同样本上的甲基化水平分布,反映了不同样本之间甲基化水平的差异。

甲基化组比较分析

DMR分析

差异甲基化修饰位点(DMS)指在不同样本之间,甲基化修饰水平具有显著差异的胞嘧啶位点。
DMS可以在单碱基分辨率下反映样本之间的甲基化修饰差异,是研究甲基化调控基因表达的基本单位。
差异甲基化修饰区域(Differentially Methylated Region,DMR)
指在不同样本之间,甲基化修饰水平具有显著差异的基因组区域,这些区域在基因表达调控方面发挥重要作用。
基于DMS进行DMR鉴定,DMR的鉴定是分正负链进行的。
利用DMR所在的基因组位置与基因组结构注释信息,对其进行结构注释。

DMR注释结果列表

DMR id chromosome DMR start DMR end Gene id
DMR_DS496108_1408480 DMR_DS496108_1408480 1408480 1408750 CHLREDRAFT_101596
DMR_DS496119_539861 DMR_DS496119_539861 539861 540460 CHLREDRAFT_170025
DMR_DS496108_539824 DMR_DS496108_539824 5289824 5289334 CHLREDRAFT_49544
DMR_DS496133_1264863 DMR_DS496133_1264863 1264863 1265508 CHLREDRAFT_171688

相关基因富集分析

1. GO富集分析

Gene Ontology(GO)是基因功能国际标准分类体系。对相关基因做GO富集分析,可以挖掘DMR调控基因相关的生物学功能,细胞组成,生物学过程。

2. KEGG富集分析

在生物体内,不同基因相互协调行使其生物学功能,通过Pathway显著性富集能确定相关基因参与的最主要生化代谢途径和信号转导途径。

PCA分析

PCA(Principal Component Analysis)又称为主成分分析,常用来强化数据集中的变异,从而发掘其中隐藏的规律。通过对多个样本中基因的功能区不同context下甲基化水平进行PCA分析,以期发现不同处理,不同发育时期样本间的甲基化水平变化规律,是基于多样本(大于9)甲基化水平分析,解释不同处理甲基化的变化规律。