变异检测

产品介绍常见问题经典案例结果展示


结果展示

与参考基因组比对

比对率、测序深度、覆盖度分析

样本比对率,指比对到参考基因组上的reads数目除以有效测序数据的reads数据,
反映了样本测序数据与参考基因组的相似性。
测序深度,指比对到参考基因组的碱基总数除以基因组大小;
覆盖度,指被测到的该物种基因组的碱基总数占该物种基因组长度的百分比;
测序深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。

测序深度及覆盖度统计

Name Mapped reads Total reads Mapping Rate (%) Average depth (×) Coverage at least 1 or 4 × (%)
Sample 1 33,715,993 34,903,794 96.60 12.77 97.33 or 94.11
Sample 2 67,686,930 69,676,436 97.14 25.08 98.77 or 95.24

SNP检测及注释

开发SNP标记并进行注释

SNP(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,
包括单个碱基的转换、颠换等。我们采用SAMTOOLS等软件进行个体SNP的检测。
为了降低SNP检测的错误率,选用如下标准进行过滤:
(1) SNP的reads支持数不低于4;(2) SNP的质量值(MQ)不低于20。

SNP检测及注释结果统计

ANNOVAR是一种高效的软件工具,它能利用最新的信息,
对由多个基因组检测出的基因变异进行功能注释。
鉴于ANNOVAR强大的注释功能和国际的认可性,我们利用它对SNP检测结果进行注释。

SNP检测及注释结果统计

Category Number of SNPs
Upstream 203,062
Exonic Stop gain 2,142
Stop loss 564
Synonymous 247,194
Non-synonymous 167,809
Intronic 321,306
Splicing 1,471
Downstream 189,867
upstream/downstream 51,199
Intergenc 986,703
ts 1,256,052
tv 915,265
ts/tv 1.372
Total 2,171,317

SNP检测质量分布

单个样本构建染色体跨度单体型

为了确保样本SNP的可信性,对样本检测的SNP的reads支持数,
质量值(QUAL)和相邻SNP的距离统计累积分布。

SNP突变频谱

全基因组SNP突变可以分成6类。以T:A>C:G为例,此种类型SNP突变包括T>C和A>G。
由于测序数据既可比对到参考基因组的正链,也可比对到参考基因组的负链,
当T>C类型突变出现在参考基因组正链上,A>G类型突变即在参考基因组负链的相同位置,
所以将T>C和A>G划分成一类。

InDel检测及注释

InDel是指基因组中小片段的插入和缺失序列。利用SAMTOOLs检测长度小于50bp的小片段插入与缺失(InDel),然后用ANNOVAR软件对检测出的InDel进行注释。

InDel检测及注释结果统计

Sample CK9 NJ6
Upstream 3,075 30,977
Exonic Stop gain 8 68
Stop loss 1 24
Frameshift deletion 228 1,416
Frameshift insertion 210 1,168
Non-frameshift deletion 244 2,629
Non-frameshift insertion 231 2,627
Intronic 3,091 29,553
Splicing 15 80
Downstream 2,337 23,814
Upstream/Downstream 475 5,161
Intergenic 21,431 181,216
Insertion 14,821 133,095
Deletion 16,538 145,709
Het rate(‰) 0.008 0.589
Total 31,359 278,804

SV检测及注释

SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。可利用BreakDancer软件,进行插入、缺失、倒置、染色体内部迁移、染色体间的迁移的检测,然后利用ANNOVAR进行变异注释。为保证结果的可靠性过滤去掉PE reads支持数小于2的SV结果。

SV检测及注释结果统计

Sample CK9 NJ6
Upstream1561,266
Exonic3392,455
Downstream1101,023
Intronic123889
Upstream/Downstream27189
Intergenic1,1958,915
Splicing06
INS6322,022
DEL1,14011,500
INV1781,221
ITX1901,097
CTX1,3177,286
Total3,45723,126

CNV检测及注释

CNV(拷贝数变异)指基因组片段的拷贝数增加或者减少。可通过CNVnator进行检测,即通过基因组上不同的reads 覆盖深度,判断潜在的拷贝数增加和拷贝数减少,并通过ANNOVAR进行变异注释。

SV检测及注释结果统计

Sample CK9 NJ6
Upstream107240
Exonic4221,421
Intronic2468
Downstream53182
Upstream/Downstream1761
Intergenic1,1243,210
Duplication number5521,522
Deletion number1,1953,660
Duplication length(bp)5,267,10018,373,100
Deletion length(bp)16,177,80046,817,400
Total1,7475,182

基因组结构变异展示

为了形象化展示样本中的结构变异,对数据做如下处理:
1. 对于SNP和InDel,画出其在染色体上的密度分布;
2. 对于SV及CNV,画出它们在染色体上的位置及大小。