群体进化

产品介绍常见问题经典案例结果展示


结果展示

SNP检测及注释

开发SNP标记,注释及过滤

SNP(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,
包括单个碱基的转换、颠换等。我们采用SAMTOOLS等软件进行群体SNP的检测,
利用ANNOVAR软件对SNP检测结果进行注释。

SNP检测及注释结果统计

Category Number of SNPs
Upstream 203,062
Exonic Stop gain 2,142
Stop loss 564
Synonymous 247,194
Non-synonymous 167,809
Intronic 321,306
Splicing 1,471
Downstream 189,867
upstream/downstream 51,199
Intergenic 986,703
ts 1,256,052
tv 915,265
ts/tv 1.372
Total 2,171,317

CNV检测及注释

开发CNV标记并进行注释

CNV主要是全基因组水平发生的大片段(≥1,000 bp)的duplication或deletion现象,
通过个体的深度测序,基于软件CNVnator以全基因组的深度分布差异情况,来确定CNV发生的区域。

CNV检测及注释结果统计

Category Number of CNVs
Total 1,747
Upstream 107
Exonic 422
Intronic 24
Downstream 53
Upstream/Downstream 17
Intergenic 1,124
Duplication 552
Deletion 1,195

群体遗传多样性分析

科学推测群体亲缘关系

1. 群体进化树分析

系统进化树(phylogenetic tree,又称evolutionary tree进化树)是描述群体间分化顺序的分支图或树,用来表示群体间的进化关系。根据群体的物理或遗传学特征等方面的共同点或差异可以推断出它们的亲缘关系远近。我们采用邻接法(neighbor-joining methods)构建进化树。

2. 群体主成分分析

主成分分析(PCA)是一种纯数学的运算方法,可以将多个相关变量经过线形转换选出较少个数的重要变量。PCA应用到很多学科,在遗传学当中,主要用于聚类分析,它是基于个体基因组SNP差异程度,按照不同性状特征将个体按主成分聚类成不同的亚群,同时用于和其它方法做相互验证。

3. 群体遗传结构分析

群体遗传结构指遗传变异在物种或群体中的一种非随机分布。按照地理分布或其他标准可将一个群体分为若干亚群,处于同一亚群内的不同个体亲缘关系较高,而亚群与亚群之间则亲缘关系稍远。群体结构分析有助于理解进化过程,并且可以通过基因型和表型的关联研究确定个体所属的亚群。

群体选择分析

——连锁不平衡分析

连锁不平衡(Linkage disequilibrium, LD)指群体内不同位点等位基因间的非随机性组合的关系,即当位于同一条染色体的两个等位基因(A,B)同时存在的概率,大于群体中因随机分布而同时出现的概率时,就称这两个点处于LD状态。一般来说,在连锁不平衡分析中,野生种的LD值较低,而驯化种由于受到了正选择的作用,LD值就会偏大。

群体选择分析

——基于SNP的选择消除分析

1. 基于群体分化(Fst)

群体的固定系数F反映了群体等位基因杂合性水平。固定系数F是F统计量(Fst)的一个特例。0≤Fst≤1,Fst越接近1表示亚种群间的种群分化越明显。

2. 基于群体多样性分析

群体θπ值反映了群体基因组碱基多样性。θπ分析,通过以一定大小的窗口(如5 Kb)在基因组上滑动,并对滑动窗口中群体遗传信息的差异(SNP)进行分析。

3. 基于Fst和π的选择消除分析

Fst和π已被证实是一种很有效力地检测选择消除区域的方法,特别是在挖掘与生存环境密切相关的功能区时,往往可以得到较强的选择信号。

群体选择分析

——基于CNV的选择消除分析

除了点突变,CNV(拷贝数变异)也可能在长期的进化过程中受到强烈的选择,
从而基因组受选择区域出现CNV 频率变化的现象,通过比较不同群体的CNV频率差异,
挖掘出进化上受选择的基因区域。采用选择性消除分析参数
RFD(relative frequency difference)进行分析,筛选出显著受选择的CNVs。

种群历史和有效群体大小分析

种群进化动态的探索

有效群体大小(Effective population size,Ne)指与实际群体有相同基因频率方差
或相同杂合度衰减率的理想群体含量,通常小于绝对的群体大小。它决定了群体平均近交系数增量的大小,
反映了群体遗传结构中基因的平均纯合速度,是群体遗传学研究的一个重要内容。
有效群体大小的研究有利于我们更清楚的了解种群进化历史和复杂性状的遗传机制。

基因功能富集分析

候选区域的基因功能分析

完成选择消除分析后,一般会根据GO、KEGG数据库进行功能注释或下载已有的注释文件,
对筛选出的区域进行基因功能富集。