全基因组关联分析

产品介绍常见问题经典案例结果展示


经典案例

基于GWAS与群体进化分析挖掘大豆驯化及改良相关基因

Resequencing 302 wild and cultivated accessions identifies genes related to
domestication and improvement in soybean

期刊:Nature Biotechnology
影响因子:41.514
发表单位:中科院遗传与发育生物学研究所
发表年份:2015年2月

一、研究背景

大豆是人类和动物油脂和蛋白质的主要来源,现代栽培大豆大约在5000年前由其近亲野生大豆驯化,继而进一步选育而成。鉴定大豆基因组中受驯化和改良的基因对指导大豆育种具有重要意义。

二、方法流程

取材

62个野生大豆,130个地方品种和110个驯化品种构建一个自然群体

建库

构建300bp文库

测序

Illumina HiSeq2000,
平均测序深度11X

分析

1. 群体遗传结构分析
2. 选择消除分析
3. 重要性状的全基因组关联分析

三、研究结果

1. 遗传结构分析

对302株大豆(62个野生大豆,130个地方品种和110个驯化品种)进行高通量测序。采用Illunima HiSeq 2000平台,双端测序PE100,平均测序深度大于11X。共发现979万个SNP,87.68万个InDel,还有1,614个CNV和6,388个大片段缺失。同时以一种苜蓿作为外缘参照物种,构建系统进化树和PCA分析,发现本研究所选大豆明显可以聚成三类——野生、驯化及改良。

2. 选择消除分析

利用XP-CLR方法在驯化阶段(野生大豆—驯化种)鉴定出121个强选择信号,在品种改良阶段(驯化种—栽培品种)鉴定出109个强选择信号。除了SNP,拷贝数变异(CNV)也在驯化过程中受到人工选择。

3. 重要性状的全基因组关联分析

分析结果表明,受选择区域大多都在已经报道过的与驯化相关的QTL区间内。但是,受选择区间比已发现的QTL区间更小更精确。为进一步注释受选择区域,我们针对驯化性状进行了全基因组关联分析,发现针对各驯化性状的全基因组关联分析结果均与前人定位到的区间重叠。

placeholder+image

四、研究结论

大豆是世界植物油脂的主要来源,从基因水平理解大豆的驯化改良对于未来大豆育种提供了重要信息。通过对302株野生大豆、地方品种和驯化品种大豆大于11X深度的高通量测序分析,发现230个受选择区域和162个拷贝数变异。全基因组关联分析表明10个受选择区域和9个驯化性状相关联,发现13个被注释为与油脂、株高等农艺性状相关的位点。与之前QTL定位结果比较分析发现,230个受选择区域中96个与调控油脂的QTL相关,21个区间内包含脂肪酸合成关键基因。此外,还观察到一些性状和位点与地理区域相关联,这表明大豆群体地理结构化。

阅读原文>>