泛基因组测序

产品介绍常见问题经典案例结果展示


经典案例

泛基因组测序解析野生大豆遗传多样性与重要农艺性状

De novo assembly of soybean wild relatives for pan-genome
analysis of diversity and agronomic traits

期刊:Nature Biotechnology
影响因子:41.514
合作单位:中国农业科学院作物科学研究所,诺禾致源
发表年份:2014年9月

一、研究背景

大豆是重要的油料和高蛋白粮食兼用作物,而栽培大豆则是由野生大豆经过多年驯化而来。挖掘大豆基因组中优良性状相关基因对于栽培大豆的遗传改良研究具有重要意义,近些年各国家及地区在大豆育种方面一直难以取得突破性进展,主要原因是目前大豆品种的遗传基础比较薄弱,匮乏的基因资源是限制大豆育种研究的关键
大豆的基因组序列虽然在2012年已经公布,许多科学家也通过对大豆进行重测序等研究寻找大豆中主要的遗传变异,但是这些研究都存在一定的局限性,原因是在野生大豆中存在的变异要远高于栽培型大豆。此外基于短Reads与参考基因组进行比对会遗失大量的变异位点,如PAV(Presence-absence variation)和CNV(copy number variation),而这些变异位点往往与农艺性状表型密切相关,因此为了更全面地了解大豆的遗传信息,构建大豆泛基因组图谱是非常有必要的。

二、方法流程

取材

基因组测序:
东北、华北、黄淮、华南、日
本、韩国及俄罗斯的7株亚洲地
区代表性野生大豆品种

建库

小片段库:180bp
大片段库:2 kb
Illumina HiSeq 2000

测序

软件:SOAPdenovo
Contig N50:8~27 Kb
Scaffold N50:17~65.1 Kb
基因组注释:重复序列注释,基因结构注释,基因功能注释,非编码RNA注释

分析

1. 泛基因组构建
2. 变异检测及注释
3. 进化分析
4. 农艺性状基因定位

三、研究结果

1. 组装和注释

7株野生大豆基因组最小为889.33 Mb。最大为1,118.34 Mb,7株野生大豆基因组组装结果contig N50为7.7~26.6 Kb,scaffold N50为16.3~62.7 Kb,平均每个基因组注释出55,570个基因,其中85~90%的基因为全长基因。

2. 泛基因组构建

对7个野生大豆基因组进行比较,发现共有59,080个基因家族(pan-genome),其中48.6%为7个野生大豆共享(core-genome),51.4%则仅存在于个别样本中。

3. 变异检测及注释

以栽培大豆基因组为参考,7株野生大豆分别鉴定出SNP 3.6~4.7 Mb,其中0.12~0.15 Mb位于编码区;InDel 0.50~0.77 Mb,2,989~4,181个导致了移码;大量的变异位点(44~53%)为重测序手段未能识别出的新位点。


3、进化分析

利用670个保守的直系同源基因进行系统进化分析发现,野生大豆与栽培大豆大约在80万年前出现分离;正选择分析发现,栽培大豆受到正选择的基因多与抗旱有关,而野生的大豆受到正选择的基因多与物种适应性相关。同时对大豆进行基因家族分析显示只有48.6%的基因家族在7种野生型大豆中都存在,表明大豆存在较多个体特有的基因家族。

4、野生大豆与栽培大豆农艺性状的遗传基础

控制开花时间相关的基因往往与物种适应新的气候环境有关,通过比较野生大豆和栽培大豆的基因组,鉴定与开花相关的基因家族(如光受体PHYA家族),发现在栽培大豆和野生大豆中较多与开花相关的基因出现功能缺失,但是缺失的类型却不同。

placeholder+image



四、研究结论

通过测序分析7株野生大豆基因组,发现它们共有59,080个基因家族(pan-genome),48.6%为7个野生大豆共享(core-genome),51.4%则仅存在于个别样本中;分别鉴定出SNP数量为3.6~4.7百万个,其中0.12~0.15百万个位于编码区;InDel数量为0.50~0.77百万个,2,989~4,181个导致了移码;大量的变异位点(44~53%)为重测序手段未能识别出的新位点,这些基因和位点与抗逆、抗病、花期、产油量和高度等重要农艺性状相关。

阅读原文>>