泛基因组研究,探秘物种间潜在密码。

泛基因组包括核心基因组(Core genome)和非必须基因组(Dispensable genome)。
其中,核心基因组由所有样本中都存在的序列组成,
一般与物种生物学功能和主要表型特征相关,反映了物种的稳定性;
非必须基因组由仅在单个样本或部分样本中存在的序列组成,一般与物种对特定环境的适应性或特有的生物学
特征相关,反映了物种的特性。针对不同但又相互关联的个体材料进行较高深度测序,
单独进行组装,构建泛基因组图谱,以期获得该物种完整的遗传信息。

因材而为,挖掘品种特异性。

选择不同亚种的材料:可以研究物种的起源及演化等重要生物学问题;
选择野生种和栽培种等不同特性的种质资源:可以发掘重要性状相关的基因资源,为科学育种提供指导;
选择不同生态地理类型的种质资源(不同世系):可以开展物种的适应性进化,外来物种入侵性等热门科学问题的
研究,为分子生态学等学科提供新的研究手段。

科学方案设计

从材料选取,建库测序,到数据分析,
每一步都需要科学、缜密的设计,以保障高质量研究成果。

物种基因组特点 简单基因组 复杂基因组
组装水平 低指标组装 高指标组装 低指标组装 高指标组装
样品要求 DNA总量≥300 μg DNA总量≥300 μg DNA总量≥300 μg DNA总量≥500 μg
建库策略 350 bp,2 Kb,5 Kb 350 bp,2 Kb,
5 Kb,10 Kb
350 bp,450 bp,
2 Kb,5 Kb,10 Kb
350 bp,450 bp,2 Kb,5 Kb,
10 Kb,15 Kb
测序策略 HiSeq PE150 ≥80X HiSeq PE150 ≥100X HiSeq PE150 ≥100X HiSeq PE150 ≥200X
组装指标 Contig N50 ≥10 Kb
Scaffold N50 ≥100 Kb
Contig N50 ≥30 Kb
Scaffold N50 ≥1 Mb
Contig N50 ≥10 Kb
Scaffold N50 ≥50 Kb
Contig N50 ≥20 Kb
Scaffold N50 ≥500 Kb
项目周期 到标准分析8个月;具体情况依据样
品个数而定
到标准分析8个月;具体情况依据样
品个数而定
到标准分析10个月;具体情况依据
样品个数而定
到标准分析12个月;具体情况依据
样品个数而定

信息分析

泛基因组测序是对多个物种进行低/高深度的测序、组装和注释,
通过构建泛基因组图谱,可得到这个物种的全部基因。同时还可
对多个品种进行比较分析,挖掘品种特有的基因以及变异位点,这
些变异位点以及特有基因往往与物种特有的生物学功能有关。

泛基因组 分析内容
组装 Pan-genome构建
组装结果评估
注释 重复序列注释
基因结构注释
基因功能注释
非编码RNA注释
生物学分析 比较基因组分析 基因家族分析
系统进化分析
正选择分析
共线性分析
高级分析 挖掘特有基因
基于组装序列进行变异检测分析

悦读高质量测序数据,尽享HPC澎湃动力

泛基因组采用先进的HiSeq 4000测序平台,快速、高效地读取高质量的测序数据。
诺禾致源高性能计算平台(High Performance Computing,HPC)采用DELL计算节点和Isilon存储的高效组合,
实现快速稳定的测序数据分析及交付。随着公司业务的发展,高性能计算平台将会持续更新并扩容,
以保证高效的数据处理和安全的数据存储。

出色完成每一个项目环节

诺禾致源的基因组合作项目遍布全球,引领基因组研究潮流。
到2015年为止发表的动植物泛基因组高分文章(IF>25)中,有近1/3发表于Science,Nature等
顶级期刊(IF>40),这些发表的泛基因组研究,具有一个共同的特征——组装指标更高,
研究更为全面和彻底。目前泛基因组研究涉及鸟类,陆生/水生等珍稀动物,
昆虫,植物。可见泛基因组研究的地位和重要意义。