疾病基因组关联分析升级——第一弹

2017-06-09    编辑:诺禾致源

疾病基因组关联分析升级

第一弹

关联分析是通过检测疾病状态与基因变异的相关性,从而寻找特定疾病(或性状)的易感基因或基因区域的研究方法。
关联分析的方法, 为人们打开了一扇通往研究复杂疾病的大门,
将患者(case)与对照组(control)检测出的SNP位点或突变基因进行统计学比较,
避免了低频有害策略需要预先假设致病基因所可能产生的研究者偏见,不预设结果,
找出在统计学上真正阳性的变异位点。

目前,已经有多项顶级研究应用二代测序的关联分析策略发现了疾病的关联基因,充分证明了该研究思路的可行性及优越性。并且,
对于没有control人群数据的关联分析,诺禾致源采用多个数据集,结合多种分析方法,为您提供一套可行的分析流程。

表1 部分关联分析文章列表

病 种 发表时间 测序策略 发表期刊 影响因子 相关基因 链接
II型糖尿病[1] 2016 WGS,WES Nature 38.138 EML4, CENPW etc link
围产期心肌病[2] 2016 TRS NEJM 59.558 TTN and others link
肌萎缩性脊椎侧索硬化症[3] 2015 WES,TRS Science 34.661 EML4, CTBK1 and others link
扩张型心肌病[4] 2015 TRS EHJ 15.064 TTN, LMNA, DSP, etc link
心肌梗死[5] 2015 WES Nature 38.138 LDLR and APOA5 link

关联分析流程

关联分析通常是在具有不同表型的两组个体, 一般为case和control中,基于遗传位点或基因、单体型的频率分布差异,
间接反映该遗传位点或基因可能与疾病或性状存在关联性。

图1 关联分析流程图

关联分析升级点 1

多个control 数据集来源,结合丰富注释信息,让关联分析结果更可靠!

诺禾中国人群系列数据库

Novo-ZhongHua Genomes

诺禾独有的中国人群基因组信息数据
使用测序深度大于30× WGS和100× WES数据
更准确的变异检测

人类外显子数据库饕餮大餐

ExAC

包含60,706个无亲缘关系个体
整合17个国际数据库
可进行人群分层注释

最大规模人群频率数据库

GnomAD

包含了13.8万个人数据
升级版ExAC,补充了WGS数据
注释信息更全面、更丰富

图2 GnomAD和ExAC与其他数据库的比较

关联分析升级点 2

不同的统计检验手段,更好的揭示群体差异位点与疾病关系!

基于基因型的统计、检测及关联分析

单个位点的关联分析关注每个位点的碱基分布频率差异,可以发现群体中可能与疾病相关的突变碱基。同样的,为探索不同群体中的基因型分布差异,以及不同基因型分布与疾病或表型的关联性,我们可以基于位点统计不同群体中的基因型分布情况,根据疾病信息构建不同的统计模型(显性/隐性)进行关联分析,结合不同统计模型的检测结果,揭示差异位点与疾病关系。

图3 关联分析结果展示图Locus Zoom

案例分享

Shared Genetic Predisposition in Peripartum and Dilated Cardiomyopathies
围产期心肌病与扩张型心肌病存在相同的遗传易感性[2]

发表杂志:The New England Journal Of Medicine  |  发表时间:2016.01  |  影响因子:59.558

研究背景

围产期心肌病与扩张型心肌病存在一些相同的临床特点,扩张型心肌病由超过40个基因突变所致,
其中包括编码肌节的肌联蛋白的基因(TTN)。

研究方法

在172例围产期心肌病女性患者中,对43个与扩张型心肌病有关的变异基因进行目标区域测序。
对比了在围产期心肌病患者(172例)、扩张型心肌病患者(332例)和对照人群(60,706例,ExAC数据库)中,
存在这些基因的不同突变类型(无义突变、移码缺失、剪切位点等)的患病率。

研究结果

研究鉴定了围产期心肌病女性患者在的8个基因中存在26个不同的、罕见的截短突变。
围产期心肌病女性患者截短突变的发生率(15%)显著高于对照人群(4.7%),但与扩张型心肌病患者的类似(17%)。
其中,三分之二的截短突变发生在TTN,其存在于10%的围产期心肌病患者以及1.4%的对照人群(P = 2.7×10−10)中;
几乎所有的TTN 变异位于肌联蛋白A带。前人研究曾报道TTN 的7种截短突变存在于特发性扩张型心肌病患者中。
在83例临床特征明显的围产期心肌病女性患者的随访1年中,发现出现TTN 截短突变与其较低的射血分数显著相关(P = 0.005)。

图4 TTN 编码的肌联蛋白及其变异的空间分布

研究结论

研究发现,截短突变的分布在大量的围产期心肌病女性患者与在特发性扩张型心肌病患者中非常相似,
其中TTN 截短突变是最常见的遗传易感性。

参考文献

[1]  Fuchsberger C, Flannick J, Teslovich T M, et al. The genetic architecture of type 2 diabetes.[J]. Nature, 2016, 536.
[2]  Yu-JinWare J S, Li J, Mazaika E, et al. Shared Genetic Predisposition in Peripartum and Dilated Cardiomyopathies[J]. New England Journal of Medicine, 2016, 374(3): 233-241.
[3]  Cirulli E T, Lasseigne B N, Petrovski S, et al. Exome sequencing in amyotrophic lateral sclerosis identifies risk genes and pathways. Science[J]. Science, 2015, 347(6229):1436-41.
[4]  Khan A O, Aldahmesh M A, Meyer B F, et al. Genetics and genotype–phenotype correlations in Finnish patients with dilated cardiomyopathy[J]. European Heart Journal, 2015, 36(34):2327-37.
[5]  Do R, Stitziel N O, Won H H, et al. Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction[J]. Nature, 2015, 518(7537):102.