生物信息学课程101计划疾病的遗传关联研究Bioinformatics疾病遗传关联研究路V线异质性识别解析与应用风险基因定位加性非加人群遗传精准性效遗传因果人群分子队列机制分型差异效应应检定位差异治疗收集解析检测测致病基因功能注释易感基因基因组病例人群常见变异显性效应基于数据药物反应组学共定位多组学遗传风险对照人群罕见变异上位效应基于注释遗传相关性疾病遗传关联研究1616
生物信息学 课程 Bioinformatics 疾病的遗传关联研究 16 16 ➢ 疾病遗传关联研究路 线
生物信息学课程101计划疾病的遗传关联研究一人群队列收集Bioinformatics>人群队列收集通过测定疾病人群队列和对照人群2O队列的基因组序列,进而比较不同表型人群的遗传变异差异,是准确0.00.050PC1鉴定致病遗传因素的重要手段。选取遗传背景相匹配的病例&对照controlscases(Zhang,CellReports2021)Variant FrequencyCases-58.3%Controls -16.7%CRPNOIND11121314:1516171819202122CDCHIRCDIChromosomeCDIECLR17 17队列关联研究
生物信息学 课程 Bioinformatics ➢ 人群队列收集 通过测定疾病人群队列和对照人群 队列的基因组序列,进而比较不同 表型人群的遗传变异差异,是准确 鉴定致病遗传因素的重要手段。 疾病的遗传关联研究 – 人群队列收集 选取遗传背景相匹配的病例&对 照 (Zhang., Cell Reports, 2021) 17 17 队列关联研究
生物信息学课程101计划疾病的遗传关联研究一人群队列资源Bioinformatics》国际代表性的大型全基因组队列研案目人数人群PubMedID深度变异类型发表时间1KGP2015/SNP/InDel/SV26432245/3202人世界人群30X2022年36055201gnomAD2020年15708人3246161318XSNP/InDel/SVI多核世界人群苷酸变异2015年20×2636人冰岛人SNP/InDel25807286冰岛基因组计划UKBB2022年150119人32XSNP/InDel/SVI微卫35859178世界人群星2021年53831人美国30XSNP/lnDelTopMed33568819All ofus约100万人世界人群2019年4810人14XSNP/InDel31626772新加坡SG10K计划新加坡人2019年1267人36×SNP/InDel31802016亚洲GAsP计划亚洲人2021年6538人荷兰ALSMinE计划25×SNP/InDel/微卫星34873335荷兰人18 18
18 18 生物信息学 课程 Bioinformatics 项目 发表时间 人数 人群 深度 变异类型 PubMed ID 1KGP 2015/ 2022年 3202人 世界人群 30× SNP/InDel/SV 26432245/ 36055201 gnomAD 2020年 15708人 世界人群 18× SNP/InDel/SV/多核 32461613 冰岛基因组计划 2015年 2636人 冰岛人 20× 苷酸变异 SNP/InDel 25807286 UKBB 2022年 150119人 世界人群 32× SNP/InDel/SV/微卫 35859178 TopMed 2021年 53831人 美国 30× 星 SNP/InDel 33568819 All of us - 约100万人 世界人群 - - - 新加坡SG10K计划 2019年 4810人 新加坡人 14× SNP/InDel 31626772 亚洲GAsP计划 2019年 1267人 亚洲人 36× SNP/InDel 31802016 荷兰ALS MinE计划 2021年 6538人 荷兰人 25× SNP/InDel/微卫星 34873335 ➢ 国际代表性的大型全基因组队列研 究 疾病的遗传关联研究 – 人群队列资源
生物信息学课程101计划疾病的遗传关联研究一人群队列资源Bioinformatics>国内代表性的大型全基因组队列研究项目人数人群深度PubMedID发表时间变异类型2021/中国中国NyuWa30X34788621/3000-5000人SNP/InDe/微卫2022/星/转座子插入35212372/2023年37045857中国ChinaMAP2020年10588人中国40XSNP/InDel323552882022年4480人中国14XSNP/InDel35618720中国WBBC计划2022年6004人中国30XSNP/InDel36113475南京NSCLC队列2023年10241人中国30XSNP/InDel37479695中国脑卒中队列2023年4450人13X中国SNP/lnDel36759515湘雅帕金森队列2020年1058人中国34XSNP/InDel33033484云南吸烟队列12X2023年1001人SNP/InDel/SV中国藏族37055782西藏藏族队列1137人2021年中国30XSNP/lnDel34108666江苏出生队列2021年4053人4-7X中国SNP/InDelPPR504389广州出生队列19 19
19 19 生物信息学 课程 Bioinformatics ➢ 国内代表性的大型全基因组队列研 究 项目 发表时间 人数 人群 深度 变异类型 PubMed ID 中国NyuWa 2021/ 2022/ 2023年 3000-5000人 中国 30× SNP/InDel/微卫 星/转座子插入 34788621/ 35212372/ 37045857 中国ChinaMAP 2020年 10588人 中国 40× SNP/InDel 32355288 中国WBBC计划 2022年 4480人 中国 14× SNP/InDel 35618720 南京NSCLC队列 2022年 6004人 中国 30× SNP/InDel 36113475 中国脑卒中队列 2023年 10241人 中国 30× SNP/InDel 37479695 湘雅帕金森队列 2023年 4450人 中国 13× SNP/InDel 36759515 云南吸烟队列 2020年 1058人 中国 34× SNP/InDel 33033484 西藏藏族队列 2023年 1001人 中国藏族 12× SNP/InDel/SV 37055782 江苏出生队列 2021年 1137人 中国 30× SNP/InDel 34108666 广州出生队列 2021年 4053人 中国 4-7× SNP/InDel PPR504389 疾病的遗传关联研究 – 人群队列资源
生物信息学课程101计划疾病的遗传关联研究一加性效应检测Bioinformatics病例对照>路易体痴呆症队列+288C283·基于加性效应模型对路易体痴呆症队列中的常n=2,591n=4.027见变异进行单点关联分析,确定了五个显著性基因GBA,APOE,SNCA,BIN1和TMEM175致病基因:单点关联分析GBA常见APOE基于罕见变异位点的聚合检验方法,确定基因SNCA变异GBA在路易体痴呆症发病机制中具有突出作BIN1工具MAF>0.01TMEM175用Plink变异集关联分析罕见Note:加性效应即当两个或多个基因对于某一性状致病基因:错义变异或是单个基因的不同等位基因对于某一性状的整体作GBA工具MAF<0.01用,等于它们单独作用之和SKAT路易体痴呆症队列VG=VA+VB20 20(ChiaR.,NatGenet2021)
生物信息学 课程 Bioinformatics 20 20 ➢ 路易体痴呆症队列 • 基于加性效应模型对路易体痴呆症队列中的常 见变异进行单点关联分析,确定了五个显著性 基因GBA,APOE, SNCA, BIN1 和TMEM175 • 基于罕见变异位点的聚合检验方法,确定基因 GBA在路易体痴呆症发病机制中具有突出作 用 Note: 加性效应 即当两个或多个基因对于某一性状, 或是单个基因的不同等位基因对于某一性状的整体作 用,等于它们单独作用之和 工具 Plink 工具 SKAT 路易体痴呆症队列 (Chia R., Nat Genet. 2021) 𝑉𝐺= 𝑉𝐴+𝑉𝐵 疾病的遗传关联研究 – 加性效应检测