【佳学基因检测】将基因解码顶起的数据库前辈:gnomAD数据库介绍
遗传病、罕见病基因检测导读:
GnomAD, 是一个基因信息分析与注释的新型数据库。它提全称是Genome Aggregation Database。简称为gnomAD。为了便于交流,佳学基因将其翻译为格诺马德。 由于这是一个新型基因信息分析数据库,人们常常将其误写为GenomAD, 或者是genomAD.
关于格诺马德(gnomAD)
格诺马德(gnomAD)是一种基因组聚合数据库。它是由研究人员联盟,搜索、收集和协调来自各种大型外显子组、全基因组的测序数据,经过汇总后再提供给更为广泛的基因组研究和应用领域。该项目由共同董事海蒂·雷姆和马克·戴利以及指导委员会成员丹尼尔·麦克阿瑟、本杰明·尼尔、迈克尔·塔科夫斯基、安妮·奥唐纳-卢里亚、康拉德·卡切夫斯基、格蕾丝·蒂奥、马修·所罗门森和凯特·塔拉索娃监督。格诺马德的先进个版本,它仅包含 exome 数据,称为 Exome 聚合联盟 (ExAC)。
截止到2020年12月31日,佳学基因发现,格诺马德已经将该数据库升级到v3.1,所收集的基因序列变化来自76,156个基因组,这些基因组来自没有亲缘关系的个体,它们在研究疾病的发生或者是单纯为群体基因组提供研究数据的过程中被收集起来,采用了贼新的GCH38参照基因组进行分析。v2版本的基因序列变化来自125,748个外显子组和15,708个基因组,这些基因组来自不相关的个体,这些基因组被测序为各种疾病特异性和种群基因研究的一部分,共有141,456个个体,采用GCH37参照序列进行解读分析。但是格诺马德移除了已知受严重儿科疾病影响的个人及其一级亲属的基因序列,组织者认为因此这些数据集应作为严重儿科疾病研究的等位基因频率的有用参考集。尽管,一些患有严重疾病的个人可能仍包含在数据集中,但是收集致病基因序列显然不是GnomAD的主要目的。
这些项目的所有原始数据都通过标准化分析程序处理,并联合调用变体以提高项目之间的一致性。处理管道以 WDL 工作流定义语言编写,并使用Cromwell执行引擎执行,这是用于在多个平台上大规模定义和执行基因组工作流的开源项目。gnomAD 数据集包含使用多种外显类捕获方法和测序化学方法排序的个体,因此,个体和站点的覆盖率各不相同。覆盖率的这种变化被纳入每个变型的变频计算中。
gnomAD 使用 Hail 开源框架对QCad 进行了 QC和分析,用于可扩展的遗传分析。
下面提供了一份 gnomAD 首席调查员和为当前版本提供数据和分析的小组列表。
这套呼叫集的生成主要由 Broad Institute 资助,此处的数据公开发布,以造福于更广泛的生物医学社区。对这些数据没有发布限制或禁运。请引用旗舰 gnomAD 文件对这些数据的任何使用。
gnomAD 结构变异 (SV) v2.1 数据集跨越了 10,847 个基因组,这些基因组来自作为各种疾病特异性和种群基因研究的一部分测序的不相关个体,并且与 GRCh37 参考值对齐。它主要(但不是有效)与用于 gnomAD 短变种释放的基因组集重叠。与 gnomAD 短变种数据集一样,格诺马德移除了已知受严重儿科疾病影响的个人及其一级亲属,因此此数据集应作为严重儿科疾病研究的等位基因频率的有用参考集 - 但是,请注意,一些患有严重疾病的个人可能仍包含在数据集中,尽管频率可能相当于或低于一般人群。
这些项目的所有原始数据都通过同一管道重新处理,并联合调用变体以提高项目之间的一致性。简言之,我们从人群遗传和复杂的疾病关联研究中汇总了光照短读 WGS。我们通过集成四个已发布的SV算法(曼塔、DELLY、MELT和cn)发现了SV。MOPS) 识别七个突变类的SV,并联合过滤、基因型、解析和注释这些SV跨所有基因组。所有 SV 发现都是使用工作流描述语言(WDL) 和克伦威尔执行引擎在 FireCloud 中执行的,其中 gnomAD SV 发现管道的组件可作为具有专用 Docker 映像的公共方法提供。在 gnomAD SV 论文的补充信息中提供了有关此过程的广泛技术细节;请引用本文以使用SV数据。
gnomAD发布的数据不受知识共享零公共领域奉献的限制。这意味着,您可以使用它用于任何目的,而无需合法地给予归因。但是,我们要求您积极确认并归因 gnomAD 项目,并尽可能链接回相关页面。归因支持将来发布其他数据的努力。它还减少了"孤立数据"的数量,有助于保留与权威来源的链接。
基因组聚合数据库收集的外显子和基因组汇总和发布数据已获合作伙伴 IRB(协议 2013P001339,"人类基因组数据的大规模聚合")批准。
首席调查员
- 玛丽亚·阿布雷乌
- 卡洛斯·阿吉拉尔·萨利纳斯
- 塔里克·艾哈迈德
- 克里斯汀·阿尔伯特
- 尼科莱特·阿雷德
- 大卫·阿尔特舒勒
- 迭戈·阿尔迪西诺
- 吉尔·阿茨蒙
- 约翰·巴纳德
- 洛朗·博杰里
- 加里·比查姆
- 埃米莉亚·本杰明
- 迈克尔·博恩克
- 洛里·邦尼卡斯特
- 欧文·博廷格
- 唐纳德·鲍登
- 马修·鲍恩
- 汉尼亚坎波斯
- 约翰·钱伯斯
- 陈丽安娜
- 丹尼尔·查斯曼
- 雷克斯·奇斯霍尔姆
- 朱迪·乔
- 拉吉夫·乔杜里
- 钟米娜
- 郑文迪
- 布鲁斯·科恩
- 阿道夫·科雷亚
- 达娜·达贝莱亚
- 马克·戴利
- 约翰·达内什
- 达伍德·达尔巴尔
- 约书亚·丹尼
- 拉文德拉纳特·杜吉拉尔
- 约瑟·杜普伊斯
- 帕特里克·埃利诺
- 罗伯托·埃洛苏亚
- 珍妮特·埃尔德曼
- 特努埃斯科
- 马特·费尔基勒
- 黛安·法特金
- 何塞·弗洛雷斯
- 安德烈·弗兰克
- 盖德·盖茨
- 大卫·格拉恩
- 本·格拉泽
- 斯蒂芬·格拉特
- 大卫·戈德斯坦
- 克莱塞里奥·冈萨雷斯
- 莱夫·格罗普
- 克里斯托弗·海曼
- 伊拉霍尔
- 克雷格·哈尼斯
- 马修·哈姆斯
- 米科·希尔图宁
- 马蒂·霍利
- 克里斯蒂娜·霍尔特曼
- 柴姆·贾拉斯
- 米科·卡莱拉
- 雅克科·卡普里奥
- 塞卡尔·卡蒂雷桑
- 艾米尔·肯尼
- 邦乔·金
- 杨金金
- 乔治·基罗夫
- 贾斯帕尔·库纳
- 塞波·科斯金宁
- 哈兰·克鲁姆霍尔茨
- 苏布拉·库加塔桑
- 所以 HeonKwk
- 马克库·拉克索
- 特霍·莱赫蒂梅基
- 露丝·洛斯
- 史蒂文·卢比茨
- 罗纳德·马
- 丹尼尔·麦克阿瑟
- 格雷戈里·马库斯
- 乔梅·马鲁加特
- 卡里·马蒂拉
- 史蒂夫·麦卡罗尔
- 马克·麦卡锡
- 雅各布·麦考利
- 德莫特·麦戈文
- 露丝·麦克弗森
- 詹姆斯·梅格斯
- 奥勒·梅兰德
- 黛博拉·迈耶斯
- 莉莉·米兰尼
- 布拉克斯顿·米切尔
- 阿莉娅·纳赫德
- 萨曼·纳扎里安
- 本·尼尔
- 彼得·尼尔森
- 迈克尔·奥多诺万
- 冈田裕基
- 多斯特·奥古尔
- 洛雷纳·奥罗兹科
- 欧文
- 科林·帕尔默
- 阿尔诺·帕洛蒂
- 金如此公园
- 卡洛斯·帕托
- 安·普尔弗
- 丹·拉德
- 纳兹宁·拉赫曼
- 亚历克斯·雷纳
- 安妮·雷姆斯
- 斯蒂芬·里奇
- 约翰·里奥
- 萨穆利·里帕蒂
- 丹·罗登
- 杰罗姆一地
- 丹麦人萨利赫
- 维克科·萨洛马
- 尼罗什·萨马尼
- 耶利米·沙夫
- 赫里伯特·舒克特
- 斯瓦蒂·沙阿
- 摩尔鞋匠
- 大雄
- 埃德温·西尔弗曼
- 帕梅拉·斯克拉
- 古斯塔夫·史密斯
- 希尔卡·索伊宁
- 哈利·索科尔
- 蒂姆·斯佩克特
- 内森·斯蒂齐尔
- 帕特里克·沙利文
- 贾纳·苏维萨里
- 肯特·泰勒
- 叶英德
- 图奥米·蒂纳马亚
- 明翠
- 丹·特纳
- 特蕾莎·图西·卢纳
- 伊尔基·瓦尔蒂亚宁
- 马奎斯·沃特
- 詹姆斯·沃
- 休·沃特金斯
- 冲洗韦斯玛
- 迈娅·韦斯曼
- 詹姆斯·威尔逊
- 拉姆尼克·泽维尔
贡献项目
- 1000 个基因组
- 1958年 出生
- 非裔美国人冠状动脉钙化项目(AACAC)
- 阿尔斯根
- 阿尔茨海默病测序项目(ADSP)
-
心房颤动遗传学联合会(AFGen)
- 杜克导管遗传学(CATHGEN)
- 孟加拉国急性血管事件风险(BRAVE)研究
- 生物群系生物库
- 保加利亚三重奏
- 慢性阻塞性肺病基因
- 爱沙尼亚基因组中心,塔尔图大学
- 芬兰-美国对NIDDM遗传学(FUSION)的调查
- 芬兰偏头痛研究
- 芬兰双队列研究
- 芬恩-阿德根
- 芬里斯克
- 弗雷明厄姆心脏研究
- 阿米什人心肌健康遗传学
- 魁北克省格诺梅 - 吉尼松生物银行
- 基因组精神病学同
- 转到 2d
- 基因型-组织表达项目(GTEx)
- Health2000
- 人类基因组多样性项目
-
炎症性肠病:
- 1000IBD 项目
- 芬兰赫尔辛基大学医院
- NIDDK IBD遗传学联合会
- 魁北克IBD遗传学联合会
- 杰克逊心脏研究
- 犹太基因组计划 - 由博尼·奥拉姆资助
- 库奥皮奥老年痴呆症研究
- 生命线同轴
- 肺组织研究联合会
- 麦克莱恩神经精神病研究项目,精神病科
- 梅斯塔
- 男性的代谢综合症(METSIM)
- 动脉硬化的多民族研究
-
心肌梗塞遗传学联合会(MIGen):
- 莱斯特 Exome Seq
- 北德MI研究
- 渥太华基因组学心脏研究
- 巴基斯坦心肌梗塞研究(PROMIS)
- 早熟冠状动脉疾病研究(PROCARDIS)
- 书记官长吉罗尼·德尔·科尔(REGICOR)
- 南德军情研究
- 康复变化:性别对年轻AMI患者结果的作用(VIRGO)
- 国家精神卫生研究所(NIMH)控制
- 恩赫格里 · Ccdg
- NHLBI-GO 外显组测序项目 (ESP)
- Nhlbi 上衣
- 大阪大学医学研究生院
- 使用基因组学和流行病学 (PAGE) 联盟的人口结构
- 普利兹克神经精神病研究联盟
- 来自台湾的精神分裂症三重奏
- 测序倡议苏米(SiSu)
- 西格玛-T2D
- 慢性阻塞性肺病研究中的亚人口和中间结果措施(SPIROMICS)
- 瑞典精神分裂症与双极性研究
-
T2D 基因
- 戈达茨
- T2D 搜索
- 癌症基因组图谱(TCGA)
- 精神疾病全基因组测序(WGSPD)
- 妇女健康倡议
数据生成
- 埃里克·班克斯
- 路易斯·贝尔格尔森
- 克里斯蒂安·西布尔斯基斯
- 米格尔·科瓦鲁比亚斯
- 约西·法琼
- 劳拉·高蒂尔
- 杰夫·根特
- 蒂博·让德
- 黛安·卡普兰
- 特雷文·兰斯福德
- 克里斯托弗·兰瓦恩
- 鲁奇·蒙希
- 萨姆·诺沃德
- 尼科尔·彼得里略
- 大卫·罗森
- 瓦伦丁·鲁阿诺-鲁比奥
- 纳雷·萨哈基安
- 梅根·尚德
- 乔恩·史密斯
- 何塞·索托
- 凯瑟琳·蒂贝茨
- 夏洛特·多洛宁
- 戈登·韦德
结构变化
- 瑞安·柯林斯
- 哈里森品牌
- 迈克尔·塔科夫斯基
- 埃里克·班克斯
- Ted 布鲁金斯
- 洛朗·弗兰乔利
- 傅杰
- 劳拉·高蒂尔
- 康拉德·卡尔切夫斯基
- 切尔西 · 洛瑟
- 汤姆·里昂斯
- 萨姆·诺沃德
- 特德·夏普
- 马修·所罗门森
- 戈登·韦德
- 马克·沃克
- 哈罗德·王
- 尼克·瓦茨
- 克里斯托弗·惠兰
- 赵雪芳
线粒体变异
- 埃里克·班克斯
- 大卫·本杰明
- 莎拉·卡尔沃
- 詹姆斯·埃默里
- 基兰·加里梅拉
- 劳拉·高蒂尔
- 安德里亚·海斯利
- 妮可湖
- 克里斯汀·拉里奇亚
- 蒙科尔·莱克
- 丹尼尔·麦克阿瑟
- 瓦姆西·穆塔
- 塞巴斯蒂安·舍恩赫尔
- 梅根·尚德
- 何塞·索托
- 格蕾丝·蒂奥
- 尼克·瓦茨
广泛的基因组学平台
- 克里斯汀·康诺利
- 史蒂文·费雷拉
- 史黛西·加布里埃尔
伦理
- 史黛西·唐纳利
- 南拉塔·古普塔
- 艾米莉·利普斯科姆
- 安德里亚·萨尔茨曼
- 莫莉·施莱歇尔
生产和分析
- 伊琳娜·阿曼
- 瑞安·柯林斯
- 凯瑟琳·赵
- 贝丽尔·卡明斯
- 马克·戴利
- 埃莱娜英格兰
- 艾米莉·埃文格利斯塔
- 洛朗·弗兰乔利
- 朱莉娅·古德里奇
- 劳拉·高蒂尔
- 康拉德·卡尔切夫斯基
- 克里斯汀·拉里奇亚
- 蒙科尔·莱克
- 埃里克·米尼克尔
- 本·尼尔
- 安妮·奥唐纳-卢里亚
- 威廉·普
- 蒂姆·波瑟巴
- 丹·罗兹
- 凯特琳·萨莫查
- 埃莉诺·西比
- 棉花种子
- 莫里尔·辛格-伯克
- 雷切尔·儿子
- 格蕾丝·蒂奥
- 克里斯·维塔尔
- 王阿库鲁斯
- 王庆波
- 詹姆斯·沃
- 尼古拉·惠芬
- 迈克·威尔逊
协调
- 杰西卡·阿尔法尔迪
- 萨曼莎·巴克斯特
- 西尼亚德·查普曼
- 克里斯蒂娜·史蒂文斯
- 凯特·塔拉索娃
网站
- 康拉德·卡尔切夫斯基
- 马修·所罗门森
- 尼克·瓦茨
- 本·韦斯伯德
指导委员会
- 马克·戴利
- 海蒂·雷姆
- 萨曼莎·巴克斯特
- 康拉德·卡尔切夫斯基
- 丹尼尔·麦克阿瑟
- 本·尼尔
- 安妮·奥唐纳-卢里亚
- 马修·所罗门森
- 迈克·塔科夫斯基
- 凯特·塔拉索娃
- 格蕾丝·蒂奥
资金
-
NIGMS R01 GM104371
(PI: 麦克阿瑟) -
NIDDK U54 DK105566
(皮:麦克阿瑟和尼尔) -
NHGRI U24 HG010262
(PI: 菲利普帕基斯) -
尼姆 R56 MH115957
(PI: Talkowski) -
NHLBI R01 HL143295
(PI: 绿色) -
威康信托 WT200990/Z/16/Z
(PI: 伯尼) - 比奥马林
- 赛诺菲-根齐姆
用于生成此呼叫集的绝大多数数据存储、计算资源和人力工作是由 Broad 研究所捐赠的
(责任编辑:佳学基因)