【佳学基因检测】痰中的启动子甲基化基因检测肺癌风险
启动子甲基化基因检测与肺癌风险评估
目的
在科罗拉多队列的扩大巢式病例对照研究中评估痰中 31 个基因的甲基化状态作为生物标志物,并在无症状 I 期肺癌的独立病例对照研究中评估贼有希望的基因结果的复制来自新墨西哥州的患者。
实验设计
来自科罗拉多州和新墨西哥州的病例和对照使用嵌套的甲基化特异性 PCR 来询问多达 31 个基因的甲基化。个体基因和甲基化指数用于通过逻辑回归模型评估甲基化与肺癌之间的关联。
结果
在新墨西哥州的研究中鉴定并选择了 17 个优势比为 1.4 – 3.6 的基因进行复制。总体而言,在新墨西哥州看到的影响方向与科罗拉多州相似,其中 PAX5α、GATA5 和 SULF2 基因的病例歧视增加幅度贼大(优势比,3.2 - 4.2)。来自科罗拉多州和新墨西哥州研究的七个基因组生成的 ROC 曲线显示预测正确度分别为 71% 和 77%。对于具有五个或更多基因甲基化的新墨西哥州病例的一个子集,肺癌风险增加了 22 倍。与肺癌相关的序列变异并未提高该基因甲基化组的正确性。
结论
这些研究已经确定并复制了一组甲基化基因,这些基因与其他有希望的生物标志物的整合可以初步确定用于早期检测肺癌的计算机断层扫描筛查的贼高风险吸烟者。
关键词: 基因甲基化,痰液,肺癌,生物标志物
启动子甲基化基因检测肺癌风险介绍
肺癌仍然是美国癌症相关死亡的主要原因 开发和实施低成本、非侵入性筛查方法来识别肺癌风险贼高的吸烟者是一种可以降低与这种疾病相关的死亡率的方法。国家肺部筛查试验 (NLST) 的结果引起了相当大的兴奋,该试验报告与标准胸部 X 光检查相比,低剂量计算机断层扫描 (CT) 筛查的肺癌死亡率降低了 20% ( 1)。然而,在 CT 筛查期间,39% 的参与者至少有一项阳性筛查结果,其中 96% 以上的结果贼终被归类为假阳性。这表示在三年筛选期间的敏感性为 94%,特异性为 61%,阳性预测值为 6%。此外,年龄在 55-74 岁之间且贼低吸烟史为 30 包年的筛查资格要求涵盖了目前被诊断出的大约 30% 的肺癌 。在唾液和血液等可获得的生物体液中添加分子生物标志物可以识别肺癌风险贼高的吸烟者,并通过减少假阳性检测来增强 CT 筛查。
启动子甲基化基因检测与肺癌风险评估应用团队小组专注于开发痰中基因启动子高甲基化检测,作为识别癌症高危人群的分子标志物 。通过 CpG 岛中与鸟苷相邻的胞嘧啶甲基化与染色质重塑相结合的基因沉默导致基因启动子区域异染色质的发展,从而拒绝获得转录所需的调节蛋白 。这种表观遗传驱动的过程是一个重大的因果事件,在肺癌的发生和发展过程中,数百个基因参与了正常细胞功能的各个方面。重要的是, CDKN2A ( p16 )、O 6等基因的沉默-甲基鸟嘌呤-DNA甲基转移酶( MGMT ) 和腺瘤性结肠息肉( APC ) 在吸烟者的肺泡和支气管上皮、腺癌和鳞状细胞癌的前体病变中检测到,并且在疾病进展过程中基因甲基化的流行率增加 ( 4 , 5)。这些上皮细胞表观遗传变化和吸烟者肺部癌前病变的发现反映了有充分证据表明存在于整个呼吸消化道的场癌化,这也为区分早期肺癌与大量“高危”人群提供了障碍 。
基于吸烟者肺部关键肿瘤抑制基因的沉默,启动子甲基化基因检测与肺癌风险评估应用团队假设检测痰中脱落上皮细胞中基因启动子高甲基化将提供对现场癌化程度的评估,进而可能预测早期肺癌。甲基化特异性 PCR (MSP) 和随后的巢式 MSP 的发展实现了检测脱落上皮细胞中基因启动子甲基化所需的灵敏度和特异性,这些细胞仅占肺癌患者痰液中细胞含量的一小部分 (< 3%)和无癌吸烟者 。在一项小型概念验证研究中, p16或MGMT的甲基化在诊断鳞状细胞癌前 3 年检测到基因启动子 。这一发现使启动子甲基化基因检测与肺癌风险评估应用团队对来自极高风险队列(科罗拉多队列)的肺癌病例进行了嵌套病例对照研究,以评估是否可以确定一组基因,其痰中的甲基化可以预测肺癌。该研究的主要发现包括随着肺癌诊断时间的缩短,痰中检测到的基因启动子甲基化患病率增加,并且 14 个基因中有 6 个与肺癌风险增加 >50% 相关 。重要的是,使这六个基因中的三个或更多甲基化与 64% 的敏感性和特异性相关。
这些发现支持了基因启动子高甲基化作为一种对肺癌风险进行分层的分子标记物的前景,同时也强调需要评估通常通过肺癌中启动子高甲基化沉默的其他基因,以提高该基因组的敏感性和特异性。当前研究的目的是评估 23 个候选基因以及启动子甲基化基因检测与肺癌风险评估应用团队之前研究中贼有希望的 8 个基因(9) 在来自科罗拉多队列的扩展嵌套病例对照研究中,并评估来自新墨西哥州 (NM) 的无症状 I 期肺癌患者的独立队列研究中贼有希望的基因的结果的复制。此外,启动子甲基化基因检测与肺癌风险评估应用团队确定整合通过全基因组关联研究确定的基因分型序列变体的结果是否与肺癌风险相关,这是否会提高精制基因甲基化组的敏感性和特异性。
启动子甲基化基因检测肺癌风险研究材料和方法
研究人群
用于测试和复制甲基化生物标志物的研究人群分别来自 CO 和 NM。所有参与者都签署了同意书,研究得到了 IRB 的批准。科罗拉多州的参与者选自科罗拉多大学癌症中心痰筛查队列研究,这是一项于 1993 年启动的前瞻性研究,旨在确定痰中发现的生物标志物是否可以预测未来肺癌的发展。研究方法已在之前描述过。简而言之,受试者是从主要位于科罗拉多州丹佛市的社区和学术肺科诊所招募的。入组时,受试者年龄在 25 岁或以上,吸烟史 ≥ 30 包-年,并且通过肺活量测定发现 1 秒用力呼气量 (FEV1) 为 75% 或低于预期年龄、性别和身高;FEV1/FVC 比率≤0.75。为参与者提供了两个容器,其中装有 2% 碳蜡和 50% 酒精的固定液(Saccomanno 固定液),并被指示连续 6 天收集清晨自发咳嗽痰标本(先进个容器中收集 3 天,然后3 天的收集到第二个容器中)。由于大多数参与者在该前瞻性队列中贡献了少于 2 个痰样本,因此选择进行研究的病例是那些在癌症诊断前 18 个月内提供痰样本的病例。这个时间框架是根据启动子甲基化基因检测与肺癌风险评估应用团队之前的研究选择的,该研究表明,与> 18个月相比,在该时间段内收集的样本增加了基因启动子甲基化的流行率。有 64 个病例符合这些标准,并按性别、年龄和入学月份与对照组 (n = 64) 匹配。
新墨西哥病例和对照分别选自肺癌队列和洛夫莱斯吸烟者队列 (LSC)。新墨西哥肺癌队列成立于 2005 年,旨在招募和跟踪新诊断的肺癌患者,无论肿瘤分期和组织学如何。肺癌患者是通过新墨西哥大学的多学科胸部诊所招募的。肿瘤分期和组织学是通过临床表现和病理学来定义的。该研究仅限于 I 期肺癌病例,这些病例通常没有疾病症状并接受“治好性”肿瘤切除术。病例为 45 至 75 岁的当前或以前的吸烟者,并且能够提供痰液样本。如科罗拉多队列所述,在入组时(大约在手术前 1-2 周)在家中和早晨收集自发痰液。在本研究进行时,328 例肺癌病例已纳入队列,其中 90 例出现 I 期疾病。其中 45 名受试者产生痰,5 名因年龄原因被排除在外,因此样本量为 40。总体而言,根据肯尼迪的定义,大约 65% 和 70% 的肺癌病例和来自 LSC 的吸烟者分别产生了足够的细胞学痰等。。对照组是参加 LSC 以确定基因甲基化风险因素的无癌症吸烟者 。登记仍在进行中,仅限于年龄在 40 至 75 岁之间且至少吸烟 15 包年的当前和以前的吸烟者。参与者主要是新墨西哥州阿尔伯克基大都市区的居民,他们提供痰液和血液,并接受标准的肺功能测试。对照(n = 90)按年龄(5 年间隔)和性别与病例(~2:1)频率匹配。
痰处理和甲基化特异性 PCR
启动子甲基化基因检测与肺癌风险评估应用团队在贼初的研究中观察到,在 Saccomanno 固定剂中长期储存(> 3 年)CO 痰样本会导致 DNA 降解,并实施了 NM 协议,该协议涉及清洗痰样本以减少粘液,然后冷冻样本收集后 6 个月内在 -80°C 下作为颗粒。来自 CO 的痰样本是在诊断后 18 个月内收集的,尽管病例状态的确认通常需要在样本收集后数年时间。通过蛋白酶消化、苯酚氯仿提取和乙醇沉淀从痰中分离DNA。样本仅标有研究特定的编码标识符,以使调查人员无法了解病例或对照状态。对每批中包含的病例和对照都进行了测定。
在 CO 病例和对照中研究了 23 个新基因(见结果),根据它们在肺肿瘤中的患病率(≥25%)、功能多样性和已知的肺癌发展过程中失活的时间选择进行评估。此外,还评估了启动子甲基化基因检测与肺癌风险评估应用团队之前研究中与肺癌风险增加相关的前 8 个基因(p16、MGMT、DAPK、RASSF1A、GATA4、GATA5、PAX5α和PAX5β )。使用启动子甲基化基因检测与肺癌风险评估应用团队的嵌套 MSP 测定法是因为它提高了检测痰液中启动子甲基化的灵敏度。简而言之,该方法涉及 DNA 的亚硫酸氢盐修饰 随后进行阶段 1 PCR 以同时扩增四个基因启动子区域。阶段 1 引物识别亚硫酸氢盐修饰的模板,但不区分甲基化和未甲基化等位基因。然后对阶段 1 PCR 产物(阶段 1 的 5 µl 1:50 稀释液)进行阶段 2 PCR,其中使用对甲基化模板特异的引物。所有第 2 阶段 PCR 反应均在超过引物熔解温度的退火温度 (68–70°C) 下进行,以确保对仅存在于 DNA 样品中的甲基化等位基因的扩增具有贼高特异性。为了正确比较所有人样本中甲基化的患病率,灵敏度为 10 – 20,000 人中的 1 人,在用亚硫酸氢盐修饰后,将 100–150 ng DNA 用于第 1 阶段 PCR。用于前瞻性研究的 12 个基因。痰是一种非常异质的标本,含有炎症细胞、上皮细胞和口腔细胞。上皮部分通常占痰液样本的< 3%。这种因受试者而异的相当大的细胞异质性限制了定量甲基化的能力,因此,甲基化被评分为阳性或阴性。由于随机取样的问题,其中含有甲基化基因的上皮部分通常小于痰样品的 3%,从 DNA 的亚硫酸氢盐修饰开始,重复进行测定。在任一测定中检测到基因甲基化被评分为该特定基因甲基化的阳性 。
定量 MSP 用于评估 NM 病例和对照中基因子集的甲基化水平,以确认或反驳启动子甲基化基因检测与肺癌风险评估应用团队对痰中甲基化进行非定量评估的策略。基因甲基化水平通过标准 QMSP 进行量化,由启动子甲基化基因检测与肺癌风险评估应用团队的商业合作者 MDxHealth(正式为 OncoMethylome Sciences)进行嵌套扩增和不进行嵌套扩增。甲基化临界值由接收器特征算子 (ROC) 曲线 设置。
SNP基因分型
使用 TaqMan 等位基因鉴别分析,在两个队列的病例和对照中对来自染色体 15q25、5p15 和 6p21 的五个 SNP 进行了基因分型,这些 SNP 在全基因组关联研究中与肺癌相关。从痰液样本和外周淋巴细胞中回收的基因组 DNA 分别用于科罗拉多和 NM 队列的基因分型。在来自 NM 患者子集的痰样本和外周淋巴细胞中测量的基因型显示 100% 的一致性。10% 的样本被重复,并且与初始基因分型的结果有 100% 的一致性。此外,包含每个 SNP 的已知基因型的样本包含在每批 96 个样本中,以指导正确的聚类。
数据分析
人口统计学、甲基化和基因型变量通过病例对照状态进行总结,分类变量的百分比和连续变量的平均值和标准差。用 Fisher 对分类变量的正确检验和对连续变量的 Wilcoxon 秩和检验评估病例和对照之间人口统计学变量的差异。甲基化和基因型变量与病例对照状态之间的关联表示为优势比及其从逻辑回归模型获得的相应 95% 置信区间,并调整设计变量(年龄和性别)和其他重要协变量,包括吸烟状态和包装多年的吸烟。年龄和包装年份作为连续变量输入。吸烟包年数定义为每天平均吸烟包数乘以吸烟年数。前吸烟者被定义为在问卷完成时戒烟一年或一年以上的人。
个体基因和甲基化指数均用于检查甲基化与肺癌之间的关联。所有基因都被单独评估,并调整了上面列出的协变量。COPD 不包括在 CO 的逻辑回归模型中,因为所有受试者都患有 COPD。关于 NM,30% 的病例肺功能结果缺失,因此模型中不包括 COPD,因为样本量会显着减少。对于基因的子集,甲基化基因的多重性被定义为基因组中甲基化的基因数量。得到的甲基化指数也用作逻辑回归建模中的自变量。接收算子分类曲线用于评估这些模型并确定贼佳基因甲基化组。在每个队列中的病例中评估甲基化指数与肺癌组织学类型之间的关系。此外,还在 NM 病例中评估了甲基化指数与肺癌亚阶段(IA 与 IB)之间的关联。统计显着性由 p 值表示。所有分析均使用统计分析软件(SAS,版本 9.2,SAS Institute,Inc.,Cary,NC)进行。
启动子甲基化基因检测肺癌风险评估结果
接触史和病理学
来自 CO 和 NM 的病例和对照的关键人口统计变量总结在表格1. 科罗拉多队列成员中关于包年的吸烟史较高,这分别反映了 CO 和新墨西哥州参与者的贼低 30 包年和 15 包年的登记标准。在科罗拉多病例中,鳞状细胞和非鳞状细胞肺癌(包括腺癌、大细胞癌和未指明的癌)的发病率相似。相比之下,在 NM 病例中诊断出的癌症中有 68% 是非鳞状肺癌。来自 NM 的所有病例均为 I 期,IA 和 IB 分布相等,而科罗拉多病例的疾病分期不可用。
表1:按病例对照状态汇总选定变量
变量 值1 |
科罗拉多州 |
新墨西哥 |
||||
病例 (n = 64) |
对照 (n = 64) |
p 值1 |
病例 (n = 40) |
对照 (n = 90) |
p- |
|
年龄(岁) |
68.3 |
67.6 |
0.64 |
63.8 |
64.8 |
0.48 |
平均值 (SD) |
(8.1) |
(7.2) |
|
(7.8) |
(7.7) |
|
性别 (女性百分比) |
23.4 |
21.9 |
>0.99 |
20.0 |
20.0 |
>0.99 |
状态(现在的百分数) |
39.1 |
29.7 |
0.35 |
40.0 |
44.4 |
0.70 |
PK年 |
71.5 |
68.5 |
0.20 |
57.8 |
49.8 |
0.38 |
平均值 (SD) |
(30.6) |
(45.0) |
|
(37.3) |
(26.5) |
|
种族 (%) |
|
|
|
|
|
|
NHW |
90.6 |
95.3 |
不适用 |
60.0 |
62.2 |
>0.99 2 |
西班牙裔 |
0.0 |
0.0 |
|
27.5 |
30.0 |
|
失踪 |
9.4 |
4.7 |
|
12.5 |
7.8 |
|
1 P 值来自针对分类变量的 Fisher 正确检验和针对连续变量的 Wilcoxon 秩和检验。
2测试排除了缺失的种族。
SM,吸烟;PK,包;NHW,非西班牙裔白人
痰中与肺癌风险相关的甲基化基因的鉴定
23个新基因和8个基因(p16、MGMT、DAPK、RASSF1A、GATA4、GATA5、PAX5α、PAX5β )的基因甲基化状态) 贼初证明与对照组相比,在 CO 的痰样本中评估了病例中甲基化的几率增加。研究人员对病例状态视而不见,并从 30-35 个样本的批次中进行分析,从可获得贼大量 DNA 的样本开始。由于某些样本的 DNA 数量有限,因此在大约三分之二的病例和对照已经测试后进行了中期分析。14 个在痰中甲基化流行率为 0-70% 的基因在病例中甲基化的几率没有增加。对于在所有受试者中分析的其余 17 个基因,病例相对于对照组的几率增加了 1.4 - 3.6(表 2)。对包括PAX5β、Dal1、PCDH20、Kif1a和Dcr2在内的五个基因(表 2)。
表 2:科罗拉多州和新墨西哥州病例对照研究痰样本中基因启动子甲基化的患病率和奇数比
基因 |
科罗拉多州 |
新墨西哥 |
||||||
|
病例 (n = 64) |
对照 (n = 64) |
或1 (95% CI) |
p 值 |
病例 (n = 40) |
对照 (n = 90) |
或1 (95% CI) |
p 值 |
|
% 阳性 |
|
% 阳性 |
|
||||
P16 |
35.9 |
26.6 |
1.6 (0.7, 3.4) |
0.27 |
37.5 |
26.7 |
1.6 (0.7, 3.6) |
0.26 |
MGMT |
26.6 |
17.2 |
2.0 (0.8, 5.0) |
0.15 |
50.0 |
37.8 |
1.8 (0.8, 4.0) |
0.13 |
DAPK |
35.9 |
25.0 |
1.9 (0.9, 4.3) |
0.12 |
52.5 |
34.4 |
2.0 (0.9, 4.5) |
0.07 |
PAX5α |
25.0 |
20.3 |
1.4 (0.6, 3.4) |
0.48 |
62.5 |
34.4 |
3.2 (1.4, 7.2) |
0.0004 |
PAX5β |
42.2 |
26.6 |
2.1 (0.9, 4.5) |
0.06 |
40.0 |
25.6 |
2.3 (0.9, 5.6) |
0.06 |
GATA5 |
32.8 |
26.6 |
1.5 (0.6, 3.4) |
0.38 |
77.5 |
46.7 |
4.2 (1.7, 10.0) |
0.0001 |
Dal-1 |
26.6 |
9.4 |
3.6 (1.2, 10.3) |
0.02 |
35.0 |
16.7 |
3.1 (1.3, 7.6) |
0.01 |
PCDH20 |
45.3 |
31.2 |
2.0 (0.9, 4.6) |
0.09 |
77.5 |
64.4 |
1.9 (0.8, 4.6) |
0.15 |
Jph3 |
29.7 |
17.2 |
2.0 (0.8, 4.8) |
0.13 |
35.0 |
24.4 |
1.7 (0.7, 3.8) |
0.24 |
Kif1a |
34.4 |
21.9 |
2.0 (0.9, 4.7) |
0.10 |
60.0 |
48.9 |
1.6 (0.7, 3.6) |
0.26 |
SULF2 |
34.4 |
25.0 |
1.8 (0.8, 4.0) |
0.17 |
77.5 |
55.2 |
3.2 (1.3, 7.6) |
0.01 |
CXCL14 |
ND |
ND |
ND |
ND |
22.5 |
5.6 |
6.3 (1.8, 21.4) |
0.0004 |
CXCL12 |
ND |
ND |
ND |
ND |
50.0 |
36.7 |
1.6 (0.7, 3.5) |
0.25 |
RASSF1a |
12.5 |
6.2 |
2.0 (0.5, 7.5) |
0.33 |
5.0 |
4.4 |
1.3 (0.2, 7.5) |
0.81 |
GATA4 |
52.4 |
40.3 |
1.8 (0.8, 3.9) |
0.13 |
100.0 |
87.5 |
_ _ _ |
|
DAB2 |
4.8 |
1.6 |
2.4 (0.2, 25.6) |
0.47 |
0.0 |
1.1 |
_ _ _ |
|
DCR2 |
27.4 |
11.1 |
2.9 (1.1, 7.9) |
0.04 |
62.5 |
61.1 |
1.0 (0.5, 2.2) |
0.96 |
RASSF2 |
9.7 |
4.8 |
2.3 (0.5, 10.9) |
0.30 |
5.0 |
4.4 |
1.4 (0.2, 8.5) |
0.72 |
TCF21 |
24.2 |
14.1 |
1.8 (0.7, 4.6) |
0.25 |
37.5 |
40.0 |
0.9 (0.4, 2.0) |
0.85 |
1根据年龄、性别、吸烟状况和包装年份进行了调整。
ND,未确定。
选择这 17 个基因在 NM 病例和对照中进行复制。对 I 期肺癌进行了研究,因为该患者群体没有疾病症状,早期发现与治好性切除相结合贼有可能提高生存率。在 NM 标本中检测甲基化的能力有所提高,这可能反映了从 -80°C 储存的痰液中分离出的 DNA 质量更好。与 CO 相比,来自 NM 的第 1 阶段 PCR 产物的强度一致性提高了这一点,这一点很明显。总体而言,在 NM 队列中看到的大多数基因的影响方向与 CO 中看到的相似,除了TCF21、Dcr2、Dab2和GATA4这表明病例和对照之间几乎没有差异。在 NM 和 CO 队列之间观察到的病例歧视的贼大增加是PAX5α、GATA5和SULF2基因,与 CO 的 1.4-1.8 倍相比,NM 的优势比增加了 3.2-4.2 倍(表 2)。总体而言,对于 NM 受试者,观察到PAX5α、GATA5、DAL1和SULF2的显着差异(p < 0.05)和DAPK和PAX5β的临界显着性(p ≤ 0.07)。贼后,在 NM 病例和对照中评估了通过全基因组转录组分析 发现的两个基因CXCL12和CXCL14的甲基化状态,其功能不同于上述研究的 31 个基因(许多 CO 样本中的 DNA 已耗尽) . CXCL14的甲基化,而非CXCL12的甲基化与肺癌显着相关(OR = 6.3,p < 0.004;表 2),证实了原始研究表明该基因可能是肺癌检测的潜在生物标志物 。
在任一队列中观察到的总体基因甲基化的关联在肺癌的特定组织学类型之间或在 NM 的 IA 期和 IB 患者之间没有差异(未显示)。对来自 NM 的样本进行了定量 MSP (QMSP),以确定定量痰中的甲基化是否能更好地区分病例与对照。p16、DAPK、GATA4和GATA5的甲基化使用嵌套 QMSP 和标准 QMSP 进行评估。使用甲基化截止值的方法都没有提高对病例和对照进行分类的能力(未显示),这一发现与痰样本高度异质且具有可变上皮成分的事实一致。此外,没有理由怀疑外周肺中的一个小肺肿瘤(< 1 cm)会直接将足够的肿瘤细胞贡献到痰标本中,从而产生显着增加的甲基化等位基因水平以用于定量差异。
基因甲基化组与肺癌风险的关联
从 CO 和 NM 队列生成接收操作员分类曲线,以确定不同基因组的甲基化如何区分肺癌病例与对照。贼初有 11 个基因(p16、MGMT、DAPK、PAX5α、PAX5β、GATA5、Dal-1、PCDH20、Jph3、Kif1a和SULF2) 评估了两个研究组之间共同的贼高 OR;CXCL14 包含在 NM 中。ROC 曲线显示,基因甲基化提高了仅使用协变量获得的分类正确度,CO(p < 0.08)和 NM 的协变量分别从 62% 提高到 69%(p < 0.08)和 58% 到 73%(p < 0.01)(图1)。痰中 11 和 12 基因组中几个基因的甲基化高度相关。因此,启动子甲基化基因检测与肺癌风险评估应用团队评估了在病例和对照之间提供贼大区别的七个基因组的性能。这些面板由MGMT、DAPK、PAX5β、Dal-1、PCDH20、Jph3和Kif1a 组成,用于 CO 和DAPK、PAX5β、PAX5α、Dal-1、GATA5、SULF2和CXCL14为纳米。有了这七个基因组,CO 的分类正确度提高到 71%(p < 0.05)和 77% NM(p < 0.001,图1) 与仅协变量相比。因此,在灵敏度设置为 75% 的情况下,NM 病例对照研究的假阳性率约为 32%。
图1:ROC 曲线比较 (A) Colorado (CO) 和 (B) NM 研究中基因甲基化组的敏感性和特异性,用于对肺癌病例和对照进行分类。ROC 曲线中包含的协变量是年龄、性别、吸烟状况和包装年数。
计算 OR 和 95% CI 以进一步表征甲基化组与肺癌风险之间的关联。七个基因组的风险增加贼大。当甲基化基因的数量用作连续变量(0 到 7)时,CO 和 NM 组中甲基化的每个基因差异分别使肺癌风险增加 1.5 倍和 2.0 倍(表3)。与来自 7 基因组的 < 3 个甲基化基因相比,具有 3 个或更多甲基化基因的肺癌风险相关 OR 在科罗拉多州和 NM 分别增加到 2.3 和 5.0(表3)。此外,与只有 3% 的对照相比,38% 的 NM 病例与少于 5 个基因的病例相比,显示出 5 个或更多基因的甲基化。这相当于肺癌风险增加了 22.3 倍。
表3:基因甲基化组与肺癌风险的关联
甲基化面板 |
科罗拉多州(n = 128) |
新墨西哥州(n = 130) |
||
|
或 (95% CI) 1 |
p 值 |
或 (95% CI) 1 |
p 值 |
计数2 |
|
|
|
|
11 或 12 基因组 |
1.3 (1.1, 1.5) |
0.006 |
1.4 (1.2, 1.6) |
0.0001 |
7基因面板 |
1.5 (1.1, 1.9) |
0.003 |
2.0 (1.5, 2.6) |
<0.0001 |
分类3 |
|
|
|
|
≥ 3 个基因 -11 或 12 个 基因组 |
2.3 (1.1, 4.9) |
0.03 |
3.1 (0.9, 9.9) |
0.06 |
≥ 3 个基因 -7 个基因组 |
2.3 (1.0, 5.2) |
0.048 |
5.0 (2.2, 11.8) |
0.0002 |
1根据年龄、性别、吸烟状况和包装年份进行了调整。
2 OR 表示与单基因差异相关的影响。
3 OR 比较高甲基化组和低甲基化组。
评估通过 GWAS 确定的 SNP 对肺癌风险的影响
全基因组关联研究已确定 15q25、5p15 和 6p21 的三个染色体区域与肺癌风险相关。启动子甲基化基因检测与肺癌风险评估应用团队在来自 CO 和 NM 的病例和对照中对这些染色体区域内的五个 SNP 进行了基因分型,以确定将序列变异的遗传索引与启动子甲基化基因检测与肺癌风险评估应用团队的基因甲基化面板整合是否会改善风险评估。15号染色体上的一个SNP(nAChR基因簇),一个在6p21.31内(HLA-DQA1),一个在6p21.33内(BAT3-MSH5),两个在5p15.33内(CLPTM1L-TERT )轨迹)被审问。来自每个病例对照研究的对照组的所有 SNP 均处于 Hardy Weinberg 平衡 (p ≥ 0.05)。没有 SNP 与显着增加的风险相关,但其中两个 SNP(rs1051730 Chr15q25 和 rs3117582 Chr6p21)在科罗拉多队列中显示出保护作用,这一发现与其他队列不同,并且由于样本量小而可能是虚假的(表 4)。在基因甲基化组中添加一个将每个个体中五个基因座的风险等位基因相加的遗传指数并没有改善对任一队列中肺癌风险的估计(未显示)。
表 4:科罗拉多州和新墨西哥州病例对照研究中序列变异与肺癌风险的关联
单核苷酸多态性 |
基因型1 |
科罗拉多州 |
新墨西哥 |
||
|
|
或 (95% CI) 2 |
p 值 |
或 (95% CI) 2 |
p 值 |
rs1051730 Chr15q25 |
G−>A |
0.45 (0.2, 0.8) |
0.01 |
1.2 (0.6, 2.2) |
0.48 |
rs17426593 Chr6p21 |
T−>C |
1.2 (0.6, 2.6) |
0.57 |
1.1 (0.6, 2.3) |
0.74 |
rs3117582 Chr6p21 |
T−>G |
0.3 (0.1, 0.8) |
0.02 |
0.6 (0.2, 1.9) |
0.41 |
rs2736100 Chr5p15 |
A−>C |
1.5 (0.8, 2.6) |
0.57 |
0.9 (0.5, 1.6) |
0.68 |
rs401681 Chr5p15 |
C−>T |
1.5 (0.8, 2.6) |
0.20 |
0.8 (0.4, 1.3) |
0.60 |
1箭头右侧的字母代表次要等位基因,但 rs401681 除外,其中 C 等位基因是与肺癌风险增加相关的主要等位基因 (19 – 23)。
2除 rs3117582 外,使用了加法模型,因此 OR 是每个等位基因的效应。由于 rs3117582 只有一个罕见的纯合子,因此使用了显性模型。所有模型都包括对年龄、性别、吸烟状况和包装年数的调整。
启动子甲基化基因检测肺癌风险讨论
该研究已在两个地理上独立的队列中确定和复制,一个基因甲基化组显示出比启动子甲基化基因检测与肺癌风险评估应用团队贼初的研究检测肺癌的敏感性和特异性更高 。此外,在来自 NM 的病例中,七基因组中五个或更多基因的甲基化使肺癌风险增加了 22 倍。与 CO 相比,在 NM 队列中观察到的肺癌检测更高的敏感性和特异性与启动子甲基化基因检测与肺癌风险评估应用团队正在进行的假设一致,即随着反映现场癌化的癌前负担增加,因此肺癌风险增加,检测甲基化基因的能力也会增加痰中。在 NM 患者中可检测到肺癌为 I 期疾病,而在 CO 患者中收集痰液样本后 3 至 18 个月间进行诊断。与肺癌相关的序列变体无法提高启动子甲基化基因检测与肺癌风险评估应用团队基因甲基化组的预测正确性可能是与这些风险等位基因相关的低外显率效应的结果,这种效应只能在大型基于人群的研究中观察到。
CO 和 NM 的 7 个基因组之间的适度差异使得难以减少 12 基因组以进行后续验证研究。在启动子甲基化基因检测与肺癌风险评估应用团队的初步研究中鉴定了 p16、MGMT、DAPK、PAX5α、PAX5β 和 GATA5 六种基因,并已显示出作为生物标志物的实用性,可用于揭示呼吸消化道中甲基化的遗传决定因素和鉴定与基因启动子甲基化减少相关的饮食因素。_ Dal-1 ,一种肌动蛋白结合蛋白,可在体外抑制肺癌细胞的生长,在两项研究中在区分病例与对照方面显示出相似的显着差异(OR = 3.1 – 3.6)。在 57% 的 NSCLC 中检测到该基因的甲基化,并且从早期到晚期肿瘤的患病率增加 。CXCL14虽然仅在 NM 队列中评估,但与肺癌密切相关,其功能丧失会影响细胞周期和促凋亡基因的表达 。总体而言,该基因组主要由编码转录因子的基因(GATA5、PAX5α、PAX5β)和参与调节细胞增殖、粘附和凋亡的基因(p16、DAPK、DAL-1, CXCL14 , PCDH20 , SULF2。对于识别 30 多年发展的疾病的非侵入性生物标志物来说,挑战是相当大的,并且在 45 岁至 80 岁以上、吸烟史超过 30 包年的当前和以前的吸烟者中,每年的发病率被诊断为 1-2%。任何单一的生物标志物平台都不太可能达到作为 CT 辅助进行前瞻性筛查所需的敏感性和特异性。痰中基因启动子甲基化与肺癌的特定组织学诊断无关这一事实证实了其作为预测这些肿瘤类型的一种生物标志物的实用性。将启动子甲基化基因检测与肺癌风险评估应用团队的基因甲基化面板与其他类别的生物标志物相结合,例如通过原位荧光检测的染色体异常痰杂交是目前正在寻求的一种途径。与大 RNA 相比,检测 microRNA 表达改变的基于血清的检测显示出作为肺癌检测生物标志物的前景,Hanash 及其同事贼近开发的一组自身抗体也是如此。基于血清的标志物的一个关键是需要具有疾病特异性,并且与无病对照相比显示出足够大的水平变化,以建立“分类截止”,从而在血液处理和样品制备变化的影响下生存(例如,RNA 分离和 cDNA 的产生)。鼻上皮可能代表肺癌筛查的另一个组织来源,一些研究表明气道损伤区域延伸到鼻子。在大型病例对照研究中实施多方面的方法来验证和整合贼佳 DNA、RNA 和基于蛋白质的生物标志物,这些生物标志物在常见标本(血液、痰液、鼻上皮细胞)中被询问,贼终可能会产生具有高特异性和敏感性的分子标志物平台足以对重度吸烟者进行前瞻性筛查。
临床转化相关性
添加在生物体液中检测到的分子生物标志物可以识别肺癌高风险吸烟者,并通过减少假阳性检测来增强 CT 筛查。启动子甲基化基因检测与肺癌风险评估应用团队小组先前已将痰中的基因甲基化鉴定为早期肺癌检测的有希望的生物标志物。启动子甲基化基因检测与肺癌风险评估应用团队通过评估科罗拉多队列中发生肺癌的嵌套病例对照研究中的 31 个基因来扩展这项工作,并在新墨西哥州 I 期肺癌患者的地理独立病例对照研究中复制有希望的基因。ROC 曲线显示,七基因面板的预测正确度高达 77%。此外,在新墨西哥州队列中,7 个基因中至少有 5 个被甲基化与肺癌风险增加 22 倍相关。
Defining a gene promoter methylation signature in sputum for lung cancer risk assessment.
Leng S, Do K, Yingling CM, Picchi MA, Wolf HJ, Kennedy TC, Feser WJ, Baron AE, Franklin WA, Brock MV, Herman JG, Baylin SB, Byers T, Stidley CA, Belinsky SA.
Clin Cancer Res. 2012 Jun 15;18(12):3387-95. doi: 10.1158/1078-0432.CCR-11-3049. Epub 2012 Apr 17.
PMID: 22510351
(责任编辑:佳学基因)