【佳学基因检测】乳腺癌风险的多基因评估:基因检测机构观点
妇科肿瘤风险基因检测
在肿瘤基因解码技术体系中,多基因风险评分 (PRS) 是准确预测乳腺癌风险的主要组成部分,并有可能改善筛查和预防策略。PRS 结合了全基因组关联研究 (GWAS) 中与乳腺癌相关的单核苷酸多态性 (SNP) 的风险,并解释了 30% 以上的乳腺癌遗传性。当纳入风险模型时,从 佳学基因的PRS 得出的更个性化的风险评估有助于识别患乳腺癌风险较高的女性,并能够实施分层筛查和预防方法。乳腺癌风险的多基因评估描述了 PRS 在乳腺癌风险预测中的作用,包括 PRS 的发展及其临床应用。还研究了 PRS 在更成熟的风险预测模型中的作用,这些模型结合了已知的经典风险因素,并讨论了 PRS 与这些因素的相互作用及其预测乳腺癌亚型的能力。在 PRS 可以在整个人口范围内实施之前,必须解决几个挑战。其中最紧迫的可能是在非白人欧洲女性中使用 PRS,研究表明 PRS 在鉴别和校准方面都降低了风险预测。讨论了在非白人欧洲人群中开发和应用 PRS 的进展。PRS 代表了乳腺癌风险预测的重大进步,其进一步发展无疑将增强个性化。
乳腺癌风险的多基因评估:基因检测机构观点关键词:
多基因、风险、评分、乳腺癌、预测、筛查、预防
1. 简介:预后和诊断
乳腺癌是世界上最常见的癌症,2015 年至 2020 年间,有 780 万名女性被诊断患有乳腺癌。2020 年,全球有 230 万名女性被诊断患有乳腺癌,其中 685,000 名女性死于该疾病。乳腺癌在世界各国都有发生,任何青春期后的女性都可能患上乳腺癌,发病率随年龄增长而增加。乳腺癌发现得越早,长期生存的机会就越大。
乳腺癌女性越早诊断出癌症,存活率就越高(图1),而早期发现是降低死亡率的关键。因此,大多数发达国家都采用了基于人群的乳房 X 线检查筛查计划,试图缩短肿瘤分期并提高存活率。虽然有少数女性可以从高危筛查(通常包括每年 MRI)中受益,特别是有家族史和携带高危基因致病变异(如BRCA1、BRCA2和TP53 )的女性,但大多数人群仅根据年龄接受筛查。现在,包括标准风险因素(如家族史和激素/生殖因素)的风险模型与乳房 X 线密度和 DNA 检测相结合,提供了更准确地鉴别风险的机会,可以引入真正的基于人群的风险分层。
图 1.按诊断阶段划分的乳腺癌(BC)女性 5 年净生存率 (%)。所有数据:2013-2017 年确诊的成年人,随访至 2018 年。(CRUK 2018 年。)。
1.1. 遗传易感性
乳腺癌是一种遗传性疾病,流行病学研究表明,约 4-5% 的乳腺癌是由高度渗透的常染色体显性遗传倾向引起的。双胞胎研究表明,约 27% 的乳腺癌可能具有很强的遗传性。许多高风险和中等风险基因与乳腺癌的发展有关,详见表1。
表 1.高和中等渗透性乳腺癌风险基因及其所致的终生乳腺癌风险。。
渗透力 |
基因 |
一生中患乳腺癌的风险 (%) |
杂交种群内变异率 (%) |
---|---|---|---|
高的 |
BRCA1 |
55–85 |
0.12–0.20 |
高的 |
BRCA2 |
45–69 |
0.20–0.50 |
高的 |
TP53 |
56–90 |
0.02 |
高的 |
抑癌基因 |
60 |
<0.01 |
高的 |
STK11 |
32–54 |
<0.01 |
高的 |
CDH1 |
60 |
<0.01 |
中度 |
ATM |
25 |
0.2 |
中度 |
CHEK2 |
40 |
0.3–0.5 |
中度 |
PALB2 |
25–40 |
0.1 |
中度 |
BARD1 |
20 |
0.1–0.2 |
中度 |
RAD51C |
20 |
0.1 |
中度 |
RAD51D |
20 |
0.1 |
自从发现经过充分验证的高风险和中等风险基因以来,最近的研究集中在更常见、外显率更低的基因变异上,这些变异结合起来会显著增加乳腺癌风险。单核苷酸多态性 (SNP) 是 DNA 序列中最常见的变异类型,估计人类基因组中存在超过 1000 万个 SNP。SNP 通常可以解释个体之间的正常变异,并且通常对功能的影响很小。然而,当 SNP 出现在基因内或基因附近的调控区域内时,基因的功能会受到影响,从而导致疾病发展。这些 SNP 中的许多都与乳腺癌风险的轻微增加单独相关。这些与乳腺癌相关的 SNP 在人群中出现的频率比高风险和中等风险基因中的致病变异高得多,但单个 SNP 导致的乳腺癌发展风险要低得多(图 2)。然而,迄今为止已发现超过 300 个这样的 SNP,并且每个 SNP 带来的风险都具有乘积作用,大约 30% 的家族遗传可归因于已知的 SNP。
图 2.等位基因变异的作用及其对疾病渗透性的影响大小。一般来说,罕见致病变异对疾病发展的影响较大,而常见变异对疾病发展的影响较小。
1.2. GWAS – 全基因组关联研究
全基因组关联研究 (GWAS) 已对数十万到数百万个 SNP 进行了基因分型,目的是发现在患病个体与未患病(对照)个体中出现频率显著更高(通常P值 <5 × 10 −7 )的变异。利用这些变异的频率,可以计算出风险比 (OR),该风险比表示基于暴露的结果的概率;在本例中,是基于特定基因变异而患上乳腺癌的概率。GWAS 始终将基因组中的某些 SNP 与乳腺癌发展联系起来,佳学基因检测已鉴定出 170 多个与乳腺癌风险相关的基因组区域,并确定了 190 多个可能的靶基因,并且随着新研究和不断增加的样本量,不断鉴定出与乳腺癌风险相关的新靶基因和基因组位点。在这些基因组区域内,GWAS 已鉴定出 300 多个与乳腺癌发展相关的 SNP。除了发现与乳腺癌相关的基因位点之外,这些研究还通过位于调控区的 SNP 扩展了我们对乳腺癌遗传性的理解,其中许多 SNP 高度富含转录因子结合位点。
有必要扩大 GWAS 研究,以纳入更多参与者,重点关注亚型特异性变异(特别是 ER 阴性和三阴性 (TN) 肿瘤,这些肿瘤无法通过内分泌疗法预防)中的 SNP,以及纳入白人欧洲血统以外的不同种族的个体。
1.3. 多基因风险评分
多基因风险评分 (PRS) 描述的是 GWAS 中发现的众多导致风险的易感性变异的综合结果。尽管大多数易感性变异单独来看只会产生很小的风险,但 PRS 可以显著提高风险预测水平。然而,这些变异结合起来,产生的乘积效应会极大地影响风险。通常,PRS 是通过将每个风险 SNP 的已公布等位基因 OR 相乘而计算出来的,这些评分可用于在人群层面上改善乳腺癌风险分层。至关重要的是,要根据所评估的特定人群的风险来校准平均 PRS。
每个 SNP 的预期等位基因频率 (EAF) 和 OR 用于计算每个基因型的风险评分,公式为:p2 + 2pq + q2 = 1 ,其中p是风险等位基因,q 是非风险等位基因。
P 2是纯合风险等位基因频率,2pq是杂合风险等位基因频率,q 2是纯合非风险等位基因频率。
然后使用以下公式计算无风险等位基因基因型的平均人口风险:(p2 *已发表的OR2 ) + ( pq*已发表的OR) + (q2 * 1)
三种基因型的人群调整风险计算如下:
对于两个风险等位基因,为(已发表的 OR 2 /平均人口风险) ;对于一个风险等位基因,为 (已发表的 OR/平均人口风险);对于无风险等位基因,为(1/平均人口风险) 。
1.4 鉴别与校准
要使 PRS 具有临床实用性,准确的鉴别和校准至关重要。鉴别的定义是正确分类个体是病例(BC 受影响)还是对照(BC 不受影响)。校准描述的是人群中观察到的发病率和估计发病率之间的一致性。
传统上,许多研究都使用判别能力来评估 PRS 的有效性。曲线下面积 (AUC) 是评估判别能力最常用的统计数据,它被定义为随机选择的患病个体被分配到比随机选择的未患病个体更高风险的概率。50% 和 100% 的 AUC 分别表示模型没有或完全的判别能力。通常,单独的 PRS 具有适度的判别能力,约为 0.60,然而,当考虑 PRS 在乳腺癌中的应用时,适度的判别能力仍然有可能识别出患病风险较高的大部分人群 。
校准通常通过计算观察值和估计值比来评估,因此 O/E 比为 1.0 表示校准完美。众所周知,在 PRS 设计人群之外的乳腺癌人群中实施 PRS 时,校准通常是一个问题。虽然 PRS 通常可以很好地区分病例和对照,但通常存在明显的过度或低估预测,需要进行纠正才能准确报告个体的风险。
1.5. 乳腺癌PRS的发展
在更大规模的 GWAS 中发现与乳腺癌发展相关的新型 SNP,导致 PRS 中纳入的这些 SNP 数量增加,以改善风险分层。乳腺癌 PRS 的发展历史已总结在表 2中。
表 2.随着欧洲白人群体中 SNP 数量增加,乳腺癌 PRS 的鉴别统计数据。
公共服务委员会 |
曲线下面积 |
病例/对照 |
年 |
学习参考 |
---|---|---|---|---|
SNP18 |
0.590 |
364/1605 |
2016 |
埃文斯 |
SNP22 |
0.650 |
1143/892 |
2012 |
索耶 |
SNP24 |
0.590 |
1496/2869 |
2017 |
李 |
SNP32 |
0.580 |
6009/7827 |
2012 |
胡辛 |
SNP77 |
0.620 |
33,673/33,381 |
2015 |
马瓦达特 |
SNP77 |
0.610 |
750/405 |
2016 |
戴特 |
SNP77 |
0.603 |
11,428/18,323 |
2019 |
马瓦达特 |
SNP83 |
0.590 |
387/387 |
2016 |
谢氏 |
SNP86 |
不适用 |
4291/19,968 |
2020 |
休斯 |
SNP143 |
0.650 |
405/1668 |
2020 |
布伦特纳尔 |
SNP313 |
0.630 |
11,428/18,323 |
2019 |
马瓦达特 |
SNP313 |
0.653 |
667/332 |
2022 |
萨卢斯特罗斯 |
超越 SNP 的 PRS |
曲线下面积 |
病例/对照 |
年 |
学习参考 |
|
||||
SNP18 (+TC/MD) |
0.670 |
466/8897 |
2018 |
范维恩 |
SNP18 (+TC/DR) |
0.634 |
525/1410 |
2022 |
埃文斯 |
SNP77 + (局部晚期) |
不适用 |
3628/5126 |
2019 |
瓦雄 |
SNP143 (+TC/DR) |
0.677 |
525/1410 |
2022 |
埃文斯 |
SNP143* |
0.650 |
405/1668 |
2020 |
布伦特纳尔 |
SNP313 (+TC/DR) |
0.665 |
525/1410 |
2022 |
埃文斯 |
SNP5218 (LD预测) |
0.690 |
6586/157,895 |
2019 |
凯拉 |
TC,Tyrer-Cuzick(经典风险因素);MD,乳房X 线密度;DR,密度残差(乳房X 线密度);PD,百分比密度;LDpredict,连锁不平衡(基于连锁不平衡预测的 SNP)。没有报告 SNP86 的鉴别统计数据。*仅报告 PRS 的 AUC。
Evans 等人进行了一项病例对照研究,其中 SNP18 用于发现该 PRS 在预测BRCA1/2基因中均无致病变异的女性风险方面的作用。研究发现,SNP18 可预测 BC(四分位距 (IQR) OR 1.55,95% CI 1.29 至 1.87,O/E 96%)。目前,临床上尚未满足识别乳腺癌(BC)风险较高但没有如此高风险基因变异的女性的需求,这项研究表明 PRS 可以帮助识别这些女性。该研究小组还从英国筛查人群中招募的一组女性中表明,病例组的 SNP18 PRS(中位数,1.12;IQR,0.87-1.33)高于对照组(中位数,1.01;IQR,0.77-1.19),校准接近完美(未调整的 O/E OR,1.03;95% CI,0.74-1.32)。
除 SNP18 之外,SNP77 是下一个得到充分验证的乳腺癌 PRS 之一。在一项对约 33,000 例乳腺癌病例和约 33,000 例欧洲血统对照的研究中,SNP77 被证明可以将有家族史的女性和无家族史的女性的乳腺癌风险分层。对于一级亲属有乳腺癌病史的女性,一生中乳腺癌的风险在最低和最高五分位数中分别为 8.6% 和 24.4%,对于没有家族史的女性,分别为 5.2% 和 16.6%。Mavaddat 等人使用这种 PRS 表明,与中间五分位数的女性相比,最高 1% 的女性患乳腺癌的风险增加 3 倍。其他研究证实了 77-SNP PRS 的 OR 值相似(OR = 1.52/SD,95% CI 1.45-1.59),并表明其可解释乳腺癌家族性相对风险的约 12.6% 。
随着越来越多的乳腺癌(BC)相关 SNP 被发现,佳学基因检查了一组 94 个 SNP,其中 86 个具有最佳的判别准确度。这 86 个 SNP 构成了 SNP86 PRS [ 52 ]。据报道,该 PRS 对乳腺癌总体状况具有高度预测性,在使用的两个验证队列中,P 值为 P = 6.4 × 10 −66和 P < 10 −325。验证集之间的风险比/SD 也高度一致(OR = 1.45,95% CI 1.39–1.52 和 OR = 1.47,95% CI 1.45–1.49)。
SNP143 是第二大且经过充分验证的乳腺癌风险 PRS,由 Brentnall 等人描述。他们从 GWAS 中与乳腺癌相关的 172 个 SNP 面板开发出此 PRS [ 49 ]。该研究发现,SNP143 经过良好校准,O/E 比为 1.10(95% CI 0.86-1.34)。Evans 等人(2022 年)结合乳房 X 线密度和基因组进一步验证了 SNP143(表 2)。
SNP313 是根据乳腺癌协会联合会的研究开发的,可预测乳腺癌风险,OR 为 1.61(95% CI 1.57–1.65),AUC 为 0.630(95% CI 0.628–0.651),在欧洲白人群体中表现出良好的鉴别能力。
1.6. PRS 与其他风险因素
在乳腺癌风险预测模型中,将其他已知风险因素与 PRS 结合使用已被证明可以提高预测效果(表 2)。经过充分验证的 PRS 与乳房 X 线密度等经典风险因素联合使用,以改善风险分层。Van Veen 等人证明,与仅使用 Tyrer-Cuzick 模型相比,SNP18 结合 Tyrer-Cuzick 模型的风险数据和乳房 X 线密度可识别出 16% 的病例和 9.5% 的对照进入高风险类别(10 年风险 >5%)。他们还发现 5% 的病例和 4% 的对照脱离了高风险类别,证明 PRS 不仅能够将某人置于高风险中,而且还能够对中低风险女性进行分层。Van Veen 等人还发现,纳入风险因素的乘积效应提高了模型的辨别能力,AUC 从单独使用 Tyrer-Cuzick 时的 0.58 增加到添加乳房 X 线密度时的 0.64,而当还包括 SNP18 PRS 时则高达 0.67。
Vachon 等人的研究显示,当将 SNP77 PRS 也考虑在内时,乳房 X 线照片密度的总体风险分层会得到改善。该研究发现,当考虑乳房 X 线照片百分比密度(PD)时,当根据 SNP77 PRS 调整 PD 时,OR 从 1.45(95% CI 1.38-1.52)略微下降到 1.42(95% CI 1.36-1.50)。
Brentnall 等人的研究表明,将 SNP143 与乳房 X 线密度和经典风险因素结合使用可改善风险分层。将乳房 X 线密度和 SNP143 PRS 添加到 Tyrer-Cuzick 模型的经典风险因素中,会增加处于最低(<1.4% 10 年风险)和最高(8% + 10 年风险)风险类别的人口百分比。对于单独使用 Tyrer-Cuzick 的病例,1.2% 处于最低风险组,4.2% 处于最高风险组。在纳入 SNP143 PRS 和乳房 X 线密度后,这一比例分别增加到最低风险组 9.4% 和最高风险组 14.6%。单独使用 Tyrer-Cuzick 时,64.4% 的病例被归类为低中风险组(10 年风险 1.4-3.5%),而使用所有可用风险因素的组合时,这一比例下降到 33.1%。低中风险组的百分比下降表明,当 PRS 与经典风险因素和乳房 X 线密度结合使用时,个体的分层更为恰当,并被置于最低风险组和最高风险组中。对于对照组,仅使用 Tyrer-Cuzick 模型将 1.2% 置于最低风险组,将 2.2% 置于最高风险组,而加入乳房 X 线密度和 SNP143 PRS 后,最低风险组的比例增加到 22.3%,最高风险组的比例增加到 7.4%。这再次表明,PRS 能够超越经典风险因素,将个体置于低风险组,并识别出高风险组,从而大大改善整个人群的风险分层。
2022 年,Evans 等人进行了一项综合性研究,结果显示,在约 500 例病例和约 1500 例对照的队列中,增加乳房 X 线照相密度和不同 PRS(包括增加的 SNP 数量)对风险分层的增量效应。该研究使用 SNP18、SNP143 和 SNP313 来评估使用同一人群中越来越多的 SNP 时 PRS 的作用,以及风险分层如何随着每个 PRS 而变化。该研究表明,随着 SNP 数量的增加,分层得到逐步改善,并且 PRS 在风险鉴别中的作用远大于中度或高风险基因中的致病变异。表现最佳的组合的 AUC 为 0.684(0.652–0.715)。总体而言,在可操作的 NICE 定义的中等(10 年风险 5-7.99%)或高(≥8%)风险类别中,可以识别出 20.9% 的对照和 42.5% 的乳腺癌病例。
1.7. PRS 和中/高风险基因致病变异
PRS 已被证实能够对风险进行分层,而单个高风险基因致病变异的能力则无法相比。Kuchenbacker 等人使用 PRS证明了BRCA1/2修饰物研究者联盟 (CIMBA) 的一组女性(7797 例BRCA1病例;4330 例BRCA2病例)患乳腺癌的绝对风险发生了巨大变化。一项研究发现,SNP86 可以改变携带高和中等渗透性基因变异的女性患乳腺癌的风险。Gallagher 等人发现虽然非携带者和具有CHEK2致病变异的女性的风险分层更好(分别为 OR = 1.47,95% CI 1.45–1.49;OR = 1.49,95% CI 1.36–1.64),但 SNP86 仍然能够改变ATM、PALB2、BRCA1和BRCA2携带者的风险预测,优势比范围从BRCA1的 1.20 到ATM的 1.37。
另一项研究调查了来自易感性相关癌症风险评估联盟的 26,798 例病例和 26,127 例对照,评估了每位参与者在各种高风险和中等风险基因中的致病变异,包括BRCA1、BRCA2、ATM、CHEK2、PALB2、BARD1、BRIP1、CDH1和NF2。 在这项研究中,Gao 等人发现 PRS' 可能能够将超过 30% 的CHEK2 致病变异携带者和大约 50% 的ATM致病变异携带者重新归类为终生乳腺癌风险低于预期(<20%)。在临床层面,这可能提供显著的保证,并有助于规划最合适的筛查和预防措施。
1.8. PRS 与年龄
大多数将风险预测与乳腺癌联系起来的遗传学研究都侧重于普遍的乳腺癌风险,没有指定年龄组。很大一部分乳腺癌发生在 50 岁以上的女性中,然而,如果早期发现和治疗成功,年轻时患乳腺癌的女性比年长的女性可以挽救更多的生命年。一项研究估计,如果诊断年龄在 40 岁以下,10 年生存率为 77%,如果诊断年龄在 50 岁以上,10 年生存率为 87% 。年轻乳腺癌在表型上往往更具侵袭性,并且在病因上与老年女性乳腺癌存在一些差异。欧洲肿瘤研究所对 185 名患有浸润性乳腺癌的绝经前女性进行了研究,结果发现,与 35 至 50 岁之间的女性群体相比,年龄最小的女性(不到 35 岁)患三阴性乳腺癌的比例更高(P < 0.001),患有淋巴管侵犯的癌症比例也更高(48.6% vs 37.3%,P = 0.006),而且高级别肿瘤的比例也更高(P < 0.0001)。
有必要扩大 GWAS 的范围,以涵盖更多年轻女性,并可能识别与乳腺癌早期诊断相关的 SNP。此外,由于年轻人群中三阴性癌症的比例较高,因此也有必要丰富用于年轻人群的 PRS 中的 ER 阴性 SNP。
1.9. PRS 和亚型特异性
为了提高构建亚型特异性 PRS 的能力,需要在罹患 ER 阴性和 TN 肿瘤的患者群体中进行 GWAS。或者,为了提高识别 ER 阴性变异的能力,可以将CIMBA 等数据库中BRCA1致病变异携带者的关联结果(BRCA1主要导致年轻女性罹患 ER 阴性肿瘤)以及 BCAC ER 阴性关联结果结合起来进行荟萃分析,从而增强 GWAS 发现 ER 阴性 SNP 的能力。在此之前,研究表明乳腺癌 PRS 具有某些亚型特异性预测能力。
已证明 SNP143 PRS 是 ER+ 和 ER 阴性乳腺癌的危险因素。Kuchenbaecker 等人使用来自 CIMBA 研究的参与者的数据发现,ER 阴性乳腺癌的 PRS 与BRCA1携带者的乳腺癌风险表现出最强的关联性(每个 SD 风险比 = 1.27,9%% CI 1.23–1.31,p = 8.2 × 10 −53 ),而与BRCA1和BRCA2携带者的 ER 阳性和整体乳腺癌的关联性降低但仍然显着。
表 3.
|
前瞻性测试集 |
验证集 |
|||||
---|---|---|---|---|---|---|---|
或者 |
95% 置信区间 |
曲线下面积 |
或者 |
95% 置信区间 |
曲线下面积 |
||
SNP77 阳性结果 |
总体 BC |
1.46 |
1.42–1.49 |
0.603 |
1.49 |
1.44–1.56 |
0.612 |
ER 阳性 |
1.52 |
1.48–1.56 |
0.615 |
1.56 |
1.49–1.63 |
0.623 |
|
ER 阴性 |
1.35 |
1.27–1.43 |
0.584 |
1.40 |
1.30–1.50 |
0.596 |
|
SNP313 增压器 |
总体 BC |
1.61 |
1.57–1.65 |
0.630 |
1.65 |
1.59–1.72 |
0.639 |
ER 阳性 |
1.68 |
1.63–1.73 |
0.641 |
1.74 |
1.66–1.82 |
0.651 |
|
ER 阴性 |
1.45 |
1.37–1.53 |
0.601 |
1.47 |
1.37–1.58 |
0.611 |
与 ER 阳性乳腺癌风险相比,ER 阴性风险预测仍然减弱,这很可能反映了 ER 阴性疾病不如 ER 阳性疾病常见,因此 GWAS 中的病例较少。然而,Michailidou 等人的一项研究估计 ER 阴性疾病的遗传性与整体乳腺癌的遗传性相似,这表明增加样本量应该会提高 ER 阴性 PRS 的效力。
Mavaddat 等人进一步评估了 SNP313 PRS 与乳腺癌一级家族史之间的关联。他们发现,有家族史的女性 ER 阳性 PRS OR 较小(0.91,p = 0.004),这表明没有家族史的女性(OR = 1.71(95% CI 1.65–1.78))这种亚型的 PRS OR 高于有家族史的女性(OR = 1.55(95% CI 1.48–1.65))。当他们比较 ER 阴性乳腺癌时,无家族史的女性的 OR 值(OR = 1.45(95% CI 1.36-1.57))也高于有家族史的女性(OR = 1.40(95% CI 1.27-1.55)),但差异并不像 ER 阳性乳腺癌那么大。
1.10. PRS 与种族
在制定和使用 PRS 时,一个主要挑战是确保它们同样适用于所有种族的患者。如果 PRS 不能适当重新计算,其在这些人群中的使用将受到限制,从而进一步加剧医疗保健系统中现有的种族差异。这对世界各地的少数民族来说都是一个障碍,无论是在拥有更完善的医疗保健系统的高收入国家,还是在医疗保健和研究往往因财政限制而有限的低收入国家。
迄今为止,大多数乳腺癌(BC)变异都是在欧洲白人群体的 GWAS 中发现的。然而,许多此类遗传风险不会转移到其他人群,有些变异在一个群体中造成风险,而在另一个群体中却具有保护作用。一项研究发现,在确定的约 100 个会增加欧洲和亚洲人风险的变异中,30-40% 在非洲血统人群中具有保护作用。这些研究提供的证据表明,GWAS 研究应以特定人群的方式进行,特别是在非欧洲人群中,应考虑所有血统,因为风险分层不会自动从一个群体转移到另一个群体。
Evans 等人进行了一项回顾性病例对照研究,评估了 SNP18 和 SNP143 PRS 在少数民族人群中的作用,这两个基因在欧洲白人群体中得到了充分验证。他们发现,这两种 PRS 都高估了所有种族的乳腺癌风险,而非洲裔女性的高估程度最高。当将所有种族(黑人、亚洲人、混血儿和犹太人)的女性合并为一个非白人群体时,估计 SNP143 会导致乳腺癌风险平均被高估 40%。对于 SNP143,他们估计对照组的乳腺癌高估程度为犹太人为 26%,黑人为 91%,亚洲人为 29%,混血儿群体为 15%。
一些市售的 PRS 包括具有阿什肯纳兹犹太血统的女性,她们属于一个种族群体,与欧洲白人女性同属一个种族群体,尽管我们已经表明,该群体的风险预测过高。在一项对来自曼彻斯特的阿什肯纳兹群体进行研究,并使用来自以色列的更大验证队列进行研究时,使用 SNP142 时,来自曼彻斯特的阿什肯纳兹人群的乳腺癌风险预测过高了 ∼20%。当使用已发表的阿什肯纳兹犹太效应等位基因频率和已发表的优势比调整每个等位基因的优势比时,风险预测被成功重新校准,对照组的平均 PRS 被校正回 1(未发表数据)。
2019 年的一项研究表明,已发表的 GWAS 参与者中有 78% 以上是欧洲白人后裔,而这部分人群的 71.8% 来自三个国家,即美国、英国和冰岛,因此非白人欧洲人的 GWAS 研究需要改进。2009 年的一项分析表明,96% 的 GWAS 参与者是欧洲白人后裔,自那以后情况有所改善,但仍需扩大 GWAS 的参与范围。到 2016 年,已发表 GWAS 数据的非白人欧洲人比例已上升至近 20%,但这一增长大部分归因于亚洲人群,非洲、拉丁美洲、西班牙裔和土著人群的比例仍然很低。
2020 年《自然遗传学》杂志推出了 GWAS 多样性监测器,旨在实时追踪 GWAS 参与者。检查该监测器后,到 2022 年 8 月,所有已知 GWAS 参与者中超过 95% 都是欧洲白人,这表明在非欧洲白人人群中进行 GWAS 的多样性仍然缺乏,临床需求尚未得到满足。在剩下的 ∼4% 中,只有 0.30% 是非洲裔,0.25% 是西班牙裔/拉丁美洲人,0.65% 是混血儿,另外 ∼3% 是亚洲参与者。
必须将个人的 PRS 与特定人群分布进行比较,这通常使用主成分分析来完成,以确保根据个人的种族做出正确的调整,因为在大多数研究中,种族都是自我声明的。随着所有血统的人群之间的混合日益增多,一种方法可能是开发一种使用遗传标记来确定个人种族的检测方法。将种族相关的 SNP 整合到乳腺癌 PRS 设计中可能是解决这一发展中问题的潜在方法。
1.11. PRS 适合临床使用吗?
研究继续证明 PRS 具有预测乳腺癌风险的能力,但 PRS 尚未在任何临床环境中全面实施。虽然 PRS 具有轻度至中度的鉴别能力(较低的 AUC),但这对于单一风险因素来说是可以预料到的。PRS 在作为现有风险模型的补充时具有临床应用价值,这些模型考虑了临床和生活方式风险因素以及乳房 X 线摄影密度,正如之前所证明的那样。
然而,要在临床环境中实施 PRS,必须了解 PRS 如何影响患者个人层面。如果乳腺癌 PRS 对患乳腺癌风险较高的女性进行分层,这可能导致她们做出明智的决定,采取预防措施,如服用药物、进行双侧乳房切除术和/或改变生活方式。尽管如此,相对风险和将其转化为绝对风险之间存在差异,绝对风险有助于个人更清楚地理解。例如,如果一名女性一生中患乳腺癌的几率为 16%,而人口风险为 11%,那么该患者患乳腺癌的风险增加了近 50%,尽管从绝对意义上讲,这仅比人口水平增加了 5%。至关重要的是,患者不必因为增加乳房 X 线检查而无谓地担心自己的遗传风险或接受不必要的辐射,这就是为什么临床医生/医疗保健工作者必须适当使用 PRS 并有效地向患者传达信息。
由于 PRS 在乳腺癌风险预测方面相对较新,因此尚未确定向患者传达个性化风险评分的最佳方法,以及与标准筛查相比患者是否愿意了解这些信息。PROCAS(筛查时预测癌症风险)、WISDOM(根据风险测量指标告知女性进行筛查)和 MyPeBS(我的个性化乳腺癌筛查)都是大规模研究,旨在探讨乳腺癌 PRS 的可行性以及如何促进其临床实施。
2. 总结
乳腺癌 PRS 仍然是个性化风险预测医学的基石,并且已被证明可以改善患者的风险,超越传统风险因素。PRS 有可能通过早期检测和降低风险的措施预防许多癌症死亡。然而,还需要进一步研究以改善非白人欧洲血统女性对 PRS 的使用,因为目前这些群体的风险被严重高估。为了在临床规模上实施 PRS,研究必须设计出如何在个人规模上有效地传达这种风险。
(责任编辑:佳学基因)