【佳学基因检测】PKD1基因检测与多囊肾遗传性分析
PKD1的基因解码
根据《人体疾病发生的基因原因分析》, PKD1是人体内的一个结构蛋白。除了PKD1以外,该基因还有其他的符号代码, 它们是PBP, PC1, Pc-1, TRPP1。基因解码明确负责将PKD1的基因信息传递给细胞内的蛋白质生成部门的是一个由14,148碱基组成的信使核酸。它们以46 个外显子的形式存在。这一信息是由存在于人体基因组中的长达52000个碱基对提供的。基因解码还发现,PKD1的时空调节序列成分中的启动子区域没有在其他蛋白合成中普遍存在的TATA序列,但是具有 E2F、EGRF、ETS、MZF1的结合位点 、SP1 和 ZBP89。 PKD1 启动子还包含一个 E 盒、MINI(肌肉启动子序列)结构域和一个 AP2 结合位点。基因解码过程中所采用小鼠 Pkd1 启动子的删除研究还明确了一个能够驱动基因表达的由280个核苷酸序列组成的时空调节片段,这一片段是时空调节和组织特异性调节的核心序列,因为额外的基因解码证据表明,如果将研究的片段扩大到更大的区域,则驱动基因表达的活性会降低。在验证基因解码结果的过程中,采用分子剪刀技术,突变 280 bp 片段内的潜在 E2f 结合位点会降低活性指标的强度,表明 E2F 在调节 PKD1 基因的细胞周期依赖性表达中的作用。 这些基因解码结果赋予了与佳学基因对PKD1的基因解码、基因检测能力超过了PKD1的蛋白编码序列之外。
PKD1的基因突位点
根据突变位点人工智能大数据模型分析:导致疾病的突变已在该基因的全长区域发现,如图所示:
PKD1的致病性突变及可能致病的基因突变位点分布
PKD1的致病性分析
在基因解码过程中, 基因信息破解与验证机构首先在人的基因组中确定了一个可以产生由14000个碱基组成的细胞内信息传递核酸序列的基因片段,该基因信息传递核酸序列在一个一型多囊肾疾病患者的体内被被染色体易位破坏。 经过进一步疾病表征和基因序列变化的关联性分析,发现这个多囊肾患者还患有结节性硬化症 (TSC2; 191092)。致病原因可以归结到患者体内的基因组序列的同一坐标区域。 佳学基因的致病基因鉴定分析表明,该患者的母亲的染色体存在一种称之为平衡易位46,XX t(16;22)(p13.3;q11.21)的染色体突变。由于婚前孕基因检测的重要性未被认识到,这一致病性突变被传递给了她的女儿,形成了本案例中的致病基因。由于同样的原因,该对夫妻的儿子存在45,XY 核型不平衡,具有 16pter-p13.3 和 22pter-q11.21 的单体性。使得该家庭的男性后代具有结节性硬化症的临床表型,这是因为位于16p13.3内的TSC2基因座在不平衡核型中被删除。 平衡易位母女均具有一型多囊型肾病(PKD1)的临床特征,而母亲的父母也就是患者的姥爷、姥姥染色体基因检测结果常,无结节性硬化症临床特征,超声检查无肾囊肿。 平衡易位中断点的位置靠近 TSC2 基因座超过 20 kb。 基因解码分离出一个跨越断点的基因并将其命名为 PBP(“多囊断点”)。 然后确定了其他I型多囊型肾病(PKD1)患者的 PBP 基因的突变情况。 发现的先进个突变是 PBP 基因 3-引物末端内的 5.5-kb 基因组缺失,该缺失突变存在于另一个患者及其父亲体内。检测到的第二个重排是 PBP 基因内的 2 kb 基因组缺失,发现其具有 446 bp 的移码缺失(在碱基对 1746 和 2192 之间)。 这是一个新发突变。 对第三名患者的基因组 DNA 测序表明,在 135-bp 外显子 (601313.0001) 之后的剪接供体位点的 +1 位置发生了 G 到 C 的转变。 剪接缺陷导致 PBP 转录本(碱基对 3696 至 3831)中 135-bp 的框内缺失。 第 4 名患者的 TSC2 基因和 PKD1 基因均发生缺失。 进一步的研究表明,缺失延展了大约 100 kb,并且缺失的大部分(如果不是全部的话)是PKD1 基因。佳学基因采用“动物园印迹”技术,证明 PKD1 基因在哺乳动物物种广泛存在,且序列保守,证明其结构与功能对所有哺乳动物的重要性。检测的哺乳动物包括马、狗、猪和啮齿动物。关于PKD1基因突变如何导致病疾病的发生,在基因解码的致病性机理中存在三种用以说明常染色体显性遗传的机理, 这包括单倍剂量不足、功能获得性突变(包括显性负效应)和二次命中机制(需要第二次体细胞突变) 产生有缺陷的细胞。
基因解码还发现 PKD1 基因座周围的区域异常富含 CpG 二核苷酸。 为了寻找多囊肾病的突变基因,基因解码在位于 PKD1 基因座侧翼且相距小于 750 kb 的 2 个标记之间的区域中的 CpG 岛中发现富含多囊性肾病的致病基因突变。在这一区域中,存在的一个基因ATP6C (108745) 是从 HeLa 和培养的囊性肾上皮细胞 cDNA 文库中分离出来的。 它编码由 155 个氨基酸组成的具有 4 个跨膜结构域的肽。 在所有测试的组织中都发现了指导这一蛋白质多肽生成的基因信息传递核酸序列mRNA,但在大脑和肾脏中贼为丰富。该氨基酸序列有与液泡 H(+)-ATP 酶的部分质子通道有 93% 的相似性。 由于突变质子通道在囊肿病发病机制中的可能作用,基因解码对受影响个体的两个等位基因对应的 cDNA 进行了测序,但发现氨基酸序列没有差异。 此外,转录物大小和丰度在囊性肾中没有改变。因此,基因解码将进一步寻找该序列与多囊肾疾病发生有关与无关的证据。
佳学基因分析多囊肾患者的致病基因突变的过程中,对该基因 3 个主要部分的 3 个区域的分析揭示了由机制发生的 2 个突变。 两者都是同一个75-bp 内含子中发生的缺失(18 或 20 bp),尽管这些缺失没有破坏内含子边界的剪接供体或受体位点,但它们仍然产生了基因信息传转录本的异常剪接。 每种情况都产生了两个不同的蛋白质合成指导信息链; 一个具有正常删除的内含子,而另一个由于5‘端隐含剪接体的存在,包含了应当删除的 66 bp 的序列。 缺失突变基因不能指导产生正常的功能蛋白质,从而为基因解码的结果解释提供证据。删除使内含子太小而无法使用真实的剪接位点进行剪接体组装。基因解码还在内含子中发现了一个 9-bp 的直接重复序列,这可能通过促进序列错位来促进内含子缺失。
ADPKD 的特征是在肾脏以外的各种器官(包括肝脏和胰腺)中逐渐形成囊肿。 基因解码使用ADPKD 供体肝囊肿的 DNA发现基因内体细胞突变(移码、无义密码子、严重剪接突变和杂合性缺失)在肝囊肿中很常见。 所有的致病突变都被证明改变了该基因以前的正常拷贝。 这些数据进一步验证了基因解码提出的关于囊肿(cystogenesis)双重打击模型,这也可以说明疾病中的第二病灶产生的原因。
PKD1 基因的独特结构特征是其易变性的原因。 PKD1 基因的内含子 21 中有一个极其不寻常的 2.5-kb 多嘧啶束,它会导致基因的突变率增加。多嘧啶束可能在其转录偶联修复中导致持续错误,从而导致高频率的体细胞突变。 因此,从单个肾脏病变的水平来看,PKD1 是一种隐性疾病。
PKD1基因检测筛查多囊性突变
PKD1 基因的突变筛选基因检测比较困难的原因在于,所需要检测的区域超过14000个核苷酸,而且在同一染色体上,编码蛋白质超过75%的区域反复出现。重复区域之间的序列相似性使得突变位点的定位和明确变得非常困验。基因解码首先在 PKD1 的独特 3-prime 区域中识别出突变。佳学基因开发的锚定 RT-PCR 方法使用位于单拷贝区域内的 1 个引物和重复区域内的 1 个引物来扩增 PKD1 的特定重复区域,解决了很多检测机构所面临的技术困难。
试图对 PKD1 基因进行完整突变分析的面临的一个主要挑战是存在几个同源位点,这些位点也位于 16 号染色体上。因为 PKD1 及其同系物的序列在 5-prime 区域几乎相同,大多数传统的突变分析方法无法区分 PKD1 中少有出现的序列变异。尽管连锁信息表明 PKD1 中的突变约占所有常染色体显性 PKD 的 85%。但是自从PKD1基因被证明是多囊性肾病1型的致病基因以来,数据库记载的致病基因突变仍然较少,并且大多数都聚集在该基因的独特部分。该基因长度的大约 70% 存在于 16p13.1 的至少 3 个忠实拷贝中。 重复区域从外显子 1 延伸到内含子 34,包括所有插入序列。 PKD1 拷贝被转录,但它们各自的 mRNA 分子可以根据大小与真实的 PKD1 转录物区分开来。 此外,平分 PKD1 的内含子 21 是一个不寻常的约 2.5 kb 的多嘧啶片段。 该元素也存在于 PKD1 同系物中。
为了通过基因检测检查分析 PKD1 的重复区域,佳学基因设计了一种新策略,该策略依赖于远程 PCR 和来自基因独特区域的单个基因特异性引物,以扩增跨越外显子 23 到 34 的 PKD1 特异性模板。这个 10-kb 模板,从 基因组 DNA,可用于使用范围广泛的基于序列的方法进行突变分析。 Watnick 等人使用这种远程 PCR 策略通过异源双链分析筛选序列变异。 (1997) 确定了几个在外显子 23 和 25 中具有碱基对替换簇的受影响个体。在 2 名患者中,这些在外显子 23 中确定的变化预计会导致蛋白质短链中的多个氨基酸替换。 这种不寻常的碱基对替换聚类表明突变可能是由 PKD1 基因的独特结构特征引起的。 肾囊肿是由体细胞突变引起的观察结果以及遗传性多囊肾病中由此暗示的高频率“二次打击”也表明了一种不寻常的突变机制。 瓦特尼克等人。 (1997) 观察到 PKD1 基因在 1、21 和 22 内含子中有 3 个长的多嘧啶片段,其中贼长的是 2.5 kb 在内含子 21 中。内含子 21 中的片段是当时测序的贼长多嘧啶片段,包含 23 主干长度至少为 10 个核苷酸的镜像重复。 他们预测,在适当的条件下,镜像重复很可能形成由三螺旋构象组成的 H-DNA 结构。 三螺旋结构可以促进培养细胞的局部诱变。 簇状多碱基对替换的不寻常模式与与三螺旋形成相关的模式一致。
多囊性肾病的致病基因鉴定基因解码的检测范围及检出率
在采用以全外显测测序为检测范围、以基因解码分析技术为基因突变注释的双盲临床实验中,收纳了174172 名患者(中位年龄,60 岁;60.6% 为女性),303 名患者经过临床诊断指标确诊为ADPKD,其中 235 名患者有明确的诊断依据记录。 除 PKD1 和 PKD2 外,IFT140、GANAB 和 HNF1B 中的功能丧失突变(LOF)在多重比较校正后被确定与ADPKD 诊断相关,而这些基因在很多基因检测包和基于数据库比对的基因检测中未被纳入。 在 PKD1 有功能丧失突变(LOF)变异的患者中,68 名患者中有 66 名 (97%) 患有 ADPKD; 在 PKD2 中具有功能丧失突变(LOF)的 43 名患者中有 43 名 (100%) 患有 ADPKD。 揭示出这一类突变的高发病率及高穿率。相比之下,之前被数据库标定为“可能致病”的 PKD1 错义变异的 77 名患者中只有 24 名 (31.2%) 患有 ADPKD,基因解码认变这可能是分类错误、也可能是这些突变引起的致病性可以受其他基因或者是外界环境的影响。在通过临床表征审核组审定的ADPKD 诊断患者中,235 名患者中有 180 名 (76.6%) 通过致病基因鉴定基因解码找到了潜在的遗传原因,其中大多数是在 PKD1(127 名患者)或 PKD2(34 名患者)上存在基因突变,这也是为什么对于价格敏感患者,佳学基因推荐进行这两个基因的全检测的原因。235 人中有 19 人 (8.1%) 在与囊性肾病相关的其他基因中存在变异,因此如果检则是为了追求高检出率,应当遵循佳学基因遗传咨询师的推荐。在这 235 名确诊的 ADPKD 患者中,150 名 (63.8%) 有 ADPKD 家族史。 与没有家族史的患者相比,具有 ADPKD 家族史的患者的 ADPKD 的找到致病基因的比率更高(91.3% [137/150] 对 50.6% [43/85];差异,40.7% [95% CI, 29.2%-52.3%];P < .001)。在这一双盲对照实验中, 在其他基因检测机构中未检出的 PKD1、PKD2 和 GANAB 基因突变,结过基因解码技术进行鉴定,证实了致病性。
(责任编辑:佳学基因)