【佳学基因检测】人工智能在基因检测中如何准确判断意义示明突变的临床意义
佳学基因检测导读
当患者接受基因检测以评估患某些疾病的遗传倾向时,往往会存在一些罕见的、意义未明的基因变异(VUS),这给临床医生的判断带来极大挑战,为基因检测受检者带来困惑和无助。与此同时,某些突变虽然不会直接导致疾病,却可能增加患病风险。为了解释这类复杂情况,佳学基因检测采用机器学习方法,对多个大规模患者队列进行了分析。基因解码团队通过临床数据为10种疾病计算“疾病风险评分”,并将其与基因数据(包括那些功能未知的罕见突变)进行关联分析。除了能够帮助解释这些变异对疾病的具体贡献,还开发出了一种未进入数据库的基因变异在其他疾病中作用的通用模型。
佳学基因检测为什么要开发人工智能基因解码模型
准确评估基因变异的“外显率”(即携带该变异个体最终发病的概率)对于疾病风险评估和临床决策至关重要。传统方法主要依赖疾病家系或特定人群,但这些研究常受到样本量小、选择偏倚等限制。更重要的是,传统的基于数据库比对的“病例-对照”分类方法过于简单,难以准确反映疾病的连续性特征。因此,借助大规模电子健康记录(EHR)与基因数据的结合,具有人工智能特点的机器学习(ML)为基因变异外显率的定量评估提供了新的可扩展路径。
基于数据库比对的基因检测所面临的困难
随着基因测序技术的发展,大量与疾病相关的罕见变异被发现,并提交到如 ClinVar 这类数据库中。然而,这些变异的分类主要依赖实验室和专家的主观评估,缺乏真实世界的大样本数据支撑。这种情况下,不仅变异的分类结果容易产生不一致,也让许多意义未明变异(VUS)难以解读。为此,基因解码团队开发了一种基于机器学习的方法,通过整合常规临床实验室检测数据与基因信息,更准确地估计这些变异的实际发病风险。
基因解码人工智能具有什么优势?
基因解码针对10种遗传疾病构建基于人工智能的机器学习模型,包括:
这些模型基于超过130多万名拥有电子健康记录的参与者数据构建,并验证于一个独立的外显子组测序队列中。基因解码团队根据模型计算出的“疾病概率评分”,评估了31个与常染色体显性遗传相关的基因中的1648个罕见变异,涵盖了已知致病(P)、良性(B)、意义未明(VUS)及未知功能的丢失性突变(LoF)。
分析结果显示,已知致病和LoF变异具有最高的机器学习外显率,VUS居中,良性变异最低。相比传统方法,该方法提供了更细致、量化的风险评估。
进一步分析发现,机器学习计算出的外显率与临床结局具有良好一致性,例如:
-
高外显率的多囊肾病(PKD)肾功能明显下降(肾小球滤过率降低40 ml/min)
-
高外显率的家族性高胆固醇血症(FH)变异携带者低密度脂蛋白水平升高(高出119 mg/dl)
此外,这些外显率评估结果还与实验室功能验证数据高度吻合,进一步支持其生物学有效性。对于VUS和未知功能的LoF变异,基因解码也能够描绘出其潜在的临床发展过程,例如生命体征、电生理指标和生物标志物的变化趋势。
如何看待人工智能基因解码
佳学基因人工智能基因解码开发了一种基于机器学习的人工智能的框架,用于大规模、系统性地评估基因变异的外显率。通过整合基因组与临床表型数据,该方法不仅为临床提供更精确的个体化疾病风险评估工具,也为未来的精准医学实践和未知变异的功能研究提供了范式。
(责任编辑:佳学基因)