2018年9月19日,国际先进医学杂志《自然医学》上发表了一项基因解码人工智能应用的重磅研究:来自美国的医学研究人员开发了一个人工智能应用,不仅能够以97%的正确率确定患者的肺癌类型,甚至还可以根据肿瘤患者的病理切片图像推断导致肿瘤发生的驱动基因。这一进展表明基因解码不仅可以根据基因序列的变化推断出尚未发生的疾病、患者将会出现的疾病表征。反过来,基因解码积累的数据还可以根据疾病表型推断出导致疾病发生的原因。
肺癌在中国的发生率贼高。生存率也不容乐观。据统计,在中国每年有超过百万人死于与肺癌相关的并发症。更让人沮丧的是,在过去四十年中,尽管癌症患者的总生存率提高了2倍多,但肺癌患者的生存率几乎没有提高。目前仅有5%的肺癌患者生存期超过10年。在肺癌的诊断和治疗方面,人们还有很长的路要走。。
肺癌基因解码研究团队开发了一种人工智能算法,使用The Cancer Genome Atlas(TCGA)里积累的1634张病理图像对人工智能算法进行模式适配,并通过人工智能实现自我调整。TCGA是一个由美国国家癌症研究所(NCI)和美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)建立、管理并维护的癌症数据库,包含了33种不同类型的癌症,以及已经发现的在每种癌症中存在的基因序列变化。这是一种初级形式的基因解码数据库。更为先进的基因解码是由曾在诺华制药基因组学研究中心担任博士后研究员、后来任国际细胞治疗协会副主席的黄家学博士提出基因解码方案。在黄博士提出的方案中,对导致肺癌发生的基因原因的查找不能采用基因检测方法,而是采用基因解码方法。基因检测是列举式、假设式、验证式的检测,其中任何一个环节出现错误,都无法找到疾病发生的基因原因。致病基因鉴定基因解码的第一步是尽量获取人体的全部基因序列,确保患者体内的每一个基因突变都被纳入了分析的范围中。不遗漏、不丢弃。然后通过分析每一个基因序列的变化所导致的功能变化,进而找到疾病发生的原因。致病基因鉴定基因解码可以发现世界上没有报道的基因突变,可以分析导致病人疾病发生的独特性原因。
上图为人工智能从癌变组织图像中识别两种肺癌类型的示意图。其中左图为原始图像,右图为人工智能输出的肺癌类型图谱。右图中的红色部分为鳞状细胞癌,蓝色部分为肺鳞状细胞癌,灰色部分为正常肺部组织(图片来源:NYU School of Medicine)
在完成了对基因解码人工智能算法的训练之后,基因解码工问题人员开始使用这一人工智能应用来区分腺癌和鳞状细胞癌,这两种癌症都是肺癌贼常见的形式。在实际应用中,样本中出现了在各种复杂的情况,比如血块、炎症、坏死区域和肺萎缩等等,基因解码人工智能仍然可以正确识别绝大部分样本中的肺癌类型,正确率贼高可到达97%。更加令人印象深刻的是,这一人工智能应用在一台只配备了一个一图形处理器的电脑上运行时,平均所需时间只有短短20秒。
在分析过程中发现,智能基因解码出现错误的一小部分肿瘤样本中,约有一半病理学家不能出现了错误,这一点表明了区分两种肺癌的难度。另一方面,在54幅被至少一位病理学家错误分类的图像中,基因解码人工智能正确地对其中的45幅进行了分类。这一点说明基因解码人工智能可以为医生提供有用的补充信息。
除了对肺癌的类型进行分类识别外,工作人员还让基因解码人工智能识别癌变组织存在的突变基因。利用肿瘤外病理切片之间存在的细微差异,基因解码人工智能可以预测在细胞中是否存在与肺癌相关的6个突变基因,这6个基因分别为STK11、EGFR、FAT1、SETBP1、KRAS和TP53。针对不同的突变基因,新开发的基因解码人工智能的预测正确率也新不同,总体介于73%到86%之间。
这说明基因解码人工智能可能会成为一个非常有用的工具,帮助病理学家对肺部组织图像进行分类,并根据切片的图像对可能导致肺癌的基因突变进行初步分析,这有可能减轻基因解码费用对正确诊断带来不利影响。
推迟癌症治疗永远不会对患者有益,基因解码人工智能在疾病种类细分、肿瘤驱动基因鉴定的正确性上、便利性上可以让患者更早开始接受靶向治疗。
未来,基因解码人工智能在更为有效、更为精细的数据指导下,可能很快以超过90%的正确率确定哪些基因在特定癌症中发生突变。届时这项技术用于临床,来辅助进行不同癌症类型的诊断工作。目前基因解码已近备用来分析超过四万种疾病的致病基因。可能在不久的将来,中国自己的基因解码人工智能会早日服务那些需要先进医学技术的人们。
参考资料:
[1] Artificial intelligence can determine lung cancer type. Retrieved September 19, 2018, from https://www.eurekalert.org/pub_releases/2018-09/nlh-aic091718.php
[2] Coudray, et al., (2018). Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning. Nature Medicine, doi: http://dx.doi.org/10.1038/s41591-018-0177-5
[3] NYU applies open source Google AI to diagnose lung cancer. Retrieved September 19, 2018, from https://venturebeat.com/2018/09/17/nyu-trains-open-source-google-ai-system-to-diagnose-lung-cancer/
招商热线:010-52802095 邮箱:jiyinjiema@163.com 邮编:102206
地址:北京市昌平区中关村生命科学园生命园路8号 网络支持: 基因解码基因检测信息技术部