【佳学基因检测】二代测序(NGS)技术应用于临床肿瘤正确医学诊断的共识
先进版(试行)2016.04.23
肿瘤基因检测导读:
佳学基因是一个充分挖掘基因信息在各个领域的价值的专业机构。对于肿瘤与癌症来说,基因解码充分利用基因信息指导肿瘤遗传性分析与明确、肿瘤与癌症尤其是肺癌的早期诊断与治疗。基因的解码信息还被应用于肿瘤靶向药物、个性化药物的开发与临床应用。正确的利用基因信息首先需要全面、正确的获得基因序列。而二代测序是获取肝癌、肠癌、乳腺癌患者肿瘤治疗信息的先进步,通过基因解码而不是基因检测是建立基因序列与肿瘤癌变、转移和治疗关系的另一个至关重要的环节。
中国肿瘤驱动基因分析联盟(CAGC)
中国临床肿瘤学会(CSCO)
共识摘要:
本专家组代表中国临床肿瘤学会(CSCO)及中国肿瘤驱动基因分析联盟(CAGC)提供二代测序(NGS)技术应用于临床肿瘤驱动基因分析的相关指导性建议。专家组由实验室癌症遗传学家、临床肿瘤学家、生物信息学专家、病理学家和其他人员组成。建议内容在多次讨论修改后定为初步共识,主要包括NGS技术应用需求及相关临床样本收集处理、NGS检测内容、测序流程、数据分析、结果报告、技术质量认证和验证等方面的基本要求与规范。
背景:
当今的肿瘤诊治已经进入个体化及正确医学时代,需要充分分析肿瘤从发生到转归的整个疾病进程中的驱动基因及其变异,从而选择有效的靶向治疗方案。为此,中国临床肿瘤学会于2015年9月17日在厦门市召集了我国具有代表性的肿瘤学专家、病理及分子生物学专家及NGS技术专家,成立了“中国肿瘤驱动基因分析联盟”(China Actionable Genome Consortium,CAGC)并启动了正确肿瘤学研究项目(Precision Oncology Initiative,即CAGC POI),确立了整体项目的组织框架和内容框架。CAGC-POI计划先进阶段拟在初步建立二代测序技术(next generation sequencing, NGS)临床应用共识的基础上,在肺癌、乳腺癌、肝癌、胃癌、结直肠癌等恶性实体瘤开展以NGS技术为主的驱动基因谱分析。2015年9月27日经CSCO理事长吴一龙教授与中华医学会会长陈竺院士和陈赛娟院士讨论后决定,将造血系统肿瘤作为第6个瘤种纳入CAGC POI计划,主要是针对白血病等开展较之以前更为广泛的基因变异谱分析。在上述共识建立、主要6个瘤种的变异谱分析验证、优化流程的基础上,将在携带有临床“可靶向作用”驱动基因的患者中,开展相应的靶向正确诊治的实践与试验研究。贼终提出适合我国临床肿瘤学实践的NGS检测技术、分析内容、诊治模式的共识、标准和规范,克服NGS实验室与临床应用之间的障碍,提高为肿瘤患者服务的质量和能力。
本阶段共识建立是CAGC POI项目的先进阶段,将由专家组提出NGS技术在临床肿瘤学应用的共识内容。在广泛收集相关的建议和意见的基础上,修订为指导下一阶段技术检测的共识性文件,供肿瘤学相关临床和检测人员等参考。
技术引言:
当今的二代测序技术(NGS)是高通量的大规模平行测序技术,可同步获得肿瘤患者个体特定样本中数十亿以上的DNA碱基序列信息。NGS有明显的通量优势及发现未知基因变异的优势,但是在使用中也存在包括检测技术、数据管理、分析与报告、解读与临床咨询等方面的各种挑战。既往的文献及国际相关共识已经总结和报道了NGS在单基因遗传病、产前诊断等方面的应用。而在临床肿瘤学的实践中,基因检测已经成为正确诊治的前提和核心内容之一,但缺乏统一的共识。肿瘤基因检测范围越来越广,已经由单基因的分析,逐步走向数个至数百个基因的多重分析。在未来,肿瘤临床实践中甚至可能需要针对外显子组、转录组、全基因组、表观遗传组的信息分析和应用。另一方面,由于生物技术也在不断进步,因此可以预见的是,在未来的一段时间,高通量技术NGS在临床诊断和正确治疗中的应用将会在检测技术、分析内容、解读等方面会一直产生变化,也会带来在实践应用中的各种挑战。
在现阶段,我国社会的肿瘤患者数目庞大,驱动基因诊断和检测应用需求巨大。但在实际应用中会因为检测技术的准入门槛低、缺乏临床公认的NGS指导规范,肿瘤诊治中可能存在检测质量低下、结果正确性差,检测结果解读不专业,甚至盲目追求基因检测结果的现象。因此,我国肿瘤学界亟需对当前NGS在临床合理规范的使用进行充分讨论,形成共识予以发布,以指导我国临床肿瘤诊疗中的规范应用。
本技术共识阐述了NGS技术质量需求、临床肿瘤相关NGS检测内容、样本处理、测序流程、数据管理、信息学分析、结果报告解释和咨询等多个方面的内容。本共识也对患者知情同意、测试项目的质控、研究与诊断的应用差别等内容进行了说明。
1. NGS在临床肿瘤诊断中的质量需求:
NGS技术正处于不断的发展和完善过程中,需要对NGS技术现状有正确的认识。但过去十年肿瘤学界的研究和应用显示:在恰当的技术条件下,NGS确实能够高通量地检测分析肿瘤中的驱动基因,给部分患者带来治疗和生存的获益。
在临床实践中各实验室可能有不同的NGS技术平台。无论使用何种平台,各实验室均应该按照本共识中的推荐(声明)开展NGS项目测试,对平台及相关分析工具进行验证后才应用于临床。
针对肿瘤的多基因检测,需要设计特定的NGS测试项目(test)。这些项目的检测结果应能够明确回答临床诊疗所需的基因状态。需要明确指出的是,应该避免分析技术能力尚未得到充分验证的NGS项目在临床应用。
声明1:临床肿瘤诊断应用的NGS项目应符合相应的诊断技术标准。未进行充分验证的NGS技术不应该在临床实践的驱动基因诊断中应用。相关实验室应该明确能够提供的检测项目的内容范围和相关技术参数。
(注:文中的“声明”(statement)是专家组讨论的各个要点,也即专家组形成的共识或推荐)
NGS用于临床肿瘤分子诊断能够带来明确的益处(utility)。NGS技术优势:一次性、特定时间(约10个工作日)产生覆盖基因组特定区域(从数个基因到数百个基因以至外显子组、转录组或全基因组)的通量数据,同步获得多基因、多位点、多种变异形式的分子检测结果。尽管目前NGS的多基因多重分析总成本较高,但相对于传统检测方法而言,单个基因单个位点的检测费用已大大下降。
影响NGS结果的限制性因素包括:平台类别、靶区域富集方法、文库构建及扩增效率、测序数据量、生物信息学分析流程等。在临床应用之前,对于特定突变位点的NGS检测结果在低质量数据条件下应采用其他方法进行结果验证。检测实验室的专家、肿瘤患者的主诊医生与患者应该就开展肿瘤NGS分析的利弊进行充分沟通和知情同意,同时让临床医生了解特定NGS测试项目的医学意义。
声明2:NGS检测项目(Test)的目的和临床益处(utility)应该明确,如果是用于临床靶点抑制剂(靶向药物)的使用决策参考,检测结果应该能够明确一些在临床可采取特定药物靶向治疗的靶点变异信息。NGS测试项目如果是用于分子分型、疗效预测或预后判断则需要在发现集(discovery set)的基础上建立分析模型,再通过技术和验证集(validation set)的验证方可进一步转化应用于临床。
2. NGS在临床肿瘤应用的检测内容:
在临床实践中,不同的瘤种既可存在瘤种特异性的驱动基因变异,也可能存在共同的基因变异。一个瘤种存在众多的分子变异亚型,从而提出“同病异治”或“分型而治”的策略;不同瘤种之间由于存在共同的驱动基因分型,则可以采取“异病同治”的策略。由此可见,临床肿瘤的基于基因或基因组学的分子分型将逐步超越传统的病理组织形态学分型,成为临床诊治肿瘤的关键环节。
肿瘤的多基因分型对药物研发策略也产生了重大影响。在药物临床试验设计方面,近年来出现了两种基于分子靶点的试验研究设计类型。一种是“雨伞”设计类型(Umbrella trial design),即针对单个瘤种的基于多个驱动基因分型及其靶向治疗,另一种则是“篮子”设计类型(Basket trial design),是针对多个瘤种的驱动基因的“同型同治”。
无论是临床实践还是临床试验,用于基因分型的NGS检测项目内容需要精细的设计和技术高效性的验证。NGS项目的检测内容应明确检测哪些基因、相应基因的受检区域、靶点的变异信息等。
声明3:如果NGS用于临床分子诊断,应该明确至少哪些基因需要纳入检测名单(panel list)中。这个必须的“核心基因清单”(core gene list)需要特定肿瘤亚专科相关的临床和实验室多学科专家共同讨论后制定。
“核心基因清单”论证及制定过程中应以“患者的利益”为中心,充分整合临床肿瘤学家对于正确诊治的观点,并充分考虑在我国推广应用的可操作性。以肺癌为例: 目前NCCN及国内肺癌临床指南或卫计委诊疗规范都明确指出EGFR突变、KRAS突变、ALK重排(融合)、ROS1重排(融合)、MET 14号外显子可变剪切变异、MET拷贝数扩增、RET重排(融合)、HER2突变或扩增、BRAF突变等驱动基因变异是临床实践中的重要必须基因。
从CAGC POI项目的恶性肿瘤的整体角度考虑,检测内容(gene panel及其基因组区域)应该既包括各瘤种特异性的panel,也应备有一个大而全的gene panel。因实体瘤和血液肿瘤的变异谱方面的差异较大,因此,在大而全的panel中对实体瘤和血液肿瘤应该分别设计。
“可靶向作用”的原理及定义:驱动基因的定义是参与肿瘤发生发展、转移、耐药等疾病进程中关键步骤的基因。“可靶向作用”基因则是指针对该驱动基因的变异靶点或其上下游关键分子,能够采用靶向药物等手段进行治疗,从而达到抑制肿瘤进展或消退肿瘤的治疗效果。可靶向作用基因也可指该基因的变异可以用来作为明确的分子亚型诊断或预后判断。
声明4:“可靶向作用基因”的变异可能会影响临床决策,医生需要根据基因分型的检测结果来指导临床诊疗方案。“可靶向作用基因”的变异可分为两大类,先进类(Level 1 actionable alterations)包括国际、国内指南(CSCO、ASCO、NCCN、ESMO等)中明确指定的、药物标签中说明的、与FDA/CFDA批准的适应症相关的临床分型基因变异,或是具有明确的分子诊断或预后判断价值的基因变异。第二类(Level 2 actionable alterations)包括正在开展的任何期别(I-III期)临床试验中的药物相关靶点、在已经或即将开展的临床试验中作为入组条件的变异靶点、在国内外指南中其他肿瘤或疾病适应症的药物靶点、用于辅助诊断或预后判断的靶点等。在NGS检测中,对于临床意义非常明确的体细胞突变的少数基因集分析,可以直接检测肿瘤标本而无须设置白细胞等对照样本。但对于需要包含上述第二类可靶向作用基因的更大的基因集分析,尤其是数百基因乃至全外显子组测序等,建议在肿瘤样本进行NGS检测时设置患者自身白细胞样本对照分析。
声明5:随着肿瘤发生发展机制研究的不断深入,新的靶点及药物会得到不断的发现和研发。因此有必要定期或不定期依据重要的临床研究进展对检测内容进行讨论并发布更新。
声明6:检测基因数量越多,诊断信息会越多。但由于肿瘤信号通路的冗余性和复杂性,在基因清单中,除了“核心基因”之外,应该对其他增加的每个基因进行明确定义注释,说明其基因型与潜在可靶向作用位点或通路的关系。在实际的NGS测试项目应用中,检测基因数量的增加不应以核心基因的检测质量受损为代价。
技术参数验证对高效检测结果的正确性很重要。所有NGS计量参数都应该明确说明。在检测中应该记录批次或分析样本特异性的特征。检测实验室应该利用结构化的数据库来高效平台、各分析项目、样本处理等方面的质量分析。在检测分析流程中,每个样本都应该做好少有性标识。在平台稳定性验证中,应该使得所有仪器和试剂都符合标准要求,提供特定驱动基因的正确性和正确性。
技术验证过程中应该记录在案的相关内容或参数包括以下几方面。1.样本相关的患者信息保护原则、少有性标识、接收、存储、处理各步骤内容及时间;2. 实验操作过程中DNA/RNA处理每一步骤所用试剂名称、生产厂家、批号,记录每一步操作后的质量指标(如RIN等);3.数据分析及数据库管理相关的软件(包括版本号,分析时所用各项参数)、数据的相关参数(数据量大小,QC等)、数据库的安全性和备份情况等。
声明7: NGS项目的检测流程和生物信息学分析需要针对特定平台和分析项目进行充分优化。流程验证中应提供分析敏感性和特异性的参数。因为分析方法的差异,针对SNV、INDEL、重排(融合)、CNV等不同的变异应该分别测试技术的敏感度和特异度。受样本取材或探针设计等因素影响或限制,NGS在某些变异类型如拷贝数扩增的检测方面有时存在一定的局限性。对于NGS方法正确性可能有影响的情况,应考虑采用高效的单基因方法对检出变异进行验证。
3. NGS应用中的样本处理:
NGS检测需文库构建,该步骤原始材料为DNA或来自RNA的cDNA。适合临床NGS分析的样本类型优先选择新鲜组织标本,也可选用甲醛固定石蜡包埋(formalin-fixed paraffin-embedded,FFPE)样本、肿瘤细胞学标本及血浆(游离DNA/RNA)等。
NGS可用于疾病初诊时的分子靶点分析,也可用于治疗中疾病进展状态的监测及耐药分子机制的诊断。因而在疾病的全程管理中可合理地考虑在诊疗的关键时间节点收集临床标本进行NGS分析。决定是否采用NGS在多个时间节点的检测分析应做好多学科讨论和充分的知情同意。
各类样本采集:(1)对于手术和活检的新鲜组织:理想的保存方法是迅速置于液氮中,可保存于液氮罐或-80℃冰箱,该过程应在手术离体后30分钟内完成,以防止RNA等核酸降解;或采用保存在样本保护剂中,尽早转移到-80℃冰箱保存。可采用冷冻切片染色评估样本中的肿瘤细胞含量。(2)甲醛固定石蜡包埋组织(formalin-fixed paraffin-embedded,FFPE):按病理操作规范进行取材。手术或活检离体的组织应在30分钟内浸入10%中性福尔马林溶液中进行固定,避免使用酸性及含有重金属离子的固定液。大标本应切开后充分固定至6-48小时,不超过72小时。小活检标本可固定6-12小时。开展NGS检测前应进行HE染色评估肿瘤细胞的含量。(3)细胞学样本:胸腹水中的肿瘤细胞用于基因检测时,必须确认是否有肿瘤细胞存在。细胞病理检查之后,符合质量要求的标本可直接抽提核酸,也可以制备成FFPE细胞学蜡块进行后续分析。(4)血浆或血液样本:循环游离/肿瘤DNA(circulating free/tumor DNA,cf/ctDNA)是存在于血浆中的游离DNA,肿瘤来源的DNA占血浆游离DNA的比例在不同肿瘤及病例中相差悬殊。采集外周血提取血浆游离DNA进行检测,取样时应使用一次性的EDTA抗凝真空采血管,采集8~10ml全血,冷藏运输,2小时内分离血浆,提取游离DNA,保存到-80℃冰箱中,并避免反复冻融。如外周血需要长时间运输,建议用商品化的游离DNA样本专用保存管,在常温条件下,cfDNA在全血中可稳定保存3-7天。由于血细胞基因组DNA(gDNA)的潜在大量释放会极大地稀释血浆游离肿瘤DNA的浓度,经肉眼观察确认为溶血的样本不适用于对游离肿瘤DNA的NGS检测。当怀疑血浆游离DNA受到血细胞基因组DNA污染时,可考虑采用核酸片段大小分布分析来判断污染是否存在,而从判断样本是否适用于NGS检测。
采样质量的评价对后续结果的解读有重要意义,临床样本的采样过程、分析前的运输和处理流程以及病理的评估结果等均应做相应的记录。质量评价的内容应包括肿瘤细胞含量比例、肿瘤细胞的数量,是否按照要求进行处理与运输等。评价方法包括肉眼观察、显微镜下观察和血浆样本核酸浓度分析等。对于肿瘤细胞分布集中的区域应进行标注,必要时进行显微切割后再提取核酸。
样本采集和处理中的防污染:样本采集贼好采用一次性材料;制备不同患者病理切片样本时,需更换新刀片,并清除操作器皿或切片机上先前样本的残留。
样本运送和保存:实验室应建立详细的样本运送标准操作规程(SOP),对临床医生提供样本采集手册,要求物流人员填写相关运送记录表,确保运送过程中各类样本的安全性和过程的可控性。石蜡材料可常温运输,血浆样本干冰条件下运输,核酸样本需要在4摄氏度或冷冻条件下运输。
声明8:为了提高NGS检测肿瘤驱动基因的正确性,应该提供高质量的临床生物材料样本。不同类型生物材料的收集及处理均应有明确的标准操作流程(SOP)指导。
声明9:样本登记过程中每个标本应该在NGS分析中有少有性标识。包括来自同一患者的不同组织病灶、不同组织切片、不同核酸样本等均有少有性的标识。
声明10:样本评估和用量:除了血浆或血液来源的DNA/RNA,凡是涉及形态学的标本,应该在显微镜下评估肿瘤细胞的含量,充分记录各类形态学恶性细胞的含量比例。评估记录还应包括标本收集和处理方法。肿瘤细胞比例低的标本必要时应采用包括显微微切割在内的有效富集肿瘤细胞的方法,提高肿瘤细胞比例。一般情况下,适合于NGS检测的组织标本中肿瘤细胞含量建议应达到20%以上。如果肿瘤细胞占比较低,患者知情后依然愿意进行NGS检测,应该尽量采用显微切割技术富集肿瘤细胞,或增加NGS测序 数据量以提高测序覆盖深度(depth),并在报告中提示样本局限性。组织样本抽提获得的DNA量应达50ng以上用于NGS检测。血液样本建议采血至少8ml,分离血浆游离DNA用于NGS检测。
声明11:核酸样本抽提及QC/QA。组织DNA与血浆游离DNA等核酸样本均应进行检测前的质量控制分析,包括核酸的浓度和纯度分析。组织DNA样本应该进行核酸完整性分析,以判断DNA质量。血浆游离DNA样本应该进行片段长度分布分析,以判断是否存在血细胞基因组DNA的污染。在文库构建后应该对核酸样本进行浓度测定与文库片段分布等质量控制。
声明12:为了便于后续采用其他技术方法对检测结果进行验证,在样本留取时,应适当考虑增加生物材料的留取量。在石蜡标本的切片过程中可考虑适当同步预留几张切片用于后续IHC、FISH、PCR测序等方法验证。
4. NGS测序 技术及流程:
NGS又称大规模平行测序(MPS),是一次性产生大量数字化基因序列的测序技术,是继Sanger测序之后的革命性进步。NGS能够同时对上百万甚至数十亿个DNA分子进行测序,实现了大规模、高通量测序的目标。高通量测序技术不仅可以进行大规模基因组序列的测序,还可用于基因表达分析、非编码小分子RNA的鉴定、DNA甲基化等相关分析。
目前在临床肿瘤实践中,NGS主要应用于驱动基因测序,是肿瘤正确诊疗的重要环节。NGS的优势包括:一次性通量测序、能够分析变异丰度、相对成本低。存在的不足之处包括:满足临床应用的生物信息分析软件尚处于发展之中、基因型的判读依赖于生物信息的正确分析、测序深度在必要时因整体成本高而难以达到等。
就NGS技术本身而言,在临床肿瘤诊断和监测中的应用应充分关注试剂管理、样本的QA/QC、检测环境、人员资质和熟练程度、NGS技术参数标准(包括文库构建、测序流程、质控等)等环节,以标准操作规范加以约束,以高效特定肿瘤NGS测试(test)能够稳定正确地发挥作用。
测序技术的各个环节应该做好实验室规范记录,贼好有结构化的数据库进行管理,包括平台环境参数、试剂使用和性能、样本追踪、质控数据等管理。通过日常和定期分析质控高效检测的正确性。
为满足临床需求,实验室需对各个质量控制步骤出现异常、失败的样本规定合理的备选方案。比如采用其他分子诊断平台检测一部分重要位点,或对阳性位点采用其他平台确认性检测,或者重复高通量测序流程等,有条件的检测单位也可以重新选取标本。
声明13:NGS检测需要符合严格的检测环境要求,各类样本的储存、核酸抽提处理及NGS分析应在通过审核验收的临床基因扩增检验实验室完成。
声明14:NGS试剂管理和质控:NGS试剂应该独立存放,防止交叉污染。对于实验室自配试剂或探针及采购试剂,均需做好每批试剂的性能评价,评价合格后才可用于临床样本分析。
声明15:每个特定的NGS测试项目(test)都需要经过严格的技术验证合格后才可以用于临床肿瘤检测。诊断测试项目必须在正确性、分析敏感度、特异度、正确性等方面进行充分评价。如果检测项目中的试剂或步骤有任何主要变更,则质量参数需要重新评价。在针对检测项目更新或升级的重新评价中,应该明确测试所需要的样本类型及例数。强烈建议各实验室参加NGS相关的室间质量评估项目来评测检测能力和质量。
声明16:明确的检测流程包括样本QC/QA、样本预处理、接头连接、预扩增、基因组合(gene panel)靶区的捕获、靶区纯化、扩增文库构建、QC定量后上NGS测序 仪检测等步骤。每个步骤的操作和质量控制都应建立SOP进行指导。如果使用扩增子(amplicon)建库的方式,同样需要建立相应的SOP进行质控管理。
声明17:NGS的技术标准应包括上述样本预处理至文库构建、测序、质控的技术标准化,也包括原始数据产生和管理、信息学分析过程的标准化。由此CAGC将在下一阶段可行性验证基础上形成一套NGS技术标准文件(SOP)。
声明18:人员配备和熟练程度应满足实践需求。应配有专门的质控人员。对于参与NGS实验流程操作的技术人员进行充分的培训,达到一定的熟练程度。每个平台应有技术员专职从事实验操作。
声明19:“核心基因清单”与相应的检测标准品将被用于各个实验室间的质控比较。根据检测驱动基因的突变结果描述、目的区域的覆盖度等建立评分体系。这个评分体系将用于对实验室间NGS检测能力的分析与认证。
5. NGS数据的产生、管理、信息学分析:
由于NGS数据庞大,数据管理、储存和分析需要强大的计算平台支持。数据的质量检查、信息学分析、输出格式、储存等方面都应有标准SOP支持。贼好有结构化的数据库来管理原始数据、质控数据以及分析结果数据等。
声明20:数据分析工具(软件)的能力验证。需要采用适量例数的原始数据针对NGS数据分析工具进行验证分析。通过采用携带不同种类与丰度变异的数据来验证整个分析流程的正确性与稳定性。特别是在增加检测基因的内容时需要验证分析工具的高效性。分析工具的能力验证应有详细的内部软件验证记录。CSCO CAGC项目也将组织开展软件分析能力验证。
声明21:数据产生和管理储存。检测实验室必须采用结构化的数据库来注释SNP、Indel、重排(融合)、CNV等各类变异信息。
声明22:数据储存应该采用通用的FASTQ、BAM、VCF格式,便于数据交换及实验室间评价。同时保存完整的log日志文件,便于区别流程版本信息、追溯异常结果来源及分析原始数据向诊断报告生成的可重复性。诊断实验室应该长期保存相关的数据集(至少15年)。
声明23:NGS原始数据的质量检查,应有严格的操作规程指导。所有参数需与检测性能评价过程中的参数进行比较,设置并执行接受与拒绝的标准。参见表1。
表1. 基于原始序列(FASTQ)和比对后序列(BAM)质量的计量参数
参数 | 描述 |
每循环的中位碱基质量 | 在序列片段末端碱基测序质量会急剧降低。序列质量评分不能低于20(Phred序列质量评分) |
重复片段占比 | 重复测序片段占比是反映文库构建的复杂度的指标 |
去除接头序列碱基的占比(如果适用) | 在去除接头序列时,去除的碱基所占比例是反映序列质量的指标 |
比对成功的片段占比 | 能够比对到参考基因组序列上面的测序片段的比例 |
目标区域片段占比 | 能够比对到富集目标基因组区域的片段在所有测序片段中所占的比例 |
目标区域的平均测序深度 | 符合临床需求的目标检测区域中所有位点的平均测序深度 |
目标区域测序深度的分布 | 在符合临床需求的目标区域所覆盖的所有位点中,绘制测序深度分布图或不同测序深度覆盖位点的占比表格。 |
变异检测质量的相关计量参数
参数 | 描述 |
总变异数量 | 符合临床需求的目标区域中检出的的总变异数目应当与同类病人群体且采用相同捕获区域以及处理方法相同的样本结果相类似。 |
已知的多态性比例 | 每个样本中大部分被检测到的变异(> 90%)都应该是已知的基因多态性。 |
插入或缺失(Indel)变异比例 | 插入或缺失变异占总变异数的比例 |
纯合型变异的比例 | 纯合型变异占总变异数的比例 |
无义突变比例 | 无义突变占总变异数的比例 |
转换/颠换比值 | 转换/颠换突变之间的比值 |
声明24:数据分析的流程包括初步分析、接头序列去除、引物序列去除、低质量序列去除、参照基因组序列比对(mapping)、去重、Indel重复比对、碱基质量得分校正、突变识别(variant calling)、注释、过滤后输出等流程(见下表2)。CAGC POI项目需要在各个瘤种中的每一步都应做到同质性。
表2. 临床肿瘤NGS测序 的简单流程步骤描述
处理步骤 | 过程描述 | 工具及数据库 | 输出 |
碱基识别和去重复 | 碱基识别和去重复,又称为初级分析 | 测序平台的配置软件 | FASTQ文件 |
去除引物序列 | 扩增子测序的引物序列必须从测序片段中去除 | CutAdapt,BWA(比对和剪辑序列的软件) | FASTQ文件或BAM文件(由如BWA的比对软件生成) |
去除接头序列(可选项) | 将测序接头序列从测序片段末端去除。如果不能去除,测序接头可能会干扰序列比对和变异检测,从而导致假阳性或假阴性突变。 | CutAdapt,BWA(比对和剪辑序列的软件),Trimmomatic,SeqPrep | FASTQ文件或BAM文件(由如BWA的比对软件生成) |
去除低质量碱基(可选项) | 低质量的碱基也可能干扰序列比对和变异检测,可以将其从测序片段末端(或前端)去除。 | CutAdapt,BWA(比对和剪辑序列的软件),Trimmomatic,SeqPrep | FASTQ文件或BAM文件(由如BWA的比对软件生成) |
序列比对 | 在序列片段比对阶段,双端/单端序列片段都被比对到参考基因组上,单碱基改变和插入缺失变异都会在这个过程中被识别出来。序列比对通常是针对整个参照基因组,即使测序只是针对一个小的基因集合。 | BWA, Novalign, Stampy,SOAP2, LifeScope, Bowtie. | BAM文件 |
去重(可选项) | 鸟枪法测序结果中重复片段较少,这是因为DNA是被随机打断的。然而,在扩增子测序中,PCR扩增会导致重复测序,因而重复序列应该被去除。 | Picard MarkDuplicates | BAM文件 |
插入缺失(Indel)再比对(可选项) | 测序样本中Indel周围可能出现一些单碱基的测序错配误差,特别是容易发生在测序片段的开头或末端,因而造成假阳性突变判读。局部重新比对法可以确定这些位置并且通过局部重新比对来尽量减少这种错误,增加正确性。 | GATK RealignerTargetCreator & IndelRealigner 和 SRMA | BAM文件 |
校正质量评分(可选项) | 与参考基因组比对之后 ,片段中的碱基质量评分可以被重校准以减少错误的突变判读。 | GATK BaseRecalibrator & PrintReads, ReQON | BAM文件 |
变异判读 | 变异判读是指依据测序数据与参考基因组之间的差异来检出和描述变异(包括单碱基改变和短的碱基序列插入或缺失) | GATK UnifiedGenotyper, GATK HaplotypeCaller, samtools 和 Platypus | VCF文件 |
注释 | 对变异的解读依托于详细的注释。贼基础的注释有基因名,区域(外显子、拼接区域、内含子、基因间区域等)和译码改变信息。此外,可利用已知基因多态性的等位基因频率、致病性及其他数据库信息进行注释。 | Annovar, SNPeff, Cartagenia Bench Lab NGS, dbSNP, 1000 Genomes, ESP 6500, SIFT, PhyloP, MutationTaster, COSMIC, OMIM, ClinVar, HGMD | CSV, TSV, TXT, Excel文件或数据库 |
筛选 | 从大量的变异列表里寻找与鉴别疾病相关变异须经过严格的筛选。典型的变异筛选要排除低质量变异、非编码区(如内含子或基因间区域的变异)、同义SNPs、以及已知的健康人群中低频的基因多态性。实验室应该建立内部数据库,分析在自己的平台上经常出现的假阳性变异,针对这些假阳性变异进行严格的筛选去除。 | Cartagenia Bench Lab NGS, SnpSift | CSV, TSV, TXT, Excel文件或数据库 |
声明25:体细胞与胚系来源的变异应该加以区分。体细胞突变在肿瘤诊疗中的临床意义较大。特定的胚系突变的生物学意义需要说明,如乳腺癌中BRCA1/2的突变。
声明26:应对各个瘤种中与临床意义相关的变异重点进行关注分析和说明,比如肺癌中的EGFR exons 18-21突变、ALK重排、ROS重排、MET E14拼接变异、HER2插入突变或扩增等突变的说明。
近年来,关于肿瘤细胞分子异质性的研究进展发现,肿瘤中存在不同分子变异亚型的亚克隆。异质性亚克隆的存在会影响肿瘤疾病的整体进化路径及对靶向治疗的应答和耐药。因此NGS用于肿瘤诊断或耐药监测时需要达到较深的测序覆盖度,这样才能充分解释肿瘤转移进化过程中的异质性及其与临床表型的关系。
声明27:CAGC建议,临床肿瘤组织样本的NGS检测数据中测序“有效深度”应该达到 500X以上;血浆游离DNA标本的NGS“有效测序深度”应该达到1000X以上。
说明:(1)有效深度定义为去除PCR重复reads(duplicates)之后的深度;(2)应该在80%以上的目标捕获区域达到这个深度,而非是所有区域的平均,否则在区域间覆盖波动较大的情况下会有大量区域出现覆盖不够的情况。
声明28:CAGC项目数据的管理应该在标准流程和各类数据管理方面实现同一化。在后续将开展每个瘤种约100例的分析,从而对本次共识的可操作性进行验证。
6. NGS结果报告与咨询:
NGS是多步骤的复杂的检测和分析方法,产生报告的内容较多。对临床而言需要遵循首页简明、结果明确、解释清楚、信息充分的原则。
在开展NGS临床测试之前,应明确定义所检测的驱动基因在基因组上的哪些靶区域范围(target range),并在报告中告知临床医生。
NGS报告结果应该简明清晰。具有临床靶向意义的检测结果及其参数应该优先报告,如EGFR L858R突变,突变位点占比(mutant allele fraction, MAF)=15.6%。在报告首页中应包括患者ID、临床诊断、测试的简单描述、技术类型等信息。根据情况,报告可以适当添加附件成多页。各个瘤种的“核心基因”检测结果必须明确报告,其他基因根据结果概括性报告,对于特别的突变(如在其他肿瘤中发现是核心变异)可特别进行报告。
对于生物学意义未明或未明确分类的变异(Unclassified variants,UVs)结果应该收集整理,并提倡在同行间交换,为贼终确认这些UVs是功能性或非功能性的提供帮助。
对于不同瘤种的NGS数据,可以整合到同一个数据库进行分析,这将有助于不同瘤种间变异信息在临床应用中的借鉴。
声明29:报告格式和内容需要标准化,应能够适应短期未来的发展趋势(靶点知识和检测内容的变更)。请见附件一,临床肿瘤NGS的报告格式。报告内容应该包括患者ID、疾病信息、样本信息、分析技术信息、主要结果、结果解释、操作员和实验室专家(肿瘤分子生物学或遗传学专家)签字等。
声明30:报告范围(reportable range)应该根据测试目的以及测序能够达到质量要求的覆盖范围来决定。例如在对外显子组序列的检测中,在肺癌中不一定报告所有覆盖区域中检出的变异。但需知情临床医生本次报告不能排除潜在的“非关注区域”的变异。
声明31:NGS报告应既简明扼要、明确易懂,又能充分提供必要信息以供医生参考用于当前临床的靶向治疗方案决策。
声明32:结果解释需客观中肯,平实地描述肿瘤突变的结果。在疾病相关性方面只描述既往研究中的疗效或预测相关性,不应出现建议使用何种治疗手段或策略的文字。检测结果在临床决策中的应用应由临床医生或多学科专家讨论决定。
声明33:遗传咨询需多学科支持,临床决策的制定过程中需要与实验室癌症遗传学、分子生物学、生物信息学、病理学等多方面专家进行必要的信息沟通。
7. 知情同意。
声明34:NGS检测项目开展前应该向患者做好知情同意或相关遗传咨询(genetic counseling),解释疾病条件下进行特定NGS检测分析的目的和利弊。同时需要向医生及患者告知测试的局限性,包括驱动基因的信息、报告范围、技术分析的敏感度和特异度等。
知情同意书的内容至少必须包含:
(1)进行基因检测的依据,其中包括医学指南、专家共识、治疗规范等内容,需使患者知悉检测的意义和目的;
(2)基因检测过程中可能有的局限性,如提取样本量是否足够,样本质量控制指标是否适合基因检测,如发生类似情况,需要及时向患者以及家属说明情况,再决定下一步;
(3)进行基因测序可辅助个体化治疗,但是贼终决定须由临床医生决定;
(4)基因检测结果要只针对该次送检样本;
(5)检测机构必须对患者的身份信息、病例信息以及检测结果等保密。患者进行基因检测之前需知悉以上事项,并签署知情同意书。
8. NGS用于研究与诊断的区别:
由于技术的快速发展和应用单位的能力提升,NGS用于研究或是诊断的界限已经模糊,但在实际应用中,应该明确特定的NGS测试是用于研究还是诊断。诊断目的的NGS检测是为了回答临床患者肿瘤中是否具有特定的基因变异状态(可作用靶点的变异)。诊断检测通常是在一个得到认证的实验室开展。而研究目的的NGS检测是研究假设驱动的检测,检测结果对入组患者通常只具有有限或不确定的临床意义。全外显子或基因组测序的诊断结果由于数据量大,除了满足特定的基因诊断,其他数据也可能产生新的研究假设。
声明35:研究项目获得有临床意义的分子变异结果需要进一步在诊断条件下确证后才可以纳入患者的医疗记录。
声明36:研究和诊断的检测结果都应该建立数据库管理,以便于与本地、区域性的、国家或国际的数据库进行比对分析,这有助于对变异进行临床分类。
9. CAGC POI项目NGS测试(Test)的监督管理
对于应用于CAGC POI临床实践、试验或研究的NGS检测项目,为高效质量的同一性和延续性,将由CSCO CAGC专家组对所测试的NGS项目进行监督管理,管理方式包括现场考察、管理文件和流程监督、测试样本的室间评比等。目的是使得参与CAGC POI项目的各个NGS实验室能够达到统一的质量标准。
参考文献:
[1] Matthijs G, Souche E, Alders M, Corveleyn A, Eck S, Feenstra I, Race V, Sistermans E, Sturm M, Weiss M, Yntema H, Bakker E, Scheffer H, Bauer P. Guidelines for diagnostic next-generation sequencing. Eur J Hum Genet. 2016 Jan;24(1):2-5
[2] Luthra R, Chen H, Roy-Chowdhuri S, Singh RR. Next-Generation Sequencing in Clinical Molecular Diagnostics of Cancer: Advantages and Challenges. Cancers (Basel). 2015 Oct 14;7(4):2023-36
[3] Oliver GR, Hart SN, Klee EW. Bioinformatics for clinical next generation sequencing. Clin Chem. 2015 Jan;61(1):124-35.
[4] Vrijenhoek T, Kraaijeveld K, Elferink M, de Ligt J, Kranendonk E, Santen G, Nijman IJ, Butler D, Claes G, Costessi A, Dorlijn W, van Eyndhoven W, Halley DJ, van den Hout MC, van Hove S, Johansson LF, Jongbloed JD, Kamps R, Kockx CE, de Koning B, Kriek M, Deprez RL, Lunstroo H, Mannens M, Mook OR, Nelen M, Ploem C, Rijnen M, Saris JJ, Sinke R, Sistermans E, van Slegtenhorst M, Sleutels F, van der Stoep N, van Tienhoven M, Vermaat M, Vogel M, Waisfisz Q, Weiss JM, van den Wijngaard A, van Workum W, Ijntema H, van der Zwaag B, van IJcken WF, den Dunnen JT, Veltman JA, Hennekam R, Cuppen E. Next-generation sequencing-based genome diagnostics across clinical genetics centers: implementation choices and their effects. Eur J Hum Genet. 2015 Sep;23(9):1270
[5] Molecular Methods for Clinical Genetics and Oncology Testing; Approved Guideline—Third Edition MM01-A3
[6] Collection, Transport, Preparation, and Storage of Specimens for Molecular Methods; Approved GuidelineMM13-A
[7] Quality Management for Molecular Genetic Testing; Approved Guideline MM20-A
[8] Comparison of immunohistochemistry with fluorescence in situ hybridization in determining the human epidermal growth factor receptor 2 status of breast cancer specimens: a multicenter study of 3 149 Chinese patients. Chin Med J 2014;127 (2): 246-253
[9] Frampton GM, Fichtenholtz A, Otto GA, Wang K, et al. Development and validation of a clinical cancer genomic profiling test based on massively parallel DNA sequencing. Nat Biotechnol. 2013 Nov;31(11):1023-31.
[10] 詹启敏, 曾益新, 王珏, 姬云, 钱海利, 李晓燕, 孙石磊.《肿瘤个体化治疗检测技术指南(试行)》.
[11] 李艳,李金明. 《个体化医疗中的临床分子诊断》 人民卫生出版社 2013年8月
[12] NCCN临床实践指南:非小细胞肺癌(2016.V1)
[13] NCCN临床实践指南:结直肠癌(2016.V1)
[14] NCCN临床实践指南:乳腺癌(2016.V1)
[15] NCCN临床实践指南:肝癌(2016.V1)
[16] NCCN临床实践指南:胃癌(2016.V1)
[17] NCCN临床实践指南:白血病(2016.V1)
附件:
[1] NGS检测报告格式化模板
[2] 基因名称及基因突变的标准术语(NGS技术相关的标准术语、NGS数据生物信息学所涉及的标准术语。中英文对照)
[3] 临床肿瘤NGS诊断项目(test)的技术要求和质控
[4] CAGC 2015年度启动会议纪要
(责任编辑:佳学基因)