临床测序重磅成果!300多种肿瘤突变数据集问世
日期:2017-05-19

  肿瘤分子分析是精准肿瘤医学的基本组成部分,它能够识别基因以及通路中所发生的变化,这是个性化医疗的关键。不同组织复发性突变的存在,加上分子靶向治疗组合的扩大,这就需要灵活且综合性的方法来分析全癌谱中与临床相关的基因。


4.png


  5月8日,NatureMedicine杂志在线发表了一篇“大作”,科学家们采用综合法——MSK-IMPACT开展了一个大规模的、前瞻性的临床测序项目,收集了10000多名晚期癌症患者的肿瘤及正常组织DNA序列、病理以及临床注释等各方面的数据。使用这些数据,他们确定了临床相关的体细胞突变、新的非编码区突变以及常见肿瘤与罕见肿瘤共享的突变标签。让人兴奋的是,研究人员将所生成的数据集对外共享(共享网址:http://cbioportal.org/msk-impact),使人们能够发现新的生物标志物以及针对罕见突变开展更深入的研究。


  它能够检测与癌症相关的410个基因


5.png


  MSK-IMPACT的工作流程


  首先来看看什么是MSK-IMPACT。这项技术是科学家们在纪念斯隆-凯特林癌症中心开发,是一种基于NGSpanel的杂交捕获技术,可检测与癌症相关的341个基因中的所有蛋白质编码突变、拷贝数变异、启动子突变以及结构重排。不过根据最新的发现,目前这种方法已经能够检测与癌症相关的410个基因。


  从MSK-IMPACT的工作流程图我们可以看到,患者首先要签订肿瘤与正常序列配对分析的知情同意书,然后研究人员收集患者的血液样本作为正常DNA的来源,利用自动化的方法来提取肿瘤和血液样本的DNA,并使用靶向410个基因的所有编码外显子的杂交探针来制备文库,随后是测序、数据分析。所生成的数据结果加载到自家开发的基因变异数据库中,并手动检测数据的质量和精度。基因组变化会在电子病历报告中显示,并被发送到机构开发的数据库中,这有利于自动化临床试验匹配,变异数据还会自动上传到cBioPortal中进行挖掘以及解读。


  300多种肿瘤生成了无与伦比的数据集


  自从该方法在CLIA实验室中开发以来,研究人员们已经使用它对上万名各类实体肿瘤患者进行测序。他们最关键的研究思路就是:利用正常组织与肿瘤组织相匹配,以汇编各个肿瘤的体细胞突变目录。从这个方向努力,研究人员终于生成了一个无与伦比的数据集。这个数据集包含了晚期癌症患者的癌变组织和正常组织的DNA序列、相关病理与临床注释数据。成熟的临床治疗反应和疾病相关的注释结果,使得这个数据集对确定新的生物标志物以及预测后续治疗反应有重要的意义。


6.png


  10336例患者的肿瘤分布图


  上图勾勒了本文中成功测序的10336例患者的肿瘤分布类型,包含62种主要肿瘤类型,又细分为361种类型。


  与以往的大规模基因组鉴定研究不同,这项研究所涉及的数据全部来自晚期患者,他们最有可能是分子靶向治疗的代表人群。另外,这项研究包含了300多个详细的肿瘤类型,这有助于人们理解驱动突变在所有癌症中的发生率,还有助于检测罕见以及不曾预料到的临床可行性突变。


  常见肿瘤的复发性体细胞突变


7.png


  常见肿瘤的复发性体细胞突变


  研究人员发现,在MSK-IMPACT研究队列中,突变频率最高的基因是TP53。TP53基因突变最常发生在高级别浆液性卵巢癌患者中(98%),其次是发生在食管腺癌(89%)和小细胞肺癌(85%)中。总之,在62种主要的肿瘤中,有43种发生TP53突变的概率大于10%。


  KRAS基因突变是第二个最常见的突变(15%)。KRAS基因突变在胰腺癌中最为常见(90%),其次是在结直肠癌中(44%。)。KRAS基因在所有肿瘤测序中密码子突变最为频繁,其次到PIK3CAH1047、PIK3CAE545和BRAFV600,它们至少在20个主要肿瘤类型中发生突变。


  此外,研究人员们还分析了TERT突变、激酶的融合与重排、突变标签和体细胞超变以及临床可行性和效用性。


  他们表明,企业规模的肿瘤测序是可行的,以及利用综合的癌症panel来匹配血液样本也是可行的。通过这种方式,他们生成了一个广阔的数据集,包含了10945个肿瘤的突变、拷贝数变异以及基因组重排。


  研究人员表示,虽然这项研究迈出了评估大规模前瞻性肿瘤测序的临床影响的第一步,但仍需要更多的研究来评估癌症基因组学对患者预后的长期影响。这些研究需要详细的纵向随访。此外,肿瘤测序的数据共享十分重要,只有共享才能发挥数据集的巨大潜力。