3分钟带你看懂代谢组学研究中常用的“套路”
日期:2017-08-30

  懂行的人都知道,代谢组学的研究纷繁复杂、种类繁多,实验得到的数据量也相当惊人。那么如何在代谢组学的研究中理出头绪呢?今天小编整理了一些常用的“套路”,希望能够给大家一些启发。


1.jpg


  一:代谢组学分析流程


  一般来说,代谢组的分析流程有:首先将代谢组分进行预处理,预处理的方法由测量分析方法决定,如使用质谱方法分析,则需要预先对代谢组分进行分离和离子化。接着,再对预处理后的组分进行定性和定量分析。


  预处理中,常用分离方法包括:气相色谱(Gaschromatography,GC),高效液相色谱(Highperformanceliquidchromatography,HPLC)。气相色谱具有较高的分辨率,但需要对代谢组分进行气化,并且对组分分子质量有一定的限制。高效液相色谱也在代谢组分析中被广泛地使用,因其在液相中对代谢组分进行分离,因此不用对组分进行气化,相较气相色谱具有测量范围更广,更灵敏的优点。此外,毛细管电泳法(Capillaryelectrophoresis)也可以对代谢组分进行分离,其应用较少,但在理论上其分离效率比高效液相色谱法高。


  在预处理时,常常会加入内参(internalstandards),以方便后续对样品的质量进行监控和对比,由于不同的实验批次、样品顺序对后续测量也有一定对影响,因此,还会加入空对照和混合样品对照来进行质量监控。


  对不同的代谢组分进行定性和定量分析的方法包括质谱分析法(Massspectrometry,MS)和核磁共振谱(NuclearMagneticResonanceImaging,NMR)等。其中,质谱分析法具有灵敏度高,特异性强等优点,被广泛地应用于检测代谢组分,可以对经过分离、离子化处理后的代谢组分进行定性和定量。


  离子化的方法包括:大气压化学电离(Atmospheric-pressurechemicalionization,APCI),电子电离(Electronionization,EI),以及电喷雾电离(Electrosprayionization,ESI)等,需要根据不同的分离方法选用。例如电喷雾电离,常用于被液相色谱进行分离的组分。但由于质谱并不能直接对生物溶液或组织进行检测,其应用一直受限。


  为了提高原有的质谱分析法的灵敏性,使样品的准备简单化,减少背景的影响,一些新的质谱相关技术得以产生。这些技术包括:二次离子质谱(Secondary-ionmassspectrometry,SIMS)和纳米结构引发器质谱(Nanostructure-InitiatorMS,NIMS),属于去吸附/离子化方法,这两种技术都不依赖基质。其中,SIMS使用高能离子束使样品接触表面解吸,具有高空间分辨率的优势,与质谱串联后是用于器官/组织造影的有力技术。而NIMS可用于小分子的检测。


  基质辅助激光脱附电离(Matrix-assistedlaserdesorption/ionization,MALDI)是一种较为温和的离子化方法,可以得到用常规离子化方法容易解离为碎片的一些完整大分子质谱信息,如DNA、蛋白质、多肽和糖等。解析电喷雾电离(Desorptionelectrosprayionization,DESI)是一种直接电离技术,可以与质谱串联后,直接对大气条件下的样品分析。其原理是利用快速移动的带电溶液流来提取接触表面的样品,可用于取证分析、药物、植物、生物组织、高聚物等的分析。激光烧蚀电喷雾电离(LaserAblationElectrosprayIonization,LAESI)是一种结合了中红外激光烧蚀和二次电喷雾电离的直接电离技术,可用于广泛的样品,包括植物、组织、细胞,甚至是未经处理的生物溶液如血液、尿液等。已被用于食品监管、药物监管等领域。


  核磁共振谱不需要预先对代谢组分进行分离,相较质谱而言,核磁共振谱具有结果可重复性好,样品准备较简单,不用预先分离,对样品破坏性低等优点,尽管灵敏性相较质谱低(存在争议,部分学者认为这是样品预处理工作流程不正确造成的),但因其易于使用,因此应用也十分广泛。


  除此之外,其他的检测方法还有:离子迁移率光谱(Ion-mobilityspectrometry,IMS)是一种基于离子化的分子在在气相载体中的迁移来分离和分析这些分子的技术,具有很高的灵敏度,可以单独使用,也可以和质谱、气相色谱或液相色谱串联使用。电化学检测串联高效液相色谱(electrochemicaldetectiontechniquescoupledwithhigh-performanceliquidchromatography,HPLC-ECD)可以用于测量复杂基质中低含量的组分,具有易用性、灵敏性、选择性,已被用于临床研究、食品检测、药物检测等领域。拉曼光谱(Ramanspectroscopy)基于振动光谱学,能够检测化合物结构和其微小变化,具有不破坏样品、样品预处理简易、高空间分辨率等优点,已被应用于临床病理学研究、微生物的分类和检测、化合物的分析等领域。


  二:代谢组学相关数据库(及常用软件)


  常用的代谢组学相关数据库有人类代谢组数据库(HumanMetabolomeDatabase,HMDB)、KEGG数据库、Reactome数据库(http://www.reactome.org)等,一一介绍如下:人类代谢组数据库(HMDB)是代谢组学热门数据库之一,包含人体内发现的小分子代谢物的详细信息,包含不少于79,650种代谢物条目。SMPDB数据库与HMDB关联,包含约700种人类代谢和疾病途径的途径图。KEGG数据库是代谢组热门数据库之一,包含代谢通路和互作网络信息。Reactome数据库主要收集了人体主要代谢通路信息以及重要反应。MassBank数据库主要收集许多高分辨率低代谢组分的谱图。


  BioCyc数据库包含通路和基因组数据。METLIN数据库,是商业化的代谢组及串联质谱数据库,包含有约43000种代谢物和22000个MS/MS谱图。FiehnLib数据库是商业化的代谢组数据库,包含约1000个保守的代谢分子的EI光谱。


  NIST/EPA/NIHMassSpectralLibrary数据库也是商业化的代谢组数据库,包含超过190,000个EI谱图。BioCyc数据库收集了通路和基因组数据,可以免费使用。MetaCyc数据库广泛收集了许多来自不同生物体的代谢通路以及酶的信息,囊括了超过51000篇文献。MMCD数据库收集有超过10000种代谢物的信息以及它们的质谱和核磁共振谱数据,大多数是拟南芥的代谢物。


  三:代谢组学与其他组学数据整合


  如何更好地整合各种组学数据目前仍是生物学界面临的一个重大挑战,并且有时还要面对不够完善的实验设计、不同实验平台的数据的整合。常用的方法是代谢通路水平的分析、生物网络分析、经验关联分析等。有一些软件或网站可以提供现成的整合多种组学数据的分析。


  如可以进行代谢通路富集分析的有:IMPaLA网站,使用了来自11个数据库等3000多个代谢通路的信息,可以用于整合多种组学的分析;此外还有iPEAP软件,MetaboAnalyst网站等也可以提供代谢通路富集分析。


  提供生物网络分析的包括:SAMNetWeb网站,可以提供转录组和蛋白组的通路腹肌分析和网络分析;pwOmics包,是R软件包,能够由随着时间变化的数转录组和蛋白组信息构建网络;相似的软件还有MetaMapR(R软件包,拥有用户界面)、MetScape(Cytoscape插件)、Grinn(R软件包)等。


  可以进行经验关联分析的有:WGCNA(R软件包),可以基于相关性和网络拓扑结构对多种组学数据进行整合分析;其他R软件包还有MixOmic、DiffCorr、qpgraph、huge。


  四:代谢组学数据的统计分析方法及策略


  得到代谢组学数据后,需要使用软件对原始数据的信息进行读取和分析,确定原始数据里面含有的代谢组分的成分,含量。有许多统计学软件可以对核磁共振谱、质谱数据进行读取、分析。XCMS是常用的用于读取、分析质谱原始数据的免费软件,类似的常用软件还有MZmine2、MetAlign、MathDAMP、LCMStats等。


  一旦得到代谢组分成分和含量,可以对这些数据进行统计分析。常用的分析方法有主成分分析(principalcomponentanalysis,PCA),偏最小二乘回归,聚类分析等,差异表达分析等。还可以使用前面提到的数据库,对结果进行功能、通路富集分析。