6.代谢组学数据分析智慧云平台(One-MAP)One-MAP是由大连达硕(以下简称“公司”)开发的一款云端产品,该产品的中文全名为:,英文全名为:One-step Metabolomics: A Smart Cloud Platform for Metabolites Identification and Biomarkers Discovery,英文缩写为 One-MAP。“One-MAP 代谢云”,“One-MAP 智慧云平台”,或者“One-MAP 平台”,都是指 One-MAP。 One-MAP 是一款云端产品,网址是:www.5omics.com One-MAP 作为一款领先的代谢组学数据分析产品,主要解决如下二个问题。 ◆ 代谢物定性鉴定分析 One-MAP 平台含有目前全世界最大的代谢物数据库,总量超过 120万;同时也是目前全世界最大的代谢物二级质谱数据库,总量超过216 万。 基于上述代谢物及其二级质谱数据库,与目前普遍的定性方法相比较,比如基于有限标准品,或者 HMDB 和 Metlin 等网络数据库的策略,在不同定性分析的层次上,可实现增加 1-2 倍,甚至更多的代谢物定性能力,是代谢物定性鉴定水平质的飞跃。 One-MAP 平台中的代谢物来源,可分为四个层次,即标准品数据库,KEGG 靶向数据库,多源整合数据库,以及计算质谱数据库。上述标准品数据库中的数据,由中国科学院大连化学物理研究所检测完成,且全部来自标准品化合物,对每个标准品化合物,均在正、负二个电离模式,高、中、低三个能量下,检测其保留时间(tR)、级质谱(MS 1),以及二级质谱(MS 2)。上述 KEGG 等靶向数据库中的数据,针对 KEGG 数据库,或者特定样本类型等,构建个性化的数据库。以 KEGG 靶向数据库为例,以 KEGG中的代谢物作为对象,按照标准品数据库,网络可用资源,海量文献数据,以及计算质谱预测的可靠性,依照这些库的使用优先顺序(质量和可靠性等级),构建针对 KEGG 数据库中代谢物的保留时间(若有)、一级质谱,以及二级质谱的完整数据库。上述多源整合数据库中的数据,则是针对某一代谢物,基于代谢物唯一标识符信息,整合后构建其唯一的二级质谱,二级质谱信息的来源,包括不同的可得网络资源,海量文献等。基于此,构建可从不同维度表征代谢物二级质谱特征的数据。这样在对未知代谢质谱特征进行定性鉴定分析时,因所构建的二级质谱数据库中充分包含不同条件下所得到的数据,可实现未知特征的更准确、更可靠定性分析。 ◆ 上述计算质谱数据库中的数据,则针对特征样本或者样本类型,在采集其高分辨质谱数据后,对其中无法实现定性的质谱特征,采用计算质谱的工具和方法,预测其化学结构,实现定性分析,再构建针对性的数据库。基于上述数据库,用户在完成定性鉴定后,平台将给出定性分析的完整结果,包括代谢物鉴定时所使用的数据库类型(上述四个不同层次的数据库),所使用的定性信息,比如保留时间、一级质谱和二级质谱以及定性打分的得分,并给出全面的统计分析结果。此时不是单纯给出得分,而是针对不同数据库类型,以及定性分析时所使用的数据信息层次,给出具有数据来源信息的得分,以便于用户更充分地掌握被定性代谢物的全面信息,从而有效采取后续验证或其他措施。上述分层定性的策略,一方面提升定性的准确性,另一方面则提高对定性结果的理解,用户对结果的应用也更有针对性。 ◆ 差异代谢物高效发现 代谢组学数据分析,是一项非常耗时耗力,且专业性极强的工作,因而要真正做好并不容易。其原因在于需要数据分析工作者同时具备仪器分析和代谢组学背景,对质谱和高分辨液质仪器数据有通透的理解,尤其对各种单变量和多变量建模方法的原理和使用有丰富经验。加上代谢物定性鉴定分析的瓶颈,实现代谢组学数据分析是一项艰巨的任务。即使对非常理解和熟悉代谢组学数据分析的研究人员,在不同数据类型,不同软件系统或平台,以及不同程序间来回切换,实现不同的数据分析场景和目标,都必定成为科研工作中令人头疼的一环。 One-MAP 具有如下几个方面的数据分析功能特点,专注解决上述问题,把过往需要几天、十几天,甚至更长时间才能完成的工作,在几十分钟,甚至更短的时间内,一步到位完成。 一键实现代谢组学数据分析全流程:One-MAP 平台一站式提供代谢组学数据分析的几乎全部算法,以及可视化分析功能,用户可根据数据分析需要,“如同在超市选购心仪商品一样。选择分析待数据的系列算法,然后将这些算法“串起来”,构建成算法链,最后建立项目,把待分析数据和算法链组装起来,执行分析便能得到全部分析结果。这些结果按照算法链的构建顺序,依次运算获得。与此同时,One-MAP 平台亦已经构建系列典型算法链,可供使用者直接调用。若用户所构建的算法链,包含代谢组学数据分析完整流程所需的各个算法,则能一步到位获取全流程分析的全部结果,非常方便。最后全部结果以压缩包的形式供用户下载。 快速实现不同方法或参数下的结果比较:代谢组学数据分析,所涉及的方法多,绝大多数算法均带有几个甚至更多个参数,而参数的调整通常又显著地影响分析结果。这在传统代谢组学数据分析中是非常耗时麻烦的工作。基于 One-MAP 平台,用户则可快速实现对已经构建的算法链的修改(如算法的增加),调整(如算法使用顺序的变化),或者参数变化等。基于修改的算法链可快速实现数据的重新分析,完全省却目前数据分析流程中各个步骤均需人工重来一次分析的麻烦。 一步到位获得论文发表的图表结果:如前所述,用户将上述所构建的算法链作用于待分析数据,便能获得全部分析结果。这些结果会以压缩包的形式提供给用户下载。压缩包中不只是含有一个包含全部分析结果的 PDF 精美报表文件,而且还包括 PDF 报表中全部图形的独立高质量文件,供用户直接发表文章使用。这些图 形经过精心设计,美观大方,精确表达结果内涵。 数据分析全部中间结果供二次分析:除了分析结果的上述独立图形以外,每个数据分析算法的中间结果,均以 excel 表格的形式,提供给用户,便于需要的时候,进行二次分析,或 者二次可视化绘图等。One-MAP 平台的定位,就是成为代谢组学数据分析的终极解决方案。 “One-MAP平台在手,数据分析不愁”。有了她,代谢组学分析工作者,以及研究 人员便可远离数据分析的烦恼,犹如仪器数据采集时,使用自动进样器能够简便 获得数据一样,用户获得数据后,可使用 One-MAP 智慧平台简便获得准确、可靠的数据分析结果。研究人员则可将更多的精力和时间专注于提出和解决生物学问题,而不是费时费力,也同样具有高度专业性的数据分析问题。 概括来说,One-MAP具有如下特点: ◆ 解决痛点难点问题:One-MAP 平台瞄准代谢组学数据分析中二个方面的挑战,即代谢物定性鉴定分析和差异物发现的效率。前者是目前制约代谢组学研究的核心问题之一,后者则是研究人员在实际使用代谢组学的策略和方法进行研究时,所面临的现实难题之一,无论对熟悉数据分析的科研人员,还是数据分析的初学者,分析效率总是个问题。 ◆ 算法全面丰富:One-MAP 平台中,目前已经全面汇聚代谢组学数据分析的完整算法体系,共计有 56 个算法,2,500 余个程序,可实现数据预处理、数据质量分析、数据校正分析、统计可视化分析、单变量分析、多变量分析、定性鉴定分析,以及通路分析的完整流程。这些算法如何超市中的货品,供用户构建算法链时挑选使用。 ◆ 使用简单便捷:如前所述,尽管代谢组学数据分析过程复杂繁琐,但 One-MAP 的设计坚持简单便捷的基本原则。使用者无需经过长时间的学习,打开网页便能快速上手。 |