OSI/SMMS代谢组学小分子化合物快速鉴定分析软件系统,以下简称“OSI/SMMS”或“本软件”,是一款用于代谢组学未知化合物定性分析的先进软件,由中国科学院大连化学物理研究所和大连达硕公司共同开发完成。系统具有完备的多层次数据库,先进的定性匹配方法,以及良好的用户体验,可快速准确获取复杂代谢分析中小分子代谢物的定性信息。本软件构建了代谢定性分析的多层次体系:1) 自建近2000 个化合物的标准数据库,同时包含tR、MS1和MS2 的信息;2) 可同时使用4 个最受关注的网络数据库;3) 可任意自建扩展数据库。与此同时,系统具备数据的批载入与批量定性功能,可实现定性知识与经验的积累传递,可建立代谢物与实验样本间交互联系,以及包括中性丢失在内的丰富查询。系统功能全面、使用便捷,结果准确可靠,为代谢物鉴定分析提供整体解决方案。
本软件的特色在于快速、准确的实现未知代谢物定性,减少繁复的操作步骤,降低对使用者的要求。重要特色可归纳为如下几个方面:
-信息完备的自建标准数据库
-集成主流网络数据库
-先进的定性匹配算法
-多层次未知物定性
-定性经验的传递
-丰富的数据库功能
1、信息完备的自建标准数据库
本软件自建的主标准化合物数据库,包含近2,000 个不同代谢物的完整信息,采用AB SCIEX 5600+以SOP 方法,同时在正、负二个电离模式,以及高、中、低三个不同检测电压下分析,获得高分辨一级和二级质谱,以及保留时间信息。数据信息全面,结果准确可靠。
2、集成主流网络数据库
目前对未知质谱特征的定性鉴定,大多需从网络数据库中逐一搜集信息,再将信息进行汇总与比对,过程非常繁琐。为实现代谢物快速准确的定性分析,本软件集成HMDB、Metlin、Lipid Maps 以及MMCD 等常用网络数据库,方便用户同时从多个网络库中快速获取定性信息,有效节约分析时间。同时,软件中将主标准化合物数据库与网络数据库进行有效关联与整合,用户只需要将峰表数据导入到系统中,选择合适的数据库和算法条件,便可快速得到准确的定性分析结果。
3、先进的定性匹配算法
实因多级小分子代谢物信息的复杂性,对其进行定性分析时,需要根据实验条件,综合考虑多重因素,选择保留时间(tR),一级质谱(MS1)与二级质谱(MS2)信息中的一项或多项作为定性匹配分析的依据,以获得代谢物鉴定分析结果。针对这种情况,软件设计了多种先进的定性匹配算法,用户可根据数据的实际情况进行优选,亦可调整算法参数设置,筛选定性分析结果,实现不同数据情形下的代谢物鉴定。
4、多层次未知物定性
本软件通过完整的多层次数据库体系,可有效实现未知代谢物的多层次定性分析。用户在定性分析过程中,可优选自建主标准化合物数据库(中心库),该数据库信息丰富,分析准确可靠;若在该数据库中未能得到定性分析结果,则可在四种网络数据库中批量搜索,同时得到所有数据库的对比结果;用户亦可利用自己或他人构建的扩展数据库,充分利用过往研究中的定性分析结果,实现定性结果与经验的传递与分享;甚至在上述数据库中都无法得到满意定性结果时,峰表数据库(实验特征数据库)中亦对未准确定性的化合物信息完整记录,用户可与过往的实验结果进行对比与统计分析,这对研究而言是十分有帮助的。
5、定性经验的传递
以往在完成定性分析后,研究者本人或者其他人员均无法再有效利用这些已经完成的定性分析结果或者经验,浪费宝贵成果。定性分析极大依赖经验的积累,因此如何让前人的定性经验与知识为后人所用,是亟需解决的问题。在本软件中,用户可以自建扩展化合物数据库,将已经准确定性的物质添加到共享数据库(服务器端)中,丰富其他研究人员的未知物定性数据,提高定性分析的可能性,实现经验、信息的共享,达到高水平良性循环。此外,无法定性的质谱特征亦在峰表数据库中有完整记录,以便他人定性搜索所用,实现定性经验的传递。后人真正站在前人的肩膀上,提高了定性分析的效率与准确性。
6、丰富的数据库功能
本软件包括多种不同类型的数据库,并建立了数据库间的有效联系,以满足小分子化合物定性分析的需要,具体功能如下:
-完备的多层次数据库体系。本软件包含有多个类别的数据库,既有信息完整的主标准化合物数据库,四大主流的代谢物定性网络数据库,用户自建的扩展化合物数据库,以及包括实验样本特征的峰表数据库,记录多种实验条件,内标化合物,以及正、负电离模式下的加合物数据库等。在此基础上,建立数据库间的关联关系,全面满足小分子代谢物的定性分析需求。
-全面的中性丢失查询。中性丢失可挖掘质谱特征间的关联关系,有效辅助定性分析。本软件中提供了详尽的中性丢失查询列表,用户根据需要从数据库中获取全部中性丢失信息,或者指定的中性丢失特征,为定性分析提供有效参考。
-建立实验、样本与代谢特征的关联关系。软件实验特征数据库完整记录样本信息,包括样本类型,色谱与质谱仪器,以及实验分析条件等,可以通过实验信息查询该条件下的样本及代谢物信息,样本中的代谢特征,以及代谢特征在不同样本中的关系等。
-高效的数据管理方式。不同数据库中均包含海量质谱特征,尤其是随着系统的不断使用,数据库中所记录的信息亦快速增长。本软件通过对数据进行集中控制管理方式,并采用高效的算法,快速实现数据的增、删、改、查等,亦支持数据记录的快速导入导出,以及上传下载。
-可视化分析。将代谢特征通过图表等方式进行直观展示,方便用户清晰了解数据间的关联关系。