
图1. 四维代谢组学精准数据分析技术Met4DX
液相色谱–离子淌度–质谱依次从液相、离子淌度以及质谱维度对代谢物实现多维分离,所需要的时间也逐级减小。受到该分离方式的启发,本文开发了从一张质谱图出发的自下而上峰组装算法(mass spectrum oriented bottom-up assembly algorithm)用于四维代谢组学数据中四维峰的检测(图2)。该技术的特点是将每一张质谱图作为四维数据中的最小数据单元,采用逆向工程的策略依次构建其在离子淌度和液相色谱上的峰形。具体地,对于每一张质谱图,该算法会依次进行其前体离子的搜索、离子淌度流出峰的组装与检测、离子淌度流出峰的拓展、色谱流出峰的组装与检测和四维峰积分等五个步骤实现四维代谢峰检测与峰定量。本文开发的自下而上的峰组装算法避免了数据压缩与降维,有效地提高了四维峰检测的覆盖度与灵敏度。以上述算法为核心,本文进一步开发了适用于四维代谢组学的端到端的精准数据分析技术Met4DX,通过二级谱图去冗余模块、自下而上的峰组装模块、四维峰对齐以及分组模块、代谢物的多维匹配与鉴定模块等实现了的四维复杂代谢组的精准定性和精确定量分析。

图2. 自下而上的峰组装算法和Met4DX数据分析流程(图片修改自Nature Communications)
Met4DX技术能够实现高覆盖的四维质谱峰检测,定量精密度高。与同类技术相比(如MS-DIAL 和MetaboScape),Met4DX能够提升四维峰检测的覆盖度2-3倍,提升准确定量代谢物的数目2-5倍。Met4DX在代谢物同分异构体识别上具有优异的性能,以在小鼠肝脏代谢组为例,Met4DX精准识别代谢物同分异构体数目高达3033对,比同类技术显著提升3.6倍,并且可准确识别出CCS差异为1% 的共流出同分异构体。同时,本文还收集了 HMDB 和KEGG中的超过13万个代谢物,建立了目前最全面的四维代谢物数据库用于代谢物的多维匹配与鉴定。
目前 Met4DX 支持包括 布鲁克timsTOF 和 安捷伦 DTIM-MS 等仪器平台采集的四维代谢组学数据。为了方便相关领域研究者应用该工具,课题组提供了docker供学术界用户免费使用Met4DX(https://hub.docker.com/r/zhulab/met4dx-r)。该工作所开发的四维代谢组学精准分析技术Met4DX已经申请了国家发明专利和国家软件著作权。相关技术和软件的商业用途需要联系朱正江研究员进行授权使用。
该工作得到了国家自然科学基金委、科技部、中国科学院、上海市科委等的资助。
论文链接:https://doi.org/10.1038/s41467-023-37539-0