摘要未知代谢物的结构解析是植物代谢组学的核心瓶颈植物次生代谢物的化学多样性远超现有质谱库的覆盖范围。本文提出基于液相色谱-串联质谱LC-MS/MS的化合物注释增强平台DeepMASS v2可规模化解决该难题。DeepMASS v2依托在GNPS、NIST及自建资源的百万级质谱上训练的语义表征模型整合Spec2Vec光谱嵌入、分层可导航小世界HNSW图检索以及分子指纹构建的统一化学空间可为未知质谱匹配结构相近的邻域化合物并根据候选结构与预测化学环境的空间邻近度完成排序。经CASMI数据集与精选天然产物数据集基准测试DeepMASS v2性能优于SIRIUS、CFM-ID、MetFrag、MS-Finder等主流计算机模拟注释工具对于质谱库未收录的代谢物仍保持优异性能具备真正的未知物发现能力。将其应用于大规模植物数据集验证了该工具可有效拓展可解析代谢组的覆盖范围。DeepMASS v2以易用网页平台形式交付为学界提供可扩展、可解释、高通量的结构注释方案助力全面解析植物化学多样性加速植物分子科学领域的天然产物发现。durancaas.cnjianbinlabcaas.cnjihongchaocaas.cn#液相色谱 #串联质谱 #LCMS #代谢组学 #代谢物结构注释 #深度学习 #植物次生代谢物 #天然产物结果DeepMASS v2在植物代谢组学工作流中的定位图1DeepMASS v2工作流程原始质谱数据经预处理生成特征表及对应的1级、2级质谱1级质谱用于推断分子式并从化学数据库检索候选结构2级质谱经语义模型嵌入表征后与参考谱库比对以查找结构相近的邻域化合物。候选结构与参考结构均通过分子指纹投影至统一化学空间通过评估未知物在已知邻域中的相对空间位置推断其化学结构。网页服务器、独立图形界面及使用方法图2DeepMASS v2网页服务器界面截图界面包含质谱展示、元数据展示、预测结果展示等功能组件同时提供评估注释结果可信度的核心决策信息。基准数据集性能评估图3 基准数据集性能评估结果(a-b) 不同方法的注释性能对比展示前k个预测结果中包含正确结构的比例3条曲线从上到下分别对应全部质谱、代谢物在参考库中的质谱、代谢物不在参考库中的质谱。(a) CASMI数据集(b) 天然产物数据集。(c) 错误注释结果与真实结构在Murcko骨架、化合物超类上的一致性。(d) 以瑞香科定制瑞香烷2萜库为候选池58个瑞香烷2萜的排序准确率。可解释性与置信度评估图4 DeepMASS v2的可解释性与置信度评估(a) 6-溴喹啉-2 (1H)- 酮与N-乙酰-5-氨基水杨酸的代表性注释示例。通过Morgan指纹的UMAP降维可视化化学空间蓝色点为预测的前20个参考结构绿色点为检索到的候选结构红色点为正确注释结果标注了共享子结构的邻近化合物。查询质谱与邻域质谱的2级谱图显示出高度的光谱与结构相似性红色查询质谱蓝色邻域质谱。(b) 整合排序得分与前列候选结构相似性的综合置信度评估高置信度注释通常得分更高且与前列邻域的化学空间距离更小可提升代谢物鉴定的可靠性。案例研究1番茄成熟过程生物标志物发现图5 番茄成熟过程代谢组分析(a) 不同成熟阶段的番茄样品。(b) 分别经DeepMASS v2与TraceFinder注释后样品的主成分分析散点图。(c) 番茄不同成熟阶段中鉴定到的差异代谢物相对丰度热图。(d) 4种代表性鉴定代谢物的提取离子流图与2级质谱对比。案例研究2580种植物抗肿瘤代谢物全景分析图6 基于DeepMASS v2的跨植物物种抗肿瘤天然产物大规模分析(a) 注释得到的抗肿瘤代谢物在不同植物物种中的分布(b) 分子指纹UMAP投影展示这类化合物占据的广泛且异质的化学空间(c) DeepMASS v2排序位次与参考谱图光谱熵得分的关联(d) 各排序位次中光谱熵得分大于0.7的代谢物数量(e) 主要植物科与抗肿瘤代谢物化学类别的2分对应关系(f) 丁烯基苯酞与山姜素的代表性示例可在多个物种中高置信度鉴定且与标准品质谱高度吻合。数据番茄成熟案例研究的代谢组数据集可在ScienceDB平台获取资源编号31253.11.sciencedb.40096抗肿瘤代谢物数据集与本文所用级质谱标准品数据集可通过联系作者获取本文其他相关数据已随代码同步发布代码项目源代码、编译安装包、说明文档以及配套的最小示例与数据集均已托管于GitHub仓库https://github.com/hcji/DeepMASS2_GUI在线网页服务可通过以下地址访问http://deepmass.cn详细总结思维导图参考Plant Commun. 2026 Jun 26:101976. doi: 10.1016/j.xplc.2026.101976.DeepMASS v2: An enhanced deep learning platform for large-scale discovery and structural annotation of unknown plant metabolites260626DeepMASS_v2.pdf注AI辅助创作如有不当欢迎指出。内容仅供参考不构成任何建议。