组学对比:蛋白质组>2组学整合>代谢组?
编者述要本研究基于英国生物银行的数据证实相较于标准临床预测指标和代谢组学谱血浆蛋白质组谱可显著提升17种疾病如部分癌症、代谢性心血管疾病的发病风险预测效能。摘要代谢组学、蛋白质组学等多组学技术可提供深层分子信息以提升疾病风险预测效能但大规模整合类组学的研究仍较为匮乏。本研究基于英国生物银行23,776名受试者的基线数据含159种核磁共振代谢物、2,923种Olink亲和蛋白质系统评估类组学对17种疾病发病风险的预测价值。结果显示相较于单纯临床预测指标加入组学数据可显著提升全部17种疾病的风险预测效能17种疾病中16种的蛋白质组单组模型预测效果优于代谢组单组模型且双组学整合相较蛋白质组单组未产生明显预测增益。本研究还鉴定出关键组学特征既包含KLK3/PSA前列腺癌等经典标志物也发现PRG3皮肤癌等新型候选标志物并通过关键蛋白建立疾病与药物使用、社会经济因素的关联凸显组学数据在提升个体风险预测、解析疾病分子机制、指导后续治疗研发中的临床价值。sunqchop.educancunc.eduyunlimed.unc.edu#多组学整合 #英国生物银行 #疾病发病预测 #代谢组学 #蛋白质组学 #生物标志物 #风险预测结果研究概述表1研究队列基本特征汇总23,776名研究对象的年龄、性别、种族、体重指数、吸烟状态以及17种疾病的发病例数与占比主要不良心血管事件MACE、冠心病CHD、外周动脉疾病PAD、慢性阻塞性肺疾病COPD。图1研究概述a. 3组基线预测指标集概述。本研究采用3组嵌套式基线临床预测指标(1) 年龄 性别(2) 动脉粥样硬化性心血管疾病ASCVD相关经典预测指标(3) 包含人口学、生活方式、实验室检测指标的综合临床预测集PANEL。b. 研究设计概述。研究纳入23,776名具备完整159种代谢物、2,923种蛋白数据的英国生物银行受试者。首先校正基线临床指标集X通过Cox比例风险模型计算各终点的鞅残差步骤1采用5次重复5折分层交叉验证每1折将队列均分5组4组训练、1组预测通过mixOmics建模步骤2将预测残差回代Cox模型以Harrells C指数评估性能5次随机种子重复验证稳定性步骤3通过特征重要性得分鉴定各终点的关键组学特征步骤4。组学数据提升预测准确性图217种研究终点的绝对C指数每个点代表5次重复5折交叉验证的平均C指数误差线为1个标准差基线模型仅纳入临床指标组学模型为基线模型联合预测鞅残差后计算C指数。经典疾病关联的关键组学特征验证图3 校正PANEL基线协变量后代谢疾病的关键组学特征热图展示校正综合临床指标后主要不良心血管事件、心力衰竭、冠心病、外周动脉疾病、心房颤动、2型糖尿病等代谢疾病的关键组学特征选取每种疾病前5位重要特征均为蛋白并展示其并集颜色代表关联方向深浅代表关联强度方格内为标准化重要性得分。关键蛋白在社会经济、生活方式与人口学因素中的富集图4 17种研究终点所有蛋白的特征重要性得分相关性相关性热图展示所有代谢物、蛋白的特征重要性得分在各疾病终点间的皮尔逊相关系数疾病呈现明显聚类心血管疾病主要不良心血管事件、心力衰竭、冠心病、外周动脉疾病、心房颤动高度聚集其中主要不良心血管事件与冠心病相关性最强r0.587白内障与青光眼2种眼科疾病、肝病与肾病两种代谢性疾病分别呈显著相关r0.314、r0.360。数据UK Biobankhttps://www.ukbiobank.ac.uk/use-our-data/apply-for-access/代码https://github.com/Dolce-99/ukb-multiomics详细总结思维导图组学预测性能对比核心结论参考Nat Commun. 2026 May 9. doi: 10.1038/s41467-026-73017-z.Multi-omics integration predicts the incidence of 17 diseases in the UK Biobank260509ukb_multiomics.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。