01导语各位同学大家好。现在做影像组学如果还只停留在“提取特征—建个模型—算个AUC”那就有点像算命算得挺准但为啥准自己也说不明白。别人一问你这特征到底代表啥背后有啥道理瞬间就成了黑箱本箱。而真正能打高分、站得住脚的研究都在干一件事——给影像组学找“生物学娘家”让宏观图像和微观病理、细胞、基因、通路对上话。今天咱们就通过这篇发表在npj Precision Oncology上的文献看看人家是怎么从DCE-MRI影像出发无创预测三阴性乳腺癌中的三级淋巴结构TLSs再借助病理组学和SHAP解释把“影像特征→TLSs→治疗响应→细胞侵袭性表型”这条机制链讲得明明白白。这篇研究的聪明之处在于不满足于模型能预测还通过病理组学验证了为什么低评分患者预后差——因为他们的肿瘤细胞长出了“伪足”更具侵袭性。咱们今天就一起拆解这个“影像—预测—病理—机制”的闭环思路学会让影像组学从“只会算分的工具人”升级成“能讲清疾病故事的研究者”。★题目Machine learning model for predicting tertiary lymphoid structures and treatment response in triple-negative breast cancer用于预测三阴性乳腺癌中三级淋巴结构及治疗反应的机器学习模型★期刊《npj Precision Oncology》中科院1区IF8★研究疾病三阴性乳腺癌TNBC★生物学机制三级淋巴结构TLSs★发表时间2025年7月02研究背景-从 “临床问题” 落到 “生物学问题”三阴性乳腺癌TNBC是乳腺癌中侵袭性最强、异质性最高、复发和死亡率最高的亚型。新辅助治疗NAT已成为局部晚期TNBC的重要治疗手段近年来联合铂类及免疫检查点抑制剂如KEYNOTE-522方案可使病理完全缓解pCR率提升至约50%。然而仍有相当比例的患者对NAT不敏感若未能及时识别这些耐药人群延迟的手术窗口可能导致疾病进展、局部复发及远处转移风险增加。因此寻找能够无创、早期、精准预测NAT疗效的生物标志物是TNBC临床管理中的迫切需求。近年来研究发现三级淋巴结构Tertiary Lymphoid Structures, TLSs——在肿瘤微环境中形成的异位淋巴样结构与良好的抗肿瘤免疫应答及更好的预后显著相关。本课题组前期研究也证实TLSs的存在可预测TNBC对NAT的响应。然而目前TLSs的识别主要依赖有创的病理活检并结合多重免疫荧光、激光捕获显微切割、空间转录组等技术这些方法资源消耗大、操作复杂、难以临床推广。因此如何通过无创、可重复、高通量的手段预测TLSs的存在成为连接影像学与肿瘤免疫生物学的关键科学问题。影像组学Radiomics作为一种从医学影像中高通量提取定量特征的方法可无创评估肿瘤异质性。但单纯影像组学缺乏微观细胞层面的生物学解释而病理组学Pathomics能从数字病理切片中提供细胞核、细胞质、纹理等微观信息。如何将影像组学与病理组学结合建立“宏观影像—微观病理—免疫机制”的桥梁是本研究试图解决的核心生物学问题。03研究目的明确写出“三层目的”本研究旨在构建并验证一个基于影像组学的机器学习模型用于无创预测TNBC患者中TLSs的存在并进一步评估该模型对NAT治疗反应及预后的预测能力最终通过病理组学揭示模型背后的肿瘤生物学异质性。具体而言本研究包含三个层次的目标第一层目标是模型构建——利用多中心DCE-MRI数据提取肿瘤内及肿瘤周围区域的影像组学特征采用五种机器学习算法KNN、XGBoost、LightGBM、SVM、MLP构建预测TLSs的模型并筛选出最优的XGBoost模型作为rTLSradiomics-based TLS预测模型。第二层目标是临床验证——在多个独立的外部验证队列包括中国TNBC队列、DUKE队列、I-SPY2队列中验证rTLS模型对NAT治疗响应pCR的预测效能并通过生存分析Kaplan-Meier、Cox回归评估rTLS评分与无病生存期DFS的关系明确其作为独立预后因子的价值。第三层目标是机制解释——通过SHAP分析解释模型中关键影像特征的贡献度并提取HE染色病理切片中的病理组学特征分析其与影像组学特征的相关性从细胞形态学角度解释为何低rTLS评分的患者预后更差从而将影像组学预测结果挂靠到肿瘤的生物学异质性上为模型的临床应用提供机制支撑。04研究思路最核心怎么挂靠机制本研究的核心思路是从影像表型出发通过机器学习建模预测免疫相关结构TLSs再反向通过病理组学揭示影像特征背后的生物学机制形成“影像—预测—病理—机制”的闭环逻辑。首先研究从多中心DCE-MRI图像中勾画肿瘤区域L1及周边区域L2、L3、L4提取共计4788个影像组学特征经Mann-Whitney U检验、Spearman相关分析及LASSO回归筛选出29个非零系数关键特征。然后采用XGBoost算法构建rTLS预测模型在TCGA-BRCA训练集中AUC达0.922并在YNCH等验证集中验证其对TLSs和NAT疗效的预测能力。为了将模型预测结果与生物学机制挂靠研究进一步使用SHAPShapley Additive Explanations方法对模型进行可解释性分析明确哪些影像特征对TLSs预测贡献最大如wavelet_LHH_firstorder_Median L3。接着研究从HE染色切片中提取611个病理组学特征包括细胞核形态、细胞质形状、纹理等通过相关性分析发现关键影像特征与病理组学特征显著相关。尤为重要的是低rTLS评分组患者中Cytoplasm_AreaShape_Zernike_9_5、Nucleus_AreaShape_Solidity等与细胞侵袭性、伪足形成相关的病理特征显著高表达这从微观形态学上解释了为何低评分患者缺乏TLSs、对NAT不敏感、预后更差。这种“影像组学预测 SHAP解释 病理组学验证”的三步策略成功将影像学表型与肿瘤免疫微环境的生物学异质性联系起来使模型不仅是一个预测工具更是一个具有生物学内涵的影像生物标志物。05数据和方法机制部分怎么设计数据本研究共纳入697例TNBC患者分为三个部分训练队列为TCGA-BRCA队列n137用于构建rTLS预测模型TLS验证队列为YNCH队列n63用于验证模型对TLSs的预测性能NAT响应验证队列包括中国TNBC队列n119来自四家中心、DUKE队列n81和I-SPY2队列n360共560例用于验证模型对NAT治疗反应的预测能力。其中YNCH和DUKE队列还包含随访数据n144用于生存分析与预后评估。图 5患者筛选流程图方法① DCE-MRI图像分割由两名放射科医师手动勾画肿瘤区域L1并自动扩增为瘤周L20-2mm、L32-4mm、L44-5mm。② 影像组学特征提取与筛选从L1-L4区域提取4788个影像特征经Mann-Whitney U检验、Spearman相关分析及LASSO回归筛选出29个关键特征。③ 模型构建与选择采用KNN、XGBoost、LightGBM、SVM、MLP五种算法构建预测模型以XGBoost为最优模型命名为rTLS预测模型。④ 模型验证在TLS验证队列及NAT响应验证队列中通过AUC、校准曲线、决策曲线评估预测性能并通过Logistic回归评估rTLS评分的独立预测价值。⑤ 预后分析采用Kaplan-Meier曲线和Cox回归分析rTLS评分与无病生存期DFS的关系。⑥ 模型可解释性使用SHAP分析评估各影像特征对预测的贡献。⑦ 病理组学提取与分析从HE切片中利用CellProfiler提取611个病理组学特征经筛选后与影像组学特征进行相关性分析比较高低评分组间的病理特征差异。图 6研究整体工作流程图-从影像到病理到机制06研究结果“从表型到机制”①表型层面rTLS模型在训练集AUC为0.922TLS验证集AUC为0.852在NAT响应验证集中中国队列、DUKE队列、I-SPY2队列AUC分别为0.724、0.919、0.883表明模型能准确预测TLSs存在及NAT疗效。图 1模型预测性能与亚组验证该图展示了rTLS模型的预测性能及亚组分析。A图为斯皮尔曼相关网络图显示29个入选影像特征之间无显著共线性保证模型稳定性。B、C图为ROC曲线训练集AUC0.922TLS验证集AUC0.852NAT响应验证集AUC分别为0.724、0.919、0.883证明影像组学可无创预测TLSs这一免疫结构。D–I图为亚组ROC年龄、绝经状态、cT、cN模型在各亚组中均有效提示影像特征捕捉到的异质性与宿主免疫状态相关。J–N图为决策曲线显示模型具有临床净收益为后续机制探索提供表型基础。②预后层面高rTLS评分组无病生存期DFS显著优于低评分组p0.05多因素Cox回归显示rTLS评分是独立预后因子HR0.150p0.006分层分析在≤65岁、cN0-1等亚组中仍显著。图 2预后分析与rTLS评分的生存价值该图将影像组学评分与患者生存结局直接关联。A–I图为Kaplan-Meier曲线显示高rTLS评分组无病生存期DFS显著优于低评分组p0.05且在≤65岁、cN0-1等亚组中仍显著。J图为Cox回归森林图调整临床因素后rTLS评分仍是独立预后因子HR0.150。K图为风险因子交互图展示低评分组中更多患者出现DFS事件且关键影像特征表达模式与不良预后一致。这些结果说明影像组学评分反映的是肿瘤免疫微环境的生物学差异而非随机噪声。③模型解释层面SHAP分析显示wavelet_LHH_firstorder_Median L3是最重要特征瀑布图与力图直观展示了各特征对个体患者预测的贡献如wavelet_LLH_firstorder_TotalEnergy_L2呈负向影响。④机制层面低rTLS评分组中Cytoplasm_AreaShape_Zernike_9_5等侵袭性相关病理特征显著高表达p0.05提示细胞伪足形成和侵袭性表型从微观形态学解释了为何低评分患者缺乏TLSs、预后更差。图 3典型病例影像-病理-预后对应关系该图通过两例典型患者直观展示影像组学评分的生物学内涵。高评分患者0.641DCE-MRI显示肿瘤边界较清晰HE切片中可见典型TLS结构接受NAT后达到病理缓解预后良好。低评分患者0.160DCE-MRI呈现侵袭性形态HE切片未见TLSs治疗后未达pCR预后差。图中还列出了关键影像特征的具体数值说明影像组学特征差异对应于病理上TLSs的有无从而将宏观影像表型与微观免疫结构直接挂钩是“影像-机制”对应关系的直观证据。图 4SHAP解释与病理组学机制验证该图是影像组学挂靠生物学机制的核心图。A为SHAP蜂群图显示wavelet_LHH_firstorder_Median L3等影像特征对预测贡献最大。B、C为瀑布图和力图展示个体患者各特征的贡献方向。D为影像-病理特征热图揭示关键影像特征与细胞形态病理特征如核面积、纹理显著相关。E–G为箱线图低评分组中Cytoplasm_AreaShape_Zernike_9_5等侵袭性相关病理特征显著高表达p0.05提示伪足形成和细胞边缘不规则。这从细胞形态学层面解释了为什么低评分患者缺乏TLSs、预后更差完成了“影像特征→预测评分→病理验证→生物学机制”的闭环。07讨论把机制故事讲圆本研究的核心发现是基于影像组学的rTLS预测模型能够无创、精准地预测TNBC患者中TLSs的存在及新辅助治疗反应且rTLS评分是独立的预后因子。这一结果与既往研究一致——TLSs作为肿瘤微环境中免疫应答的结构性标志已在直肠癌、食管鳞癌、非小细胞肺癌等多种实体瘤中被证实与良好预后及治疗响应相关。本研究进一步将这一结论拓展至TNBC的NAT场景并首次通过多中心、跨种族中国及欧美队列验证了模型的泛化能力。值得注意的是中国TNBC队列的AUC0.724低于DUKE0.919和I-SPY20.883作者解释这可能源于种族间肿瘤微环境的差异——遗传背景、生活环境、医疗水平及药物可及性等因素可能影响TLSs的密度与功能。在预后层面高rTLS评分组患者的无病生存期显著延长且该评分在多数亚组如≤65岁、cN0-1中仍保持预测效能进一步证实其作为独立预后生物标志物的潜力。本研究的最大亮点在于将影像组学与病理组学关联从微观形态学上解释了模型背后的生物学机制低评分组患者呈现Cytoplasm_AreaShape_Zernike_9_5等高表达的侵袭性病理特征提示伪足形成、细胞边缘不规则这从细胞层面解释了为何该类患者缺乏TLSs、对NAT耐药且预后更差。然而本研究存在局限性其一病理样本来自活检可能无法完全反映肿瘤整体的空间异质性其二随访时间相对较短其三影像组学与病理组学的关联仅为相关性分析尚需单细胞测序、空间转录组等技术进一步验证其因果机制。尽管如此本研究为无创影像学指标挂靠肿瘤免疫微环境生物学机制提供了可行范式。08这篇文献的可借鉴思路本研究为影像组学领域的机制导向研究提供了多条可复用的借鉴思路。第一三层递进的研究目标设计——从“模型构建”到“疗效验证”再到“机制解释”使研究不仅有技术价值更有生物学深度避免落入“只堆AUC”的陷阱。第二“影像组学 SHAP 病理组学”的三步机制挂靠策略先用SHAP识别关键影像特征再提取病理切片中的细胞形态特征通过相关性分析建立“宏观影像-微观病理”的桥梁最后用病理特征的生物学含义如伪足形成、核固缩解释影像组学评分的预后意义。这种方法可推广至其他免疫相关结构如TILs、三级淋巴结构亚型或其他癌种。第三将模型输出rTLS评分赋予明确的生物学标签——不是黑箱预测而是明确指出“高评分有TLSs免疫活跃预后好”使临床医生易于理解和信任。第四多队列、跨种族的验证设计不仅验证预测性能还验证机制一致性如低评分组在不同队列中均表现出侵袭性病理特征增强了结论的普适性。第五使用开源工具CellProfiler、PyRadiomics、SHAP实现全流程可复现降低了其他研究者的技术门槛。第六讨论中坦诚种族差异与活检局限性并提出了未来方向空间转录组、多区域采样体现了严谨的科学态度。总之本文提供了一个从影像表型到生物学机制、从单中心到全球验证的完整范例值得影像组学、医学人工智能及肿瘤免疫交叉领域的研究者借鉴。09结语总而言之做影像组学不只是拼AUC、堆模型更要学会给特征找意义、给模型讲道理。这篇论文给我们打了个样先用影像组学预测TLSs再用SHAP揪出关键特征最后用病理组学从细胞形态上验证——低评分组的伪足形成、核异形等侵袭性表型就是预后差的生物学根源。只有把宏观影像和微观机制真正打通我们的研究才不是“玄学算命”而是有根有据、有血有肉、能讲好疾病故事的真科研。希望各位同学以后在做影像组学时多问一句“我找到的特征代表什么生物学现象”多借鉴这种“影像病理可解释性”的三步策略少走弯路轻松写出有机制、有深度、能发高分的好文章参考文献Lin Y, Yu Y, Wang Q, Huang K, Guo S, Zhang J, He Y, Yu X, Zhang J, Meng F, Tang S, Yuan J, Song C. Machine learning model for predicting tertiary lymphoid structures and treatment response in triple-negative breast cancer. NPJ Precis Oncol. 2025 Jul 1;9(1):216. doi: 10.1038/s41698-025-01012-6.