01导语各位同学大家好。现在做影像组学如果还只停留在“提取特征—建个模型—算个AUC”那就像拿着一把尺子量出了肿瘤大小却说不出它为什么长得快。别人一问你的影像特征到底对应什么生物学过程背后有没有通路、细胞亚群、关键基因在撑腰瞬间就成了黑箱本箱。而真正能发高分、经得起推敲的研究都在干同一件事——给影像组学找“生物学娘家”让MRI上的每个纹理、每个信号异质性都能和微观的ECM重塑、TGF‑β信号、ITGB8高表达亚群对上话。今天咱们就通过这篇2026年发表于《Research》的膀胱癌论文看看作者如何用深度学习算出一个“混合肿瘤‑间质比例MTSR”然后一路从批量转录组追到单细胞、从WGCNA追到SHAP最后再反过来用mpMRI的放射组学去预测这个MTSR形成“表型→机制→影像”的完美闭环。咱们一起拆解这套“不硬凑、有因果、可复现”的机制挂靠方法论帮大家从“只会算分的工具人”升级成“能讲清疾病故事的影像组学研究者”。★题目A Deep Learning-Generated Mixed Tumor–Stroma Ratio for Prognostic Stratification and Multi-omics Profiling in Bladder Cancer基于深度学习生成的混合肿瘤-间质比用于膀胱癌预后分层与多组学分析★期刊《Research》中科院1区IF10.9★研究疾病膀胱癌★生物学机制ITGB8-WNT轴★发表时间2026年1月02研究背景-从 “临床问题” 落到 “生物学问题”膀胱癌是泌尿系统最常见的恶性肿瘤之一其高复发率和进展倾向给临床管理带来持续挑战。根据肌层浸润深度膀胱癌分为非肌层浸润性和肌层浸润性两类两者的治疗策略和预后差异显著。目前病理学检查是膀胱癌分期和分级判定的金标准其中苏木精-伊红染色是观察组织结构和细胞细节的常规技术。然而传统病理诊断依赖人工阅片不仅耗时费力而且存在显著的观察者间变异尤其是在肿瘤与正常组织边界模糊、组织类型混杂的复杂病例中。此外尽管TNM分期系统为治疗决策提供了基础框架但同一分期患者预后差异巨大提示现有分期系统无法充分捕捉肿瘤生物学行为的异质性。近年来数字病理和人工智能技术的兴起为全切片图像的自动化分析提供了可能。通过深度学习模型可以自动识别和分类不同组织类型、检测细微组织学特征甚至预测临床结局。其中肿瘤-间质比例作为反映肿瘤与微环境相互作用的量化指标在多种癌症中被证实与预后相关但其在膀胱癌中的自动化量化方法、多中心验证、分子机制及术前无创评估仍属空白。因此亟需开发一种可重复、可解释的深度学习工具系统解析肿瘤-间质混杂程度的生物学内涵并将其转化为临床可用的预后标志物。03研究目的明确写出“三层目的”本研究旨在围绕膀胱癌中混合肿瘤-间质比例完成从技术开发、临床验证到机制解析与影像转化的三层研究目标。第一层技术层构建一个基于ResNet50的卷积神经网络模型实现对膀胱癌HE染色全切片图像的全自动分割与分类共9类组织背景并量化计算混合肿瘤-间质比例以消除人工评估的主观变异。第二层临床层在多中心、大样本外部队列中系统验证混合肿瘤-间质比例的预后价值通过Cox回归、Kaplan‑Meier分析、meta分析及nomogram构建证明其作为独立预后因子的稳定性和临床实用性并比较其与TNM分期的预测效能。第三层机制层与转化层利用批量RNA测序和单细胞RNA测序从通路富集、免疫浸润、细胞异质性、伪时间轨迹及转录因子调控网络等多个维度揭示高/低混合肿瘤-间质比例肿瘤的分子程序差异锁定关键驱动基因如ITGB8同时构建基于术前多参数MRI的影像组学随机森林模型实现混合肿瘤-间质比例的无创术前预测为非侵入性风险分层和精准治疗决策提供依据。04研究思路最核心怎么挂靠机制本研究的核心思路是以深度学习量化的病理表型混合肿瘤-间质比例为锚点向上连接临床预后向下深入多组学机制再横向拓展至影像组学无创预测形成“表型驱动机制、机制解释表型、影像映射表型”的闭环逻辑。第一步模型开发与预后验证采用TCGA膀胱癌全切片图像训练ResNet50模型实现像素级组织分类计算混合肿瘤-间质比例然后在5个独立外部队列中验证其对总生存期的预测价值并结合N分期构建nomogram。第二步机制挂靠——从批量组学到单细胞首先通过WGCNA识别与混合肿瘤-间质比例显著相关的基因模块GSEA富集分析发现高混合肿瘤-间质比例肿瘤中TGF‑β、WNT、ECM重塑等通路激活然后利用单细胞RNA测序精准定位一个ITGB8高表达的尿路上皮细胞亚群该亚群处于终末分化状态、WNT信号活跃、凋亡抑制并通过SCENIC分析揭示BPTF、SOX4等上游转录因子。第三步细胞通讯与功能验证通过配体-受体分析证明ITGB8高表达细胞作为“发送者”主导信号输出。第四步影像组学转化从术前mpMRI中提取T2WI和DCE序列的放射组学特征经mRMR筛选后构建随机森林分类器实现混合肿瘤-间质比例高/低状态的术前预测。通过这一递进式思路将宏观影像、病理表型与微观分子机制有机串联为膀胱癌的精准分层提供了从机制到临床的全链条证据。05数据和方法机制部分怎么设计数据本研究共纳入来自TCGA的379例膀胱癌患者450张WSI用于模型训练、内部验证及预后分析来自5个外部队列GD2H、STPH、YJSH、ZSSY、PN的1053例患者1271张WSI用于外部验证MTSR的预后价值来自GD2H队列的6例新鲜肿瘤组织高MTSR 3例低MTSR 3例用于单细胞RNA测序以解析分子机制来自STPH队列的109例患者125张WSI的术前mpMRI数据用于构建影像组学模型以无创预测MTSR状态。方法HE全切片图像标注9类组织背景Reinhard颜色归一化→ResNet50训练迁移学习SGD内外部验证→全切片分割及组织比例计算滑动窗口边缘过滤→预后分析Cox回归、Kaplan‑Meier、固定/随机效应meta分析、nomogram构建→批量转录组分析WGCNA识别MTSR相关模块GSEA/GSVA通路富集CIBERSORT免疫浸润→单细胞分析Seurat聚类、UMAPMonocle伪时间轨迹SCENIC转录因子调控网络细胞通讯分析→影像组学模型mpMRI中T2WI与DCE序列ROI勾画PyRadiomics提取1781个特征/序列mRMR筛选10个关键特征随机森林分类器训练与验证。图 1研究整体工作流程图06研究结果”从表型到机制“1. 模型性能ResNet50对9类组织及背景的分类准确率均超过90%Cohen’s κ 0.95t‑SNE显示不同组织类别在特征空间形成清晰分离的簇证明模型具有卓越的判别能力和可重复性。图 2模型性能图2A混淆矩阵显示ResNet50对10类组织含混合肿瘤‑间质分类准确率90%图2B显示Cohen’s κ 0.95图2C的t‑SNE可视化展示不同组织类别的深度特征在空间中形成清晰分离的簇。这些结果证明深度学习模型能够精准识别“混合肿瘤‑间质”这一关键组织学表型为后续将该表型与分子机制如ECM重塑、TGF‑β信号关联提供了可靠的技术基础。2. MTSR的预后价值在TCGA及5个外部队列中高MTSR患者的总生存期显著缩短所有P 0.001固定效应meta分析合并HR 1.0495% CI: 1.03–1.05且MTSR与N分期是独立的预后因子。图 3MTSR预后价值图3A单变量Cox回归显示MTSR是唯一有显著预后意义的组织比例HR1.034图3B中MTSR的C‑index最高0.587图3C展示高/低MTSR的代表性WSI图3D‑E的Kaplan‑Meier曲线表明高MTSR患者总生存期显著缩短。该图确立了MTSR作为独立预后生物标志物的地位而预后差异本质上由肿瘤‑间质互作的分子程序如WNT、TGF‑β驱动为后续影像组学预测MTSR提供了临床必要性。图 4外部验证图4A‑E显示在5个独立外部队列GD2H、STPH、YJSH、ZSSY、PN中高MTSR患者均具有更差的总生存期所有P0.001图4F合并队列分析一致图4G固定效应meta分析合并HR1.0495%CI:1.03‑1.05。该图验证了MTSR预后价值的跨中心稳健性说明MTSR反映的肿瘤‑间质混杂程度是一个普遍存在的生物学特征而非单中心偏倚从而支持利用影像组学在不同医疗中心间推广MTSR术前预测。3. 预后模型构建联合MTSR与N分期的nomogram在C‑index和时间依赖AUC上均优于单一指标校准曲线显示预测与观察结局高度一致决策曲线证实其临床净获益优于传统病理特征。图 5预后nomogram图5A多变量Cox显示MTSR和N分期为独立预后因子图5B构建nomogram图5C‑D显示MTSRN分期的C‑index和AUC优于单一指标图5E校准曲线显示良好一致性图5F‑H决策曲线证明nomogram的临床净获益最高。该图表明MTSR具有与病理TNM分期相当的预后信息量联合使用可提升风险分层效能。从机制上看MTSR整合了间质微环境ECM、免疫细胞的侵袭性信号这些信号同样可被影像纹理特征间接捕捉。4. 批量转录组特征高MTSR肿瘤富集TGF‑β/WNT信号、ECM受体交互、细胞黏附分子低MTSR肿瘤富集尿路上皮分化及干扰素‑γ通路。高MTSR组M0/M1/M2巨噬细胞浸润显著增加。图 6批量转录组特征图6A显示高MTSR患者男性多、年龄大、分期晚图6B通路富集表明高MTSR富集WNT、TGF‑β、mTOR等经典致癌通路图6C GSEA证实ECM受体交互、细胞黏附分子在高MTSR中富集图6D免疫浸润显示高MTSR组M0/M1/M2巨噬细胞浸润增加。该图从分子层面解释了高MTSR为何预后差——即激活了促进侵袭和免疫抑制的信号轴为影像组学特征如异质性、纹理粗糙度提供了生物学来源胶原沉积、细胞密度不均。5. 单细胞机制解析高MTSR肿瘤中鉴定出一个ITGB8高表达的尿路上皮亚群cluster 8该亚群处于终末分化状态WNT通路活性升高、凋亡受抑且作为“发送者”主导细胞间通讯。图 7单细胞机制图7A‑B的UMAP显示高MTSR与低MTSR肿瘤细胞组成差异显著cluster 8为关键尿路上皮亚群图7C显示cluster 8中WNT信号升高、凋亡降低图7D细胞通讯分析显示该亚群作为“发送者”主导信号输出图7E‑F的KEGG富集证实PI3K/Akt、ECM受体、WNT通路富集。该图将MTSR表型精准定位到ITGB8高表达的功能亚群揭示了其发送信号、活化间质的能力。影像组学中的纹理异质性可反映这种活跃的细胞‑间质交互区域。图 8基因模块与关键预测因子图8A批次校正后PCA显示数据整合良好图8B‑C的WGCNA显示高MTSR与多个基因模块正相关图8D韦恩图筛选出21个交集基因图8E随机森林重要性排序显示ITGB8、PTPRS、ABO为前三图8F‑G的SHAP分析确认ITGB8贡献最大且正向驱动高MTSR预测。该图通过机器学习随机森林SHAP从多组学数据中锁定ITGB8为核心机制基因这种“组学筛选可解释AI”的思路同样可迁移至影像组学用于筛选与ITGB8表达相关的影像特征。图 9ITGB8高表达细胞的伪时间与调控网络图9A伪时间轨迹显示cluster 8位于终末分化端图9B热图显示ITGB8和WNT3A沿伪时间逐渐升高图9C显示ITGB8主要在cluster 8富集图9D再次验证ITGB8高表达细胞中WNT高、凋亡低图9E显示ITGB8高细胞作为“发送者”图9F富集分析确认WNT通路最显著图S9补充展示BPTF、SOX4等转录因子活性。该图构建了从ITGB8到WNT通路再到终末分化的因果链条解释了高MTSR肿瘤的侵袭性来源。影像组学可尝试预测ITGB8表达状态间接挂靠该机制轴。6. 影像组学预测基于mpMRIT2WI DCE构建的随机森林模型在训练集和验证集中预测MTSR高/低状态的准确率分别为0.701和0.710AUC分别为0.746和0.657实现了MTSR的无创术前评估。图 10影像组学预测MTSR图10A展示从mpMRI的T2WI和DCE序列中勾画肿瘤ROI并提取放射组学特征图10B‑C混淆矩阵和雷达图显示随机森林模型在训练集准确率0.701和验证集0.710表现稳健敏感度0.741‑0.769阳性预测值0.796‑0.800图10D的ROC曲线显示AUC训练集0.746、验证集0.657图10E瀑布图展示个体预测一致性。该图实现了影像组学对MTSR的无创术前预测其生物学依据在于MTSR反映的ECM重塑、胶原沉积、细胞密度异质性等微观特征可转化为MRI图像上的纹理、形态和信号异质性等可量化放射组学特征从而将宏观影像与微观ITGB8/TGF‑β/WNT机制轴桥接起来。07讨论把机制故事讲圆本研究通过深度学习自动量化膀胱癌HE切片中的混合肿瘤‑间质比例并系统验证了其作为独立预后标志物的稳定性和多中心可重复性。与人工评估相比该模型消除了观察者间变异实现了像素级的精确组织分类尤其适用于肿瘤与间质边界模糊的复杂病例。更为重要的是研究不仅停留在预后关联层面而是深入揭示了MTSR背后的生物学机制高MTSR肿瘤中ITGB8高表达的尿路上皮细胞亚群通过激活TGF‑β/WNT信号轴促进细胞外基质重塑、抑制凋亡、驱动上皮‑间充质转化并形成以“发送者”为主导的细胞通讯网络。这一机制与已知的ITGB8功能高度吻合——ITGB8可与αv亚基形成异二聚体结合并激活潜伏态TGF‑β进而刺激癌相关成纤维细胞收缩胶原、极化巨噬细胞向M2表型转化形成正反馈环路。单细胞伪时间轨迹分析进一步揭示这些ITGB8高表达细胞位于分化终末段但仍表现出侵袭性特征提示肿瘤‑间质互作可驱动肿瘤细胞向更具侵袭潜能的终末状态演化。从临床转化角度看本研究构建的mpMRI影像组学模型虽准确率中等AUC约0.71但首次证明了利用常规术前影像无创评估MTSR的可行性为无法获取病理组织的患者提供了风险分层的替代工具。值得注意的是MTSR在NMIBC和MIBC亚组中均具有预后区分能力提示其适用于全阶段膀胱癌患者。本研究的局限性包括外部队列虽大但仍以中国人群为主泛化性需进一步验证MRI影像组学模型性能有待提升未来可纳入弥散加权成像序列或多中心数据增强ITGB8的功能机制仍需体外共培养和动物模型实验验证。总体而言本研究建立了“病理表型→多组学机制→影像预测”的全链条研究范式为膀胱癌的精准分层和个体化治疗提供了新的生物标志物和理论依据。08这篇文献的可借鉴思路这篇文献为影像组学/数字病理如何挂靠生物学机制提供了极佳的可复制的范例。第一以量化病理表型为枢纽不直接预测基因突变或通路而是从HE切片中提取一个可解释的、具有预后价值的组织比例指标MTSR该指标本身具有生物学内涵肿瘤‑间质互作因此天然适合向下游挖掘机制。第二递进式多组学验证策略从批量转录组WGCNA GSEA初步筛选相关通路和基因模块再通过单细胞RNA测序精准定位关键细胞亚群和标志基因ITGB8接着利用伪时间轨迹和SCENIC转录因子网络构建从基因到细胞功能的因果链最后用细胞通讯分析阐明该亚群在微环境中的角色。这种从宏观到单细胞、从关联到因果的递进逻辑极大增强了机制故事的可信度。第三关键基因锁定方法将WGCNA得到的hub基因、单细胞差异基因和临床相关基因取交集再结合随机森林重要性排序和SHAP解释从数千个基因中精准筛选出ITGB8避免了盲目假设。第四影像组学的机制挂靠方式不是直接预测抽象的基因突变而是预测已明确与机制相关的表型MTSR使影像特征纹理、异质性与微观过程胶原沉积、ECM重塑、血管异质性建立合理的生物学联系即使模型AUC不高也能讲通故事。第五临床转化闭环从病理模型出发构建预后模型再反向构建影像预测模型形成了“病理诊断→预后评估→术前无创预测”的完整闭环符合精准医学的临床需求。如果你正在设计类似研究建议借鉴这一“表型驱动→单细胞定位→关键基因锁定→影像映射”的四步框架并始终确保每一步都有明确的生物学问题驱动。09结语总而言之这篇文献告诉我们影像组学的真正价值不在于模型AUC从0.71卷到0.72而在于你能不能拍着胸脯说——“我影像特征的变化背后站着一条清晰的生物学机制链”。作者从HE切片中算出的MTSR之所以能用来训练mpMRI模型不是因为他们运气好而是因为MTSR本身已经被单细胞和批量组学证实与ITGB8/TGF‑β/WNT轴深度绑定ECM的胶原沉积、细胞密度的不均一天然就能在T2WI和DCE图像上留下“纹理指纹”。所以大家以后设计影像组学研究时不妨先问自己三个问题我要预测的表型有生物学故事吗这个故事能不能在组织切片或组学数据里找到证据影像特征和这个证据之间有没有合理的生理/病理桥梁只有把这三点串起来你的影像组学才不是“算命”而是“诊断”不是“黑箱”而是“明灯”。希望大家都能借这篇论文的思路少走弯路做出有机制、有深度、能发高分的真科研参考文献He Y, Xie J, Zhong S, Zhan C, Dai F, Lai H, Wang M, He Y, Patel H, Chen ZS, Zhong B, Qiu X, Guo Y, Zheng Z. A Deep Learning-Generated Mixed Tumor-Stroma Ratio for Prognostic Stratification and Multi-omics Profiling in Bladder Cancer. Research (Wash D C). 2026 Jan 26;9:1053. doi: 10.34133/research.1053.