中医临床决策５款大语言模型，谁主沉浮？

张

张建站

2026/6/17 16:10:27

10分钟阅读

背景中医临床决策需整合辨证论治、体质评估与个体化方药难以标准化与质控。大语言模型具备医学知识整合与临床推理能力但其在中医领域的应用尤其在辨证与组方方面仍未被充分探索。目的本研究评估5种主流大语言模型在中医临床决策中的表现并对比人机协作与独立决策模式的效果。具体目标为评测模型的中医知识水平、评估临床案例分析能力、筛选最优模型、评价人机协作的决策质量、效率与接受度。方法选取5种模型Claude 3.7 Sonnet-Extended、ChatGPT 4.5、Grok3-DeepSearch、Gemini 2.0 Flash Thinking Experimental、DeepSeek-R1通过阶段评估(1) 160道标准化中医知识题考核(2) 30例不同系统、不同复杂度临床案例分析(3) 加权计分筛选最优模型知识占40%临床分析占60%(4) 10名中医师与2名专家参与对比纯医师、纯 AI、人机协作组在5例临床案例中的表现。统计方法包括描述性统计、信度分析、组间比较与回归分析。大语言模型的选取与配置表1大语言模型特性与配置详情所有模型均在2025年3月测试期间通过官方接口或网页界面以标准配置访问。TCM中医学RL强化学习SFT监督微调。结果DeepSeek-R1在方面均最优知识考核准确率96.7%临床案例评分17.31/20SD 2.65显著优于其他模型P0.001。人机协作较医师独立决策显著提升质量提高16.1%33.62 vs 28.97P0.001耗时减少66.1%162.6 s vs 479.2 sP0.001。系统可用性评分良好系统可用性量表76.8分P0.002接受度高采纳74.25%、修改24%、拒绝1.75%。AI辅助在方剂配伍与药物选择环节获益最大P0.001。模型整体表现表2 各模型中医知识考核表现基于中医执业资格考试160道单选题每题重复测试3次每模型总应答480次所有模型整体比较的Friedman检验P0.001。疾病系统与难度分层分析图1中医知识评估中3种难度层级的模型准确率案例分析总体评分表3各模型及各评估维度的临床案例分析表现基于中医执业资格考试标准评估30例临床案例15例简单、15例复杂数据为均值标准差总分为20分疾病诊断、证候诊断、病位鉴别、药物组成满分3分辨证依据满分4分治法、方剂名称满分2分模型整体比较的单因素方差分析P0.001。按评估维度分层的表现图2 5种大语言模型各评估维度的临床案例分析表现雷达图质量对比分析表4临床案例分析中不同决策模式的对比基于5例不同疾病系统、不同复杂度的临床案例AI人工智能效应量采用Cohen d值小0.2、中0.5、大0.8主要比较为人机协作vs纯医师。效率分析图3 3种决策模式的质量与效率对比所有模型均在2025年3月测试期间通过官方接口或网页界面以标准配置访问。临床应用价值与医师体验表5统可用性评估与医师体验评价基于10名具有5年以上临床经验的中医师反馈评分等级1.0–2.4差2.5–3.4中等3.5–4.4良好4.5–5.0优秀系统可用性量表与68分基线比较的单样本t检验t4.433P0.002。系统可用性与协作模式分析图4 各临床决策领域的人机协作模式结论大语言模型尤其是DeepSeek-R1在中医知识考核与临床案例分析中表现优异。人机协作显著提升中医临床决策质量与效率医师接受度高。该结果为中医AI辅助决策的临床价值提供了实证依据有望解决中医知识标准化、临床培训与诊疗效率的核心痛点。详细总结思维导图mindmap4阶段评估体系大语言模型知识考核结果人机协作核心效果参考JMIR Form Res. 2026 Mar 2:10:e80167. doi: 10.2196/80167.Digitally Assisted Clinical Decision-Making in Traditional Chinese Medicine: Comparative Study of 5 Large Language Models260302TCM_5LLMs.pdf注AI辅助创作如有不当欢迎指出。内容仅供参考不构成任何建议。

嵌入式实时系统中断控制器：优先级调度与OSEK PCP实战解析

1. 中断控制器：嵌入式实时系统的“交通警察”在嵌入式系统的世界里，尤其是汽车电子、工业控制这些对时间要求极其苛刻的领域，微控制器（MCU）就像一座繁忙的城市。各种外设——比如定时器、ADC转换器、CAN总线、DMA控制器…...

2026/6/17 16:06:26 阅读更多 →

Gemini 3.5 办公场景深度实测：快是真的快，坑也是真的有

概要2026年5月19日，Google在I/O大会上正式发布Gemini 3.5 Flash，API同步开放。这款模型打破了Flash系列"便宜但弱"的固有印象——在编程和Agent基准上首次反超自家旗舰3.1 Pro。但跑分归跑分，办公场景下到底能不能打？为…...

2026/6/17 10:10:22 阅读更多 →

3个简单步骤，用B站下载器轻松保存4K大会员视频

3个简单步骤，用B站下载器轻松保存4K大会员视频【免费下载链接】bilibili-downloader B站视频下载，支持下载大会员清晰度4K，持续更新中项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 你是不是经常在B站看到精彩…...

2026/6/16 21:48:13 阅读更多 →