摘要高通量单细胞测序技术实现了大规模细胞图谱绘制推动了单细胞基础模型的发展。这类模型通常基于转录组数据预训练可学习通用细胞表征但在模态覆盖、因果推理与可解释性上存在局限难以达成人工智能虚拟细胞AIVC的愿景。与此同时大语言模型LLM在统一异质模态、适配多类任务、生成可解释推理链方面展现出强大潜力是实现AIVC的理想方案。近期LLM在细胞注释、扰动预测等任务中的应用印证了该潜力但仍存在任务覆盖不足、评估指标单一、输入与提示鲁棒性有限等核心挑战。为解决上述问题本文提出面向细胞领域的大语言模型综合评估框架CeLLM。CeLLM覆盖基因、细胞、组学级分析的全品类任务系统评估15个开源、闭源与生物学专用模型并在多任务设定下采用多元化评估准则。作为跨尺度、可复现、动态更新的基准CeLLM提供可持续平台用于追踪研究进展、推动方法创新加速大语言模型向虚拟细胞建模方向发展。#胃肠道间质瘤 #多组学资源库 #大语言模型 #靶点挖掘 #MCM7 #细胞生物学 #大语言模型 #单细胞测序 #多组学整合 #AI虚拟细胞 #基准评估引言图1 CeLLM基准框架概览该基准从数据集、模型、影响因素到评价指标逐层构建覆盖6大核心任务与15个开源/闭源模型。结果与分析细胞注释表1 单细胞注释任务结果表2 空间细胞注释任务结果详细总结思维导图参考CeLLM: Can Large Language Models Achieve the AI Virtual Cell?https://openreview.net/forum?idqyS3gtL2Fx260212CeLLM.pdf注AI辅助创作如有不当欢迎指出。内容仅供参考不构成任何建议。