亮点・MicrobeAtlas包含240万份经统一分析的微生物群落样本・可通过功能丰富的网站在全球范围内追踪微生物类群及群落・详尽的生态系统注释及元数据支持各类研究问题的开展・全球范围分析揭示了普遍存在的分类学、生物地理及泛化性趋势摘要环境DNA测序彻底改变了对微生物多样性和生态学的认知。如今微生物组测序已覆盖全球各个角落——从深层地下到山顶涵盖众多宿主、生物群系和环境条件。然而测序与分析策略的多样性阻碍了普适性洞见的获取。MicrobeAtlas将超过200万份微生物组样本整合为单一资源通过标准化处理助力跨技术研究发现。该数据库以可调节的小亚基核糖体RNASSU rRNA标记基因分辨率对群落进行层级化定量并提供包含丰富地理信息的详细元数据。与基因组、表型和生态资源的关联支持多模态研究。微生物谱系可在不同环境中被可靠追踪包括大量罕见、未表征的物种。研究揭示了重复出现的群落结构和地理偏好以及全球范围内特定分类群的泛化性趋势。借助MicrobeAtlas已知和新描述的物种及群落均可轻松纳入其生态背景中充分利用以往研究成果。www.microbeatlas.orgmeringmls.uzh.ch#微生物生态系统 #微生物组数据库 #生物地理学 #操作分类单元OTU #环境DNA #微生物多样性 #泛化性与特化性结果MicrobeAtlas数据集生成与分析流程图1MicrobeAtlas数据获取与分析流程靶向和非靶向微生物测序的原始数据从NCBI序列读取档案库SRA下载、清洗并与按灵活阈值如种水平98%科水平90%预聚类的OTU进行比对。最终生成的OTU表与地理信息、共识分类学、群落簇信息以及详细的本体论和基于关键词的元数据相关联。交互式网络应用程序支持对整个群落和单个类群的深入探索性分析与下载。全球微生物组结构图谱图2基于1,153,349份筛选测序样本生成的26,487个稳健群落簇的UMAP投影(A) 上图基于布雷-柯蒂斯相异度的群落簇圆点按共识主环境和子环境着色「其他」包含无亚环境注释的簇。移除无明确主环境的簇。下图灰度颜色表示基于均匀流形近似与投影UMAP坐标欧氏距离计算的基于噪声的空间聚类应用DBSCAN密度簇。分类水平柱状图表示每个分类水平和DBSCAN簇的平均相对丰度按簇归一化。词云显示每个DBSCAN簇中7个最普遍的关键词文本大小和深浅度与关键词频率相关。扩展「其他」类别后对所有子环境进行置换多元方差分析PERMANOVA。(B) 上图按主要测序项目人类微生物组计划HMP、地球微生物组计划EMP、美国肠道计划AGP或其他研究着色的群落簇。下图各项目类型的群落簇数量。(C) 示例关键词在群落簇中频率的核密度估计按关键词归一化。(D) 按样本环境分层群落簇总数虚线或OTU数实线97% OTU水平随采样量的变化。(E、F) 按估计OTU丰富度E97% OTU水平或属水平分类读数比例F着色的群落簇。未表征微生物多数派的生态洞见图3MicrobeAtlas OTU的分类学表征与生态学特征(A) 圆圈表示映射到proGenomes3或BacDive序列最佳匹配相似度97%或未映射的MicrobeAtlas OTU。映射的OTU统称为「培养/基因组OTUcg-OTUs」未映射的OTU称为「非cg-OTUsncg-OTUs」。方块表示映射到MicrobeAtlas OTU的proGenomes3绿色和BacDive红色序列比例灰色表示未映射序列。(B) 有无培养菌株或基因组注释的OTU在不同分类等级的可分类数量蓝色表示分类等级较低红色表示分类等级较高。(C) 每个分类等级中至少有个带注释培养菌株或基因组的类群比例紫色。(D) 有无培养菌株或基因组注释的物种平均相对丰度对数10尺度内框为分位距须为1.5×四分位距密度为高斯核估计。(E) 不同分类等级可分类OTU的丰度分布蓝色表示表征程度较低。插图相同丰度的箱线图箱为分位距须为1.5×四分位距。(F) 不同分类等级OTU的环境分布映射读数比例按等级归一化去除真核生物。(G) 个未表征97%-OTU及其子OTU的环境分布平均相对丰度重新缩放。词云显示个OTU在所有栖息样本中7个最普遍的关键词按相对丰度加权。文本大小根据丰度加权关键词频率调整。跨大陆与生物群系的生物地理趋势图4微生物类群和群落的生物地理模式(A) 不同气候带微生物测序样本的全球分布。(B) 世界自然保护联盟IUCN生物群系和生态功能群EFG地图将微生物群落与宏观生态特征关联。全球地图按生物群系着色放大区域按生态功能群着色灰色圆点为MicrobeAtlas样本。(C) 个海洋浮霉菌目OTU的生态位分离示例圆点为观测分布显示全球分布的局部示例。(D) (C) 中每个OTU在各子环境的全球样本数量。(E、F) 偏好热带和亚热带地区E或极地和亚极地地区F的示例OTU。线和误差带表示10个等大小纬度区间内对数转换相对丰度的平均值和95%置信区间1,000次自举。每个OTU的分布仅限于其主环境按最高相对丰度定义。(G) 海洋群落OTU丰富度随纬度的变化。线、误差带和区间定义同(E)和(F)。跨环境与分类群的生态泛化性模式图5跨环境与分类群的栖息地泛化性与特化性趋势(A) 1个泛化型OTU黄色圆点和5个特化型OTU其他颜色灰色表示无显示OTU存在的UMAP群落簇丰度分布。柱状图表示每个OTU的环境相对丰度分布。(B) 上图每个归一化泛化性得分区间的OTU数量。下图按主环境按最高相对丰度定义分层的每个泛化性得分区间的OTU比例。(C) 按环境分组的每个样本中前10%泛化种与前10%特化种数量的对数比。(D、E) 前10%特化种D和前10%泛化种E在群落簇中的平均流行度与相对丰度去除0值的关系。红点表示有培养代表的OTU。培养代表的边缘密度为高斯核估计。(F) 20个最常见分类科的比例按归一化泛化性得分分组。仅显示映射到这些科的OTU。(G) 前10%泛化型绿色和前10%特化型紫色OTU的群落簇数量密度对数10尺度。(H) 每个泛化性得分区间内可映射到proGenomes3的OTU的平均基因数量。线和误差带表示平均值和95%置信区间1,000次自举。数据与代码现有公开数据www.ncbi.nlm.nih.gov/sra主要处理后的数据www.microbeatlas.org/download下游分析的原始代码www.github.com/meringlab/MicrobeAtlas_companionZenodohttps://doi.org/10.5281/zenodo.18314332详细总结思维导图技术架构与分析流程参考Cell. 2026 Apr 2;189(7):2092-2107.e17. doi: 10.1016/j.cell.2026.01.021.The MicrobeAtlas database: Global trends and insights into Earths microbial ecosystems260402MicrobeAtlas.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。