简介:Slurm 看着名字挺复杂,其实它的全称是Simple Linux Utility for Resource Management,翻译过来就是“简单的Linux资源管理工具”,听名字就知道,核心就是帮我们管理Linux系统里的计算资源。咱们在Rocky Linux 9.4上部署它,不管是单台服务器还是多节点的小集群,它都能hold住。简单说,Slurm就像一个“智能管家”,专门管咱们服务器里的CPU、内存、GPU这些硬件资源,还有我们要运行的各种计算任务,不用咱们手动盯着、手动分配。它不是什么复杂的商业软件,是开源免费的,而且兼容性特别好,在Rocky Linux这种企业级Linux系统上部署很稳定,不管是新手还是有一定基础的,跟着步骤来都能搞定,这也是我选择在Rocky Linux 9.4上部署它的原因之一~部署步骤:1、基础环境系统准备:3台 Rocky Linux 9.4 系统网络准备:同一网段IP地址用户准备:部署环境内全部配置root密码并且后续操作都是以root用户进行系统全部关闭防火并且禁用selinuxsystemctl enable firewalld sed -i 's/^SELINUX=.*/SELINUX=disabled/' /etc/selinux/config2、主机名配置(各节点分别操作):#管理节点: hostnamectl set-hostname master #计算节点01: hostnamectl set-hostname node01 #计算节点02: hostnamectl set-hostname no