# docker-slurm **Repository Path**: ghostxyj/docker-slurm ## Basic Information - **Project Name**: docker-slurm - **Description**: 使用Compose模拟的单机多容器slurm集群 - **Primary Language**: YAML - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2024-11-15 - **Last Updated**: 2024-11-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # docker-slurm #### 介绍 使用Compose模拟的单机多容器slurm集群 #### 软件架构 - slurm-client: slurm登录节点 - slurm-master: slurm控制节点 - slurm-database: slurm数据库节点 - slurm-node: slurm计算节点 #### 安装教程 安装Docker Engine(包括Compose):[https://docs.docker.com/engine/install/](https://docs.docker.com/engine/install/) #### 使用说明 1. `xxx.env`文件中包含一些可改配置,不建议直接修改`xxx.conf`文件 2. `compose.yml`文件service层级下slurmmaster的environment可以控制是否安装额外软件(以lmod和hpctoolkit为例,默认不安装) 3. compose启动容器 - 命令:`docker-compose` or `docker compose` - 指令:`up` - 选项 - 设置计算节点个数: `--scale slurmnode=` - 后台启动: `-d` eg: 后台启动带有5个计算节点的slurm集群 `docker-compose up -d --scale slurmnode=5` 4. 宿主机访问[http://127.0.0.1:8888/lab](http://127.0.0.1:8888/lab)通过登录节点测试集群,或直接打开容器终端控制各节点 5. 关闭集群 `sh teardown.sh` #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)