Files
blog-public/content/docs/server/config/hardware.md
2025-01-12 12:11:54 +08:00

88 lines
5.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
weight: 2
title: "硬件和队列"
---
以下表格总结了各个服务器的硬件配置。浮点性能均指双精度浮点性能(而不是衡量 AI 算力常用的单精度浮点性能)。
2024 年最好的笔记本 CPUR9-7945HX性能约为 125 GFLOPS整机大约六七千可以买到
最好的服务器 CPUEPYC 9965性能约为 1124 GFLOPS大概十万块可以买到一块。
可以据此估计各个服务器的 CPU 性能。
CPU 和 GPU 的成绩通常不能直接比较,但对于可以大量并行、并且瓶颈在浮点计算或者内存访问的任务,同价钱的 GPU 通常确实比 CPU 快很多。
## 厦大超算jykang
这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,之后可能有变化。
| 队列 | <div style="width:70px">时间限制</div> | 节点组 | <div style="width:200px">节点</div> | <div style="width:200px">单节点CPU</div> | 单节点理论性能<br/>GFLOPS | <div style="width:250px">单节点内存</div> |
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
| `normal`(默认) | 14 天 | `cnodes` | `c00{1..9}` `c0{19..48}`<br/>以下除外:`c022` | 双路 Intel E5-2690<br/>共 16 核 32 线程<br/>限制使用 20 线程 | 29 | `c00{1..9}`: 约 60 GB<br/>`c0{19..44}`: 约 30 GB<br/>`c0{45..48}`: 251.7 GB |
| `normal_1day` | 1 天 | `normal_1day` | `nxt00{1..9}` `nxt0{41..67}`<br/>以下除外:`nxt043` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `normal_1week` | 7 天 | `normal_1week` | `nxt0{10..40}`<br/>以下除外:`nxt015` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `normal_2week` | 14 天 | `b_node` | `b0{01..14}` | 双路 Intel 5318Y<br/>共 48 核 | 167 | 251.3 GB |
| `normal_1day_new` | 1 天 | `charge_s_normal` | `s0{06..18}` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `ocean_530_1day` | 1 天 | `hd_sd530` | `hd0{01..28}` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `ocean6226R_1day` | 1 天 | `hd_sd530_6226R` | `hd0{29..48}` | 双路 Intel 6226R<br/>共 32 核 | 129 | 188.2 GB |
## srv1
此集群包含了四个节点。其中第一个节点srv1-node0的性能较好推荐优先使用剩下的三个节点性能相对较差。
用于存储计算数据的硬盘大小为 1 TB使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 2.5 TB。
| 节点主机名</br>Slurm 中的节点名) | 内存 | CPU | CPU 理论性能<br/>GFLOPS |
|:-:|:-:|:-:|:-:|
| srv1-node0</br>n0 | 128 GB | 四路 Intel Gold 6230<br/>共 80 核 160 线程 | 250 |
| srv1-node1</br>n1 | 32 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node2</br>n2 | 64 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node3</br>n3 | 40 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| 队列 | 包含节点 |
|:-:|:-:|
| `localhost`(默认) | `n0` |
| `old` | `n1` `n3` |
| `fdtd` | `n2` |
| `all` | `n[0-3]` |
谨慎使用第三个节点srv1-node2做计算。详见下方的说明。
{{< details title="谨慎使用第三个节点的原因" closed="true" >}}
按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions即srv1Windows
同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。
如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。
{{< /details >}}
## srv1Windows
用于存储计算数据的硬盘空间约 500 GB。
| 内存 | CPU | CPU理论性能<br/>GFLOPS |
|:-:|:-:|:-:|
| 128 GB | 四路 Intel E7-4809v4<br/>共 32 核 32 线程 | 146 |
## srv2
用于存储计算数据的硬盘大小为 18 TB使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 40 TB。
对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。
此外,在多个 GPU 都空闲的情况下Slurm 不会自动选择性能更好的 GPU可能会将任务分配到性能更差的 GPU 上;
因此通常推荐手动选择 GPU除非有很多任务要计算。
| 节点主机名</br>Slurm 中的节点名) | 设备 | 理论性能<br/>GFLOPS双精度/单精度) | 内存/显存 |
|:-:|:-:|:-:|:-:|
| `srv2-node0`</br>`n0` | CPU: 双路 Intel Gold 6152<br/>共 44 核 88 线程 | 136/136 | 256 GB |
| `srv2-node0`</br>`n0` | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| `srv2-node1`</br>`n1` | CPU: AMD R9-5950X<br/>16 核 32 线程 | 100/100 | 96 GB |
| `srv2-node1`</br>`n1` | GPU: NVIDIA P5000 | 194/6197 | 16 GB |
| `srv2-node1`</br>`n1` | GPU: NVIDIA 3090 | 556/35580 | 24 GB |
| `srv2-node1`</br>`n1` | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| | GPU: NVIDIA 2080 Ti<br/>(买了没装) | 421/13448 | 12 GB |
| | ~~GPU: NVIDIA H100<br/>(未付款,期待发货)~~ | 25600/51200 | 80 GB |
| 队列 | 包含节点 |
|:-:|:-:|
| `all`(默认) | `n0` `n1` |
| `n0` | `n0` |
| `n1` | `n1` |