Files
blog-public/content/docs/server/config/hardware.md
2025-07-18 13:19:19 +08:00

5.3 KiB
Raw Blame History

weight, title
weight title
2 硬件和队列

以下表格总结了各个服务器的硬件配置。浮点性能均指双精度浮点性能(而不是衡量 AI 算力常用的单精度浮点性能)。

2024 年最好的笔记本 CPUR9-7945HX性能约为 125 GFLOPS整机大约六七千可以买到 最好的服务器 CPUEPYC 9965性能约为 1124 GFLOPS大概十万块可以买到一块。 可以据此估计各个服务器的 CPU 性能。

CPU 和 GPU 的成绩通常不能直接比较,但对于可以大量并行、并且瓶颈在浮点计算或者内存访问的任务,同价钱的 GPU 通常确实比 CPU 快很多。

厦大超算jykang

这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,之后可能有变化。

队列
时间限制
节点组
节点
单节点CPU
单节点理论性能
GFLOPS
单节点内存
normal(默认) 14 天 cnodes c00{1..9} c0{19..48}
以下除外:c022
双路 Intel E5-2690
共 16 核 32 线程
限制使用 20 线程
29 c00{1..9}: 约 60 GB
c0{19..44}: 约 30 GB
c0{45..48}: 251.7 GB
normal_1day 1 天 normal_1day nxt00{1..9} nxt0{41..67}
以下除外:nxt043
双路 Intel E5-2680 v4
共 28 核
93 124.9 GB
normal_1week 7 天 normal_1week nxt0{10..40}
以下除外:nxt015
双路 Intel E5-2680 v4
共 28 核
93 124.9 GB
normal_2week 14 天 b_node b0{01..14} 双路 Intel 5318Y
共 48 核
167 251.3 GB
normal_1day_new 1 天 charge_s_normal s0{06..18} 双路 Intel 6126
共 24 核
79 charge_s_normal: 约 180 GB
hd0{01..27}: 125.2 GB
hd028: 93.7 GB
ocean_530_1day 1 天 hd_sd530 hd0{01..28} 双路 Intel 6126
共 24 核
79 charge_s_normal: 约 180 GB
hd0{01..27}: 125.2 GB
hd028: 93.7 GB
ocean6226R_1day 1 天 hd_sd530_6226R hd0{29..48} 双路 Intel 6226R
共 32 核
129 188.2 GB

srv1

此集群包含了四个节点。其中第一个节点srv1-node0的性能较好推荐优先使用剩下的三个节点性能相对较差。 用于存储计算数据的硬盘大小为 1 TB使用 btrfs,实际可存储数据大约 2.5 TB。

节点主机名
Slurm 中的节点名)
内存 CPU CPU 理论性能
GFLOPS
srv1-node0
n0
128 GB 四路 Intel Gold 6230
共 80 核 160 线程
250
srv1-node1
n1
32 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146
srv1-node2
n2
64 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146
srv1-node3
n3
40 GB 四路 Intel E7-4809v4
共 32 核 64 线程
146
队列 包含节点
localhost(默认) n0
old n1 n3
fdtd n2
all n[0-3]

谨慎使用第三个节点srv1-node2做计算。详见下方的说明。

{{< details title="谨慎使用第三个节点的原因" closed="true" >}} 按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions即srv1Windows。 同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。 如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。 {{< /details >}}

srv1Windows

用于存储计算数据的硬盘空间约 500 GB。

内存 CPU CPU理论性能
GFLOPS
128 GB 四路 Intel E7-4809v4
共 32 核 32 线程
146

srv2

用于存储计算数据的硬盘大小为 18 TB使用 btrfs,实际可存储数据大约 40 TB。

对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。 此外,在多个 GPU 都空闲的情况下Slurm 不会自动选择性能更好的 GPU可能会将任务分配到性能更差的 GPU 上; 因此通常推荐手动选择 GPU除非有很多任务要计算。

节点主机名
Slurm 中的节点名)
设备 理论性能
GFLOPS双精度/单精度)
内存/显存
srv2-node0
n0
CPU: 双路 Intel Gold 6152
共 44 核 88 线程
136/136 256 GB
srv2-node0
n0
GPU: NVIDIA 4090 1290/82580 24 GB
srv2-node1
n1
CPU: AMD R9-5950X
16 核 32 线程
100/100 96 GB
srv2-node1
n1
GPU: NVIDIA 3090 556/35580 24 GB
srv2-node1
n1
GPU: NVIDIA 4090 1290/82580 24 GB
GPU: NVIDIA 2080 Ti
(买了没装)
421/13448 12 GB
GPU: NVIDIA P5000
(买了没装)
194/6197 16 GB
GPU: NVIDIA A100
(大概可能会买)
9700/19500 40 GB
GPU: NVIDIA H100
(未付款,期待发货)
25600/51200 80 GB
队列 包含节点
all(默认) n0 n1
n0 n0
n1 n1