blog-public/content/docs/server/config/hardware.md

---
weight: 2
title: "硬件和队列"
---

以下表格总结了各个服务器的硬件配置。浮点性能均指双精度浮点性能（而不是衡量 AI 算力常用的单精度浮点性能）。

2024 年最好的笔记本 CPU（R9-7945HX）性能约为 125 GFLOPS，整机大约六七千可以买到；
  最好的服务器 CPU（EPYC 9965）性能约为 1124 GFLOPS，大概十万块可以买到一块。
可以据此估计各个服务器的 CPU 性能。

CPU 和 GPU 的成绩通常不能直接比较，但对于可以大量并行、并且瓶颈在浮点计算或者内存访问的任务，同价钱的 GPU 通常确实比 CPU 快很多。

## 厦大超算（jykang）

这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日，之后可能有变化。

| 队列 | <div style="width:70px">时间限制</div> | 节点组 | <div style="width:200px">节点</div> | <div style="width:200px">单节点CPU</div> | 单节点理论性能<br/>（GFLOPS） | <div style="width:250px">单节点内存</div> |
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
| `normal`（默认） | 14 天 | `cnodes` | `c00{1..9}` `c0{19..48}`<br/>以下除外：`c022` | 双路 Intel E5-2690<br/>共 16 核 32 线程<br/>限制使用 20 线程 | 29 | `c00{1..9}`: 约 60 GB<br/>`c0{19..44}`: 约 30 GB<br/>`c0{45..48}`: 251.7 GB |
| `normal_1day` | 1 天 | `normal_1day` | `nxt00{1..9}` `nxt0{41..67}`<br/>以下除外：`nxt043` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `normal_1week` | 7 天 | `normal_1week` | `nxt0{10..40}`<br/>以下除外：`nxt015` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `normal_2week` | 14 天 | `b_node` | `b0{01..14}` | 双路 Intel 5318Y<br/>共 48 核  | 167 | 251.3 GB |
| `normal_1day_new` | 1 天 | `charge_s_normal` | `s0{06..18}` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `ocean_530_1day` | 1 天 | `hd_sd530` | `hd0{01..28}` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `ocean6226R_1day` | 1 天 | `hd_sd530_6226R` | `hd0{29..48}` | 双路 Intel 6226R<br/>共 32 核 | 129 | 188.2 GB |

## srv1

此集群包含了四个节点。其中第一个节点（srv1-node0）的性能较好，推荐优先使用；剩下的三个节点性能相对较差。
用于存储计算数据的硬盘大小为 1 TB，使用 [btrfs](../qa#btrfs-是什么)，实际可存储数据大约 2.5 TB。

| 节点主机名</br>（Slurm 中的节点名） | 内存 | CPU | CPU 理论性能<br/>（GFLOPS） |
|:-:|:-:|:-:|:-:|
| srv1-node0</br>（n0） | 128 GB | 四路 Intel Gold 6230<br/>共 80 核 160 线程 | 250 |
| srv1-node1</br>（n1） | 32 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node2</br>（n2） | 64 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node3</br>（n3） | 40 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |

| 队列 | 包含节点 |
|:-:|:-:|
| `localhost`（默认） | `n0` |
| `old` | `n1` `n3` |
| `fdtd` | `n2` |
| `all` | `n[0-3]` |

注：谨慎使用第三个节点（srv1-node2）做计算。详见下方的说明。

{{< details title="谨慎使用第三个节点的原因" closed="true" >}}
  按照吴志明老师的要求，此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions（即srv1（Windows））。
  同时使用 Windows 虚拟机和宿主机做计算会严重影响性能，占用内存过高还有可能会导致节点崩溃，你的任务就白算了（倒是也没有什么更严重后果）。
  如果你不知道这段时间内有没有人在使用 Windows 虚拟机，建议干脆不要使用这个节点。
{{< /details >}}


## srv1（Windows）

用于存储计算数据的硬盘空间约 500 GB。

| 内存 | CPU | CPU理论性能<br/>（GFLOPS） |
|:-:|:-:|:-:|
| 128 GB | 四路 Intel E7-4809v4<br/>共 32 核 32 线程 | 146 |

## srv2

用于存储计算数据的硬盘大小为 18 TB，使用 [btrfs](../qa#btrfs-是什么)，实际可存储数据大约 40 TB。

对于大多数任务，推荐使用 GPU 进行计算，因为算得快；对于需要较多内存的任务，因为 GPU 的显存不够用，推荐使用 CPU。
此外，在多个 GPU 都空闲的情况下，Slurm 不会自动选择性能更好的 GPU，可能会将任务分配到性能更差的 GPU 上；
  因此通常推荐手动选择 GPU，除非有很多任务要计算。

| 节点主机名</br>（Slurm 中的节点名） | 设备 | 理论性能<br/>（GFLOPS，双精度/单精度） | 内存/显存 |
|:-:|:-:|:-:|:-:|
| `srv2-node0`</br>（`n0`） | CPU: 双路 Intel Gold 6152<br/>共 44 核 88 线程 | 136/136 | 256 GB |
| `srv2-node0`</br>（`n0`） | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| `srv2-node1`</br>（`n1`） | CPU: AMD R9-5950X<br/>16 核 32 线程 | 100/100 | 96 GB |
| `srv2-node1`</br>（`n1`） | GPU: NVIDIA P5000 | 194/6197 | 16 GB |
| `srv2-node1`</br>（`n1`） | GPU: NVIDIA 3090 | 556/35580 | 24 GB |
| `srv2-node1`</br>（`n1`） | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| | GPU: NVIDIA 2080 Ti<br/>（买了没装） | 421/13448 | 12 GB |
| | ~~GPU: NVIDIA H100<br/>（未付款，期待发货）~~ | 25600/51200 | 80 GB |

| 队列 | 包含节点 |
|:-:|:-:|
| `all`（默认） | `n0` `n1` |
| `n0` | `n0` |
| `n1` | `n1` |