7.7 KiB
weight, title
| weight | title |
|---|---|
| 2 | 服务器配置 |
基本情况
下面列出服务器放置的位置和主要用途,方便读者区分。当然主要用途之外也可以有“次要用途”,只要不影响他人。
| 服务器 | 地址(物理意义上) | 操作系统 | 主要用途 |
|---|---|---|---|
| 厦大超算 (jykang) |
我也不知道 好像在嘉庚三地下室 反正这个肯定丢不了 |
Linux CentOS | VASP(CPU) |
| srv1 | 物机大楼 351 隔间内机架上 很吵的那四台就是 |
Linux NixOS | VASP(CPU) |
| srv1 (Windows) |
虚拟机 对应宿主为 srv1-node2 即从上往下数第三个节点 |
Windows | FDTD Solutions |
| xmupc1 | 物机大楼457我桌子右边 | Linux NixOS | VASP(GPU) |
| xmupc2 | 物机大楼457我桌子右边 | Linux NixOS | VASP(GPU) |
软件
待补充(VASP 打了哪些补丁,还有哪些计算软件等)。
连接协议和参数
以下总结了各个服务器支持的连接协议和对应的参数,留空即表明该服务器不支持该协议。如果不知道如何使用这些参数,参考连接到服务器。
| 服务器 | 用户名 | SSH 地址 | SSH 端口 | RDP 地址 | SMB 地址1 |
|---|---|---|---|---|---|
| 厦大超算 (jykang) |
jykang |
hpc.xmu.edu.cn2 |
22 |
||
| srv1 | GROUPIII-n |
srv1.chn.moe |
22 |
srv1.chn.moe:62113 |
srv1.chn.moe |
| srv1(Windows) | GROUPIII-n |
srv1.chn.moe |
6144 |
srv1.chn.moe |
|
| xmupc1 | 姓名首字母(例如 chn) |
xmupc1.chn.moe |
6007 |
xmupc1.chn.moe3 |
xmupc1.chn.moe |
| xmupc2 | 姓名首字母(例如 chn) |
xmupc2.chn.moe |
6394 |
xmupc2.chn.moe:33903 |
硬件配置
以下表格总结了各个服务器的硬件配置。
现在(2024 年)最好的笔记本 CPU(R9-7945HX)性能约为 125 GFLOPS,整机大约七千可以买到,可以据此估计各个服务器的 CPU/GPU 性能。
{{< tabs items="厦大超算(jykang),srv1,srv1(Windows),xmupc1 & xmupc2" >}} {{< tab >}} 这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,可能有变化。
| 节点组 | 单节点CPU | 单节点理论性能<br/>(GFLOPS) | 单节点内存 |
|:-:|:-:|:-:|:-:|
| `cnodes` | 双路 Intel E5-2690<br/>共 16 核 32 线程<br/>限制使用 20 线程 | 29 | `c00{1..9}`: 约 60 GB<br/>`c0{19..44}`: 约 30 GB<br/>`c0{45..48}`: 251.7 GB |
| `normal_1day`<br/>`normal_1week` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `b_node` | 双路 Intel 5318Y<br/>共 48 核 | 167 | 251.3 GB |
| `charge_s_normal`<br/>`hd_sd530` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `hd_sd530_6226R` | 双路 Intel 6226R<br/>共 32 核 | 129 | 188.2 GB |
{{< /tab >}} {{< tab >}} 此集群包含了四个节点。其中第一个节点(srv1-node0)的性能较好,推荐优先使用;剩下的三个节点性能相对较差。 用于存储计算数据的硬盘大小为 1 TB,使用 btrfs,实际可存储数据大约 2.5 TB。
| 节点主机名</br>(Slurm 中的节点名) | 内存 | CPU | CPU 理论性能<br/>(GFLOPS) |
|:-:|:-:|:-:|:-:|
| srv1-node0</br>(n0) | 128 GB | 四路 Intel Gold 6230<br/>共 80 核 160 线程 | 250 |
| srv1-node1</br>(n1) | 32 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node2</br>(n2) | 64 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node3</br>(n3) | 40 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
注:谨慎使用第三个节点(srv1-node2)做计算。详见下方的说明。
{{< details title="谨慎使用第三个节点的原因" closed="true" >}}
按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions(即srv1(Windows))。
同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。
如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。
{{< /details >}}
{{< /tab >}} {{< tab >}} 用于存储计算数据的硬盘空间约 500 GB。
| 内存 | CPU | CPU理论性能<br/>(GFLOPS) |
|:-:|:-:|:-:|
| 128 GB | 四路 Intel E7-4809v4<br/>共 32 核 32 线程 | 146 |
{{< /tab >}} {{< tab >}} 对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。
xmupc1 用于存储计算数据的硬盘大小为 2 TB,使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 5 TB。
xmupc2 用于存储计算数据的硬盘大小为 18 TB,使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 40 TB。
| 主机 | 设备 | 理论性能<br/>(GFLOPS,双精度/单精度) | 内存/显存 |
|:-:|:-:|:-:|:-:|
| xmupc1 | CPU: AMD R9-5950X<br/>16 核 32 线程 | 100/100 | 96 GB |
| xmupc1 | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| xmupc1 | GPU: NVIDIA 3090 | 556/35580 | 24 GB |
| xmupc1 | GPU: NVIDIA P5000 | 194/6197 | 16 GB |
| xmupc2 | CPU: 双路 Intel Gold 6152<br/>共 44 核 88 线程 | 136/136 | 256 GB |
| xmupc2 | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| | GPU: NVIDIA 2080 Ti<br/>(买了没装) | 421/13448 | 12 GB |
| | ~~GPU: NVIDIA H100<br/>(未付款,期待发货)~~ | 25600/51200 | 80 GB |
注:VASP 使用双精度浮点(即双精度的 GFLOPS 更能估计 VASP 的实际性能)。
一些其它的软件可能使用单精度浮点(例如 LAMMPS)也可能使用双精度浮点。
深度学习、游戏渲染时,一般使用单精度或者半精度浮点。
{{< /tab >}} {{< /tabs >}}
队列
一些服务器包含多个队列。
{{< tabs items="厦大超算(jykang),srv1" >}} {{< tab >}} 信息采集于 2024 年 10 月 21 日,可能有变化。
| 队列 | 时间限制 | 节点组 | 节点 |
|:-:|:-:|:-:|:-:|
| `normal`(默认) | 14 天 | `cnodes` | `c00{1..9}` `c0{19..48}`<br/>以下除外:`c022`
| `normal_1day` | 1 天 | `normal_1day` | `nxt00{1..9}` `nxt0{41..67}`<br/>以下除外:`nxt043` |
| `normal_1week` | 7 天 | `normal_1week` | `nxt0{10..40}`<br/>以下除外:`nxt015` |
| `normal_2week` | 14 天 | `b_node` | `b0{01..14}` |
| `normal_1day_new` | 1 天 | `charge_s_normal` | `s0{06..18}` |
| `ocean_530_1day` | 1 天 | `hd_sd530` | `hd0{01..28}` |
| `ocean6226R_1day` | 1 天 | `hd_sd530_6226R` | `hd0{29..48}` |
{{< /tab >}}
{{< tab >}}
| 队列 | 包含节点 |
|:-:|:-:|
| localhost(默认) | n0 |
| old | n1 n3 |
| fdtd | n2 |
| all | n[0-3] |
{{< /tab >}} {{< /tabs >}}
-
SMB 协议使用与 RDP 或 SSH 不同的认证机制,与 SSH 和 RDP 不共用密码,使用前需要先联系我设置一个。 此外 SMB 协议安全性可能不及其它两者。 ↩︎
-
使用厦大超算(jykang)时,必须开启 SSH agent forwarding, 详见连接 VASP 服务器,开启 SSH 代理转发或使用 OpenSSH。 ↩︎
-
使用 RDP 协议连接到 Linux 服务器时,需要手动设置连接类型,详见:RDP 设置连接类型。 当使用 Linux 系统连接到 Linux 服务器时,推荐使用 SSH X11 forwarding 代替远程桌面。 详见:使用 SSH X11 forwarding。 ↩︎