Files
blog-public/content/docs/server/config.md
2024-10-22 18:13:55 +08:00

140 lines
7.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
weight: 2
title: "服务器配置"
---
## 基本情况
下面列出服务器放置的位置和主要用途,方便读者区分。当然主要用途之外也可以有“次要用途”,只要不影响他人。
| 服务器 | 地址(物理意义上) | 操作系统 | 主要用途 |
|:-:|:-:|:-:|:-:|
| 厦大超算<br/>jykang | 我也不知道<br/>好像在嘉庚三地下室<br/>反正这个肯定丢不了 | Linux CentOS | VASPCPU |
| srv1 | 物机大楼 351 隔间内机架上<br/>很吵的那四台就是 | Linux NixOS | VASPCPU |
| srv1<br/>Windows | 虚拟机<br/>对应宿主为 srv1-node2 <br/>即从上往下数第三个节点 | Windows | FDTD Solutions |
| xmupc1 | 物机大楼457我桌子右边 | Linux NixOS | VASPGPU |
| xmupc2 | 物机大楼457我桌子右边 | Linux NixOS | VASPGPU |
## 软件
待补充VASP 打了哪些补丁,还有哪些计算软件等)。
<!-- TODO -->
## 连接协议和参数
以下总结了各个服务器支持的连接协议和对应的参数,留空即表明该服务器不支持该协议。如果不知道如何使用这些参数,参考[连接到服务器](../link)。
| 服务器 | 用户名 | SSH 地址 | SSH 端口 | RDP 地址 | SMB 地址[^3] |
|:-:|:-:|:-:|:-:|:-:|:-:|
| 厦大超算<br/>jykang | `jykang` | `hpc.xmu.edu.cn`[^1] | `22` | | |
| srv1 | `GROUPIII-n` | `srv1.chn.moe` | `22` | `srv1.chn.moe:6211`[^2] | `srv1.chn.moe` |
| srv1Windows | `GROUPIII-n` | `srv1.chn.moe` | `6144` | `srv1.chn.moe` |
| xmupc1 | 姓名首字母(例如 `chn` | `xmupc1.chn.moe` | `6007` | `xmupc1.chn.moe`[^2] | `xmupc1.chn.moe` |
| xmupc2 | 姓名首字母(例如 `chn` | `xmupc2.chn.moe` | `6394` | `xmupc2.chn.moe:3390`[^2] |
## 硬件配置
以下表格总结了各个服务器的硬件配置。
现在2024 年)最好的笔记本 CPUR9-7945HX性能约为 125 GFLOPS整机大约七千可以买到可以据此估计各个服务器的 CPU/GPU 性能。
{{< tabs items="厦大超算jykang,srv1,srv1Windows,xmupc1 & xmupc2" >}}
{{< tab >}}
这里仅列出 jykang 有权限使用的节点。信息采集于 2024 年 10 月 21 日,可能有变化。
| 节点组 | 单节点CPU | 单节点理论性能<br/>GFLOPS | 单节点内存 |
|:-:|:-:|:-:|:-:|
| `cnodes` | 双路 Intel E5-2690<br/>共 16 核 32 线程<br/>限制使用 20 线程 | 29 | `c00{1..9}`: 约 60 GB<br/>`c0{19..44}`: 约 30 GB<br/>`c0{45..48}`: 251.7 GB |
| `normal_1day`<br/>`normal_1week` | 双路 Intel E5-2680 v4<br/>共 28 核 | 93 | 124.9 GB |
| `b_node` | 双路 Intel 5318Y<br/>共 48 核 | 167 | 251.3 GB |
| `charge_s_normal`<br/>`hd_sd530` | 双路 Intel 6126<br/>共 24 核 | 79 | `charge_s_normal`: 约 180 GB<br/>`hd0{01..27}`: 125.2 GB<br/>`hd028`: 93.7 GB |
| `hd_sd530_6226R` | 双路 Intel 6226R<br/>共 32 核 | 129 | 188.2 GB |
{{< /tab >}}
{{< tab >}}
此集群包含了四个节点。其中第一个节点srv1-node0的性能较好推荐优先使用剩下的三个节点性能相对较差。
用于存储计算数据的硬盘大小为 1 TB使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 2.5 TB。
| 节点主机名</br>Slurm 中的节点名) | 内存 | CPU | CPU 理论性能<br/>GFLOPS |
|:-:|:-:|:-:|:-:|
| srv1-node0</br>n0 | 128 GB | 四路 Intel Gold 6230<br/>共 80 核 160 线程 | 250 |
| srv1-node1</br>n1 | 32 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node2</br>n2 | 64 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
| srv1-node3</br>n3 | 40 GB | 四路 Intel E7-4809v4<br/>共 32 核 64 线程 | 146 |
谨慎使用第三个节点srv1-node2做计算。详见下方的说明。
{{< details title="谨慎使用第三个节点的原因" closed="true" >}}
按照吴志明老师的要求,此节点还安装了一个 Windows 虚拟机用于 FDTD Solutions即srv1Windows
同时使用 Windows 虚拟机和宿主机做计算会严重影响性能,占用内存过高还有可能会导致节点崩溃,你的任务就白算了(倒是也没有什么更严重后果)。
如果你不知道这段时间内有没有人在使用 Windows 虚拟机,建议干脆不要使用这个节点。
{{< /details >}}
{{< /tab >}}
{{< tab >}}
用于存储计算数据的硬盘空间约 500 GB。
| 内存 | CPU | CPU理论性能<br/>GFLOPS |
|:-:|:-:|:-:|
| 128 GB | 四路 Intel E7-4809v4<br/>共 32 核 32 线程 | 146 |
{{< /tab >}}
{{< tab >}}
对于大多数任务,推荐使用 GPU 进行计算,因为算得快;对于需要较多内存的任务,因为 GPU 的显存不够用,推荐使用 CPU。
xmupc1 用于存储计算数据的硬盘大小为 2 TB使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 5 TB。
xmupc2 用于存储计算数据的硬盘大小为 18 TB使用 [btrfs](../qa#btrfs-是什么),实际可存储数据大约 40 TB。
| 主机 | 设备 | 理论性能<br/>GFLOPS双精度/单精度) | 内存/显存 |
|:-:|:-:|:-:|:-:|
| xmupc1 | CPU: AMD R9-5950X<br/>16 核 32 线程 | 100/100 | 96 GB |
| xmupc1 | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| xmupc1 | GPU: NVIDIA 3090 | 556/35580 | 24 GB |
| xmupc1 | GPU: NVIDIA P5000 | 194/6197 | 16 GB |
| xmupc2 | CPU: 双路 Intel Gold 6152<br/>共 44 核 88 线程 | 136/136 | 256 GB |
| xmupc2 | GPU: NVIDIA 4090 | 1290/82580 | 24 GB |
| | GPU: NVIDIA 2080 Ti<br/>(买了没装) | 421/13448 | 12 GB |
| | ~~GPU: NVIDIA H100<br/>(未付款,期待发货)~~ | 25600/51200 | 80 GB |
VASP 使用双精度浮点(即双精度的 GFLOPS 更能估计 VASP 的实际性能)。
一些其它的软件可能使用单精度浮点(例如 LAMMPS也可能使用双精度浮点。
深度学习、游戏渲染时,一般使用单精度或者半精度浮点。
{{< /tab >}}
{{< /tabs >}}
## 队列
一些服务器包含多个队列。
{{< tabs items="厦大超算jykang,srv1" >}}
{{< tab >}}
信息采集于 2024 年 10 月 21 日,可能有变化。
| 队列 | 时间限制 | 节点组 | 节点 |
|:-:|:-:|:-:|:-:|
| `normal`(默认) | 14 天 | `cnodes` | `c00{1..9}` `c0{19..48}`<br/>以下除外:`c022`
| `normal_1day` | 1 天 | `normal_1day` | `nxt00{1..9}` `nxt0{41..67}`<br/>以下除外:`nxt043` |
| `normal_1week` | 7 天 | `normal_1week` | `nxt0{10..40}`<br/>以下除外:`nxt015` |
| `normal_2week` | 14 天 | `b_node` | `b0{01..14}` |
| `normal_1day_new` | 1 天 | `charge_s_normal` | `s0{06..18}` |
| `ocean_530_1day` | 1 天 | `hd_sd530` | `hd0{01..28}` |
| `ocean6226R_1day` | 1 天 | `hd_sd530_6226R` | `hd0{29..48}` |
{{< /tab >}}
{{< tab >}}
| 队列 | 包含节点 |
|:-:|:-:|
| `localhost`(默认) | `n0` |
| `old` | `n1` `n3` |
| `fdtd` | `n2` |
| `all` | `n[0-3]` |
{{< /tab >}}
{{< /tabs >}}
[^1]: 使用厦大超算jykang必须开启 SSH agent forwarding
详见[连接 VASP 服务器,开启 SSH 代理转发](../link#连接-vasp-服务器开启-ssh-代理转发)或[使用 OpenSSH](../link#使用-openssh)。
[^2]: 使用 RDP 协议连接到 Linux 服务器时,需要手动设置连接类型,详见:[RDP 设置连接类型](../qa#rdp-设置连接类型)。
当使用 Linux 系统连接到 Linux 服务器时,推荐使用 SSH X11 forwarding 代替远程桌面。
详见:[使用 SSH X11 forwarding](../qa#使用-ssh-x11-forwarding)。
[^3]: SMB 协议使用与 RDP 或 SSH 不同的认证机制,与 SSH 和 RDP 不共用密码,使用前需要先联系我设置一个。
此外 SMB 协议安全性可能不及其它两者。