メインコンテンツまでスキップ

次期スパコンの構成

次期スパコンでは基本的な構成は現行のスパコンを踏襲しつつ、SINET6とのネットワーク接続帯域を100Gbpsに増強され、 CPUコア当たりの演算性能は約二倍となります。

またGPU搭載ノードについては最先端のAI解析を可能とするNVIDA DGX B200、ゲノム解析用に費用対効果の高いNVIDIA L40SおよびPEZY-SC3を搭載した計算ノードを導入します。

次期スパコンの構成の詳細は、以下をご参照ください。

システム全体

機器分類機器諸元

計算ノード

HPC CPU最適化ノード

総 CPU コア数: 13,184
合計演算性能 241.644TFLOPS
総メモリ容量 91.136 TB

Type 1
CPU に AMD EPYC 9654 を搭載

ノード数: 50 台
総 CPU コア数: 9600
合計演算性能: 184.3 TFLOPS
総メモリ容量 76.8 TB(コアあたり 8GB)

Type 2
CPU に AMD EPYC 7702 を搭載(旧Thin計算ノードType 1b)

ノード数: 28 台
総 CPU コア数: 3,584
合計演算性能: 57.344 TFLOPS
総メモリ容量 14.336 TB(コアあたり 4GB)

メモリ最適化ノード

総CPUコア数: 960
合計演算性能: 18.0TFLOPS
総メモリ容量: 21TB

Type 1
6TBメモリ搭載

ノード数: 2 台
総 CPU コア数: 384
合計演算性能 7.2 TFLOPS
総メモリ容量 12 TB (コアあたり 32GB)

Type 2
3TBメモリ搭載

ノード数: 3 台
総 CPU コア数: 576
合計演算性能 10.8 TFLOPS
総メモリ容量 9 TB (コアあたり 16GB)

アクセラレータ最適化ノード

Type 1
GPUにNVIDIA B200を搭載
AI計算用

ノード数: 4 台

Type 2
ゲノム解析用GPUノード

調達中

Type 3
アクセラレータとしてPEZY ZettaScaler3を搭載
ゲノム解析用

ノード数: 2 台

ストレージ

大容量高速ストレージ
一般解析区画および個人ゲノム解析区画におけるユーザホーム領域

Lustre ファイルシステム
合計容量:13.3PB

DB 用ストレージ
DRA 等の DDBJ データベースを格納している領域

Lustre ファイルシステム
合計容量:40.5PB

テープ装置
DDBJ データベースのバックアップ用


合計容量:15PB

ノード間相互結合網

InfiniBand HDR100 100Gbps fat tree

ストレージに対しては full bi-section
計算ノードに対しては、full bi-sectionの1/2, ただしアクセラレータ最適化ノード Type1同士は400Gbps full bi-section

HPC CPU最適化ノード

HPC CPU最適化ノード Type 1 (50 台)

AMD EPYC 9654 プロセッサを搭載した計算ノードです。

GIGABYTE R283-Z94

構成要素型番員数ノードあたりの性能など
CPUAMD EPYC 9654 (96 cores) Base 2.4GHz, Max 3.7GHz, 1.8TFlops2合計 192 コア, 3.6TFlops
Memory64GB DDR5-480024合計 1536GB (CPU コアあたり 8GB)
Storage (OS)1TB NVMe SSD1
Storage (Data)30TB NVMe SSD1
NetworkInfiniBand HDR1001100Gbps

HPC CPU最適化ノード Type 2 (28 台)

AMD EPYC 7702 プロセッサを搭載した計算ノードです。(旧Thin計算ノードType 1bと同じものです。)

DELL PowerEdge R6525

構成要素型番員数ノードあたりの性能など
CPUAMD EPYC 7702 (64 cores) Base 2.0GHz, Max 3.35GHz, 1.024TFlops2合計 128 コア, 2.048TFlops
Memory32GB DDR4-266616合計 512GB (CPU コアあたり 4GB)
Storage (OS)1.6TB NVMe SSD1
Storage (Data)900GB SAS HDD1
NetworkInfiniBand 4xEDR1100Gbps

メモリ最適化ノード

メモリ最適化ノード Type 1 (2台)

1台にメモリを6TB搭載した計算ノードです。

GIGABYTE R283-ZK0-AAL1

構成要素型番員数ノードあたりの性能など
CPUAMD EPYC 9654 (96 cores) Base 2.4GHz, Max 3.7GHz, 1.8TFlops2合計 192 コア, 3.6TFlops
Memory128GB DDR5-480048合計 6.144 TB (CPU コアあたり 32GB)
Storage30TB SATA HDD130TB
NetworkInfiniBand HDR1001100Gbps

メモリ最適化ノード Type 2 (3台)

1台にメモリを3TB搭載した計算ノードです。

GIGABYTE R203-Z94-AAD2

構成要素型番員数ノードあたりの性能など
CPUAMD EPYC 9654 (96 cores) Base 2.4GHz, Max 3.7GHz, 1.8TFlops2合計 192 コア, 3.6TFlopw
Memory128GB DDR5-480024合計 3.072TB (CPU コアあたり 16GB)
Storage30TB SATA HDD130TB
NetworkInfiniBand HDR1001100Gbps

アクセラレータ最適化ノード

アクセラレータ最適化ノード Type 1 (4台)

NVIDIA B200 GPU を各ノードに 8基搭載した計算ノードです。AI用の計算に適したGPU搭載計算ノードです。

NVIDIA DGX B200

構成要素型番員数ノードあたりの性能など
CPUIntel Xeon Platinum 8570 (56 cores) Base 2.1GHz, Max 4.0GHz, 1.97TFlops2合計 112 コア, 3.94TFlops
Memory合計2TB合計 2TB (CPU コアあたり 17.9GB)
GPUNVIDIA Blackwell B2008
Storage (OS)1.9TB NVMe SSD2合計3.8TB
Storage (Data)3.84TB NVMe SSD8合計30.7TB
NetworkInfiniBand NDR1400Gbps

アクセラレータ最適化ノード Type 2 (調達中)

ゲノム解析の計算に適したGPU搭載計算ノードです。

構成要素ノードあたりの性能など
CPU合計 64 コア
Memory合計 768GB (CPU コアあたり 12GB)
GPUNVIDIA L40S 4基搭載
Storage (OS)合計 489GB
Storage (Data)合計15TB

アクセラレータ最適化ノード Type 3 (2台)

アクセラレータとしてPEZY-SC3を搭載したノードです。ゲノム解析の計算に適した計算ノードです。

PEZY ZettaScaler3.0

構成要素型番員数ノードあたりの性能など
CPUAMD EPYC 7713P (64 cores) Base 2.0GHz, Max 3.67GHz, 1.02TFlops1合計 64 コア, 1.02TFlops
Memory128GB DDR4 3200MHz16合計 2TB (CPU コアあたり 32GB)
AcceleratorPEZY-SC34
Storage (OS)0.256TB NVMe SSD2合計0.512TB
Storage (Data)4TB NVMe SSD4合計16TB
NetworkInfiniBand HDR1001100Gbps

(参考)GPU, アクセラレータの性能比較

AccerelaterNVIDIA V100NVIDIA A100NVIDIA L40SNVIDIA H100NVIDIA B200PEZY-SC3
GATK互換ソフトのベンチマーク実行時間 [hh:mm:ss]3:07:292:06:141:45:051:56:24N/A1:02:55
ArchitectureVoltaAmpereAda LovelaceHopperBlackwellPEZY
Memory size [GB]16 or 3240 or 804080 or 94N/D32
Memory bandwidth [GB/s]90020398643352N/D1200
FP64 [TFlops]7.89.7N/A33.5N/D19.66
FP32 [TFlops]15.719.591.666.9N/D39.32
FP16,BF16 [TFlops]1126247331979N/D78.64
FP8 [TFlops]N/AN/A14663958N/DN/A
TF32 tensor core [TFlops]125312366989N/DN/A
FP16 tensor core [TFlops]N/A6247331979N/DN/A
FP8 tensor core [TFlops]N/AN/A14663958N/DN/A
INT8 tensor core [TOPS]N/A124814663958N/DN/A

ストレージ

大容量高速ストレージ

用途容量ピーク性能構成
一般解析区画のホーム領域10PBread 60GB/sec, write 70GB/secDDN ES400NVX2 + DDN SS9024
個人ゲノム解析区画のホーム領域8PBread 40GB/sec, write 40GB/secDDN ES400NVX2 + DDN SS9024

DB 用ストレージ

用途容量ピーク性能構成
DDBJ データベース格納用40PBread 150GB/sec, write 150GB/secDDN ES400NVX2 + DDN SS9024
DDBJ データベース格納用10PBread 60GB/sec, write 70GB/secDDN ES400NVX2 + DDN SS9024