NIG Supercomputer

(復旧) 2025年5月22日(木) 一般解析区画のslurm障害発生

2025年5月22日(木) 2時54分(24時間標記。以下、時間は全て24時間標記)に。一般解析区画のslurm管理サーバが停止しました。

原因は、slurm管理サーバが起動する計算ノード上でのメモリ不足によるものでした。

復旧作業は、同日 10時34分に完了し、その後、ジョブの投入が可能な状態となりました。

影響の範囲

Last updated: 2025-05-22