(復旧) 2025年5月22日(木) 一般解析区画のslurm障害発生
2025年5月22日(木) 2時54分(24時間標記。以下、時間は全て24時間標記)に。一般解析区画のslurm管理サーバが停止しました。
原因は、slurm管理サーバが起動する計算ノード上でのメモリ不足によるものでした。
復旧作業は、同日 10時34分に完了し、その後、ジョブの投入が可能な状態となりました。
影響の範囲
- 一般解析区画において、slurm管理サーバが停止していた2時54分から10時34分までの約8時間の間、一般解析区画へのジョブ投入ができませんでした。また、停止期間中に実行中のジョブはキャンセルされ、再実行が必要です。対象者には、個別にご連絡致します。停止期間中、未実行のジョブにつきましては影響ありません。
- 個人ゲノム解析区画には影響ありません。
- DDBJのサービスには影響はありません。