(終了)2014年12月19日【LUSTRE2障害】スーパーコンピュータシステム LUSTRE2復旧のお知らせ

国立遺伝学研究所スーパーコンピュータシステム利用者各位

2014年12月19日
国立遺伝学研究所 DDBJセンター スーパーコンピュータシステム管理チーム

平素より、国立遺伝学研究所スーパーコンピュータシステムをご利用いただき誠に有難うございます。

下記の通り、Lustre2にて障害が発生しておりましたが、復旧作業を実施し、13:25頃に復旧致しました。


    障害発生日時
        2014 年 12 月 19 日 (金) 11:55 ~ 13:25頃

    障害内容

        Lustre2のmdsであるmds03にて、Lustreの処理がフリーズしていました。
        これによりmds03上の処理が滞留し、Lustre2へのアクセスができなくなっていました。

    障害影響

        障害発生期間中、Lustre2を参照する処理が正常に動作しない状態となりました。
        また、Lustre2にホームディレクトリを持つユーザがPhase1側ゲートウェイノードに
        ログインできない状態となりました。

    対策

        mds03上で稼働しているLustreのサービスを、待機系であるmds04に手動で
        テイクオーバーし、Lustre2へのアクセス復旧を確認しました。
 

 この度はご迷惑をお掛けし申し訳ございませんでした。