メインコンテンツまでスキップ

「メンテナンス情報」タグの記事が47件あります

全てのタグを見る

· 約2分

掲載日: 2023 年 8 月 8 日

一般解析区画の高速ストレージシステム Lustre7 で冗長構成の OST コントローラの1つでハードウェア障害が発生しました。 本日以下の日程でコントローラの交換作業およびシステムのテイクバック作業を実施します

作業日程

  • 13:00 ~ 15:00 交換作業
  • 15:00 ~ 16:00 テイクバック作業※I/O サスペンド発生

現時点のシステム影響

現時点ではシステムへの影響は発生していません。

作業時のシステム影響

  • 遺伝研スパコン一般解析区画
    • 交換作業時に Lustre7 で 10 分程度の I/O サスペンドが 1 回発生します。作業完了後 I/O は自動で再開されます。
  • 遺伝研スパコン個人ゲノム解析区画
    • 影響ありません。
  • DDBJ サービス
    • 影響ありません。

作業時の I/O 状況により時間がかかる場合もございますのでその点ご了承いただきたく存じます。 何卒ご理解とご協力を賜りますよう、よろしくお願い申し上げます。

· 約2分

掲載日: 2023年7月26日

DDBJのデータベース用ストレージシステムの更新に伴う切り替え作業のため、以下の時間帯において、FTPサービスおよびAsperaによる通信が一時的に不通となります。

作業日時

2023/7/27(月) 9:00 ~ 15:00 (24h表記)

  • 約15分程度の通信断が発生します。

影響の範囲

  • 遺伝研スパコン一般解析区画
    • ログインやscp, HCPtoolsによるデータ転送作業には影響ありません。
    • 稼働中のジョブの停止は発生しません。
    • スパコン内からのDDBJデータベースへのアクセス(/usr/local/resources/以下へのアクセス)に影響はありません。
  • 遺伝研スパコン個人ゲノム解析区画
    • ログインやscp, HCPtoolsによるデータ転送作業には影響ありません。
    • 稼働中のジョブの停止は発生しません。
    • スパコン内からのDDBJデータベースへのアクセス(/usr/local/resources以下へのアクセス)に影響はありません。
  • DDBJサービス
    • DDBJデータベースのFTP, Aspera, HTTPSによるダウンロードが不通になります。

何卒ご理解とご協力を賜りますよう、よろしくお願い申し上げます。

· 約3分

これまでは GPU 計算ノードの CPU の利用率が低いことから、GPU 計算ノードの CPU の一部を short.q に割り当てていましたが、近年 GPU を利用したソフトウェアが様々作られ利用方法も変化してきていることから、AGE キューの構成を以下のように変更し、GPU ノードで利用可能な CPU コア数を増やします。

〔変更前〕

キュー構成ノードノード数CPU コア数メモリ
gpu.qThin 計算ノード Type 2b7合計 56 (ノード当たり 8)合計 1,344GB (ノード当たり 192GB)
short.qThin 計算ノード Type 2b7合計 112 (ノード当たり 16)1,344GB(ノード当たり 92GB)

〔変更後〕

キュー構成ノードノード数CPU コア数メモリ
gpu.qThin 計算ノード Type 2b7合計 168 (ノード当たり 24)合計 2,688GB (ノード当たり 384GB)
short.qThin 計算ノード Type 1a2合計 128 (ノード当たり 64) 合計 1,024GB (ノード当たり 512GB)

short.q はノード種変更に伴い、CPU が AMD EPYC 7501 から Intel Xeon Gold 6130 になります。必要に応じて実行ジョブの見直しをお願いいたします。

作業日程

2023/7/26(水) 10:00 ~ 11:30

影響の範囲

  • 作業中は実行中のジョブへの影響はありません。
  • 作業中は gpu.q はジョブの新規実行が不可になります。
  • 作業中においても short.q は新規実行可能です。
  • 作業中は以下のシステムの情報更新は停止します。
  • 作業の前後で各キューのジョブのサブミット方法に変更はありません。

· 約1分

掲載日: 2023年6月27日

ネットワーク機器の保守作業に伴い、以下の時間帯において、ネットワークが一時的に不通となります。

作業日時

2023年 7月 3日(月) 11:00 ~ 12:00 (24h表記)

  • 約30分程度の通信断が発生します。

  • 影響の範囲

    • 通信断の間は、スパコンへのログインやデータ転送作業は出来ません。
    • 稼働中のジョブの停止は発生しません。

何卒ご理解とご協力を賜りますよう、よろしくお願い申し上げます。

· 約1分

掲載日: 2023年6月2日

SINET6の機器メンテナンス作業に伴い、 以下の時間帯において、ネットワークが一時的に不通となります。

  • 日時:2023年 6月 5日(月) 4:30 ~ 6:00 (24h表記)

    • 上記時間帯にて15分程度の通信断が最大2回発生いたします。
  • 影響の範囲

    • 通信断の間は、スパコンへのログインやデータ転送作業は出来ません。
    • 稼働中のジョブの停止は発生しません。

何卒ご理解とご協力を賜りますよう、よろしくお願い申し上げます。

· 約2分

DDBJのデータベース構築に用いていたストレージシステムが2023年4月にリプレースされ、これまで約15PBだったディスク領域が40PBのディスク領域に刷新されました。

現在DDBJ業務用の高速ストレージLustre6のデータと旧データベース用ストレージGPFS1,2のデータを新ストレージに移行する作業を行っています。データ移行は7月ごろに終了し、その後本格稼働する予定です。

新ストレージの本格稼働後はDRAのデータなどが遺伝研スパコンから直接マウントされて直接使えるようになります。

Lustre6は主にDDBJのデータベース構築用に使われていましたが、旧スパコン(NIGスパコン2012)のユーザのデータが一部残っていました。該当のユーザにはメールにてご連絡させていただいております。現遺伝研スパコンの一般解析区画ユーザホーム領域はLustre7にありますので、メールを受け取られたユーザはそちらにデータ転送するか、データを削除していただくようお願い申し上げます。

現行ストレージの種類については以下をご参照ください。

「ハードウェア」 > 「ストレージ」高速ストレージ Lustre ファイルシステム

· 約1分

個人ゲノム解析区画の高速ストレージシステムLustre8で、サーバのバージョンアップ及びそれに伴うメンテナンス作業を行います。

作業日程

2023/3/8(水) 14:00~17:00

影響の範囲

  • 個人ゲノム解析区画において、Lustre8へのI/Oサスペンドが複数回(最低6回)発生します。
  • 一般解析区画には影響はありません。
  • DDBJのサービスなどには影響はありません。

· 約1分

掲載日: 2022年12月22日

ネットワーク機器の保守作業に伴い、以下の時間帯において、ネットワークが一時的に不通となります。

  • 日時:2022年 12月 27日(火) 13:00 ~ 14:00 (24h表記)

    • 約30分~1時間の通信断が発生します。
  • 影響の範囲

    • 通信断の間は、スパコンへのログインやデータ転送作業は出来ません。
    • 稼働中のジョブの停止は発生しません。

何卒ご理解とご協力を賜りますよう、よろしくお願い申し上げます。

· 約1分

掲載日: 2022年12月19日

一般解析区画の高速ストレージシステムLustre7でSASケーブル不良が発生しました。12月19日(月)15:59時点でのユーザへの影響は発生しておりません。以下の日時でケーブルの交換を行います。

作業日程

2022/12/20(火) 12:00~17:00(見込み)

影響の範囲

  • 2022/12/20(火) 12:00~17:00の間に一般解析区画Lustre 7において 4分程度のI/Oサスペンドが2,3回発生する見込みです。
  • 個人ゲノム解析区画には影響はありません。
  • DDBJのサービスなどには影響はありません。

· 約1分

掲載日: 2022年11月24日

DDBJ業務のための高速ストレージシステムLustre6で機材故障が発生しました。

以下の日時で機材の交換を行います。

作業日程

2022/11/24(木) 09:30 ~ 12:00

影響の範囲

  • DDBJ業務の区画において、作業前後にLustre6へのI/Oサスペンドが各4分程度発生する見込みです。
  • 一般解析区画および個人ゲノム解析区画には影響はありません。