サイトポリシー サイトマップ
2017 年 12 月 12 日

スーパーコンピュータシステム稼働状況

現在のスーパーコンピュータシステムの稼働情報です。グラフは5分置きに更新されます。
各グラフをクリックすると詳細画面が表示されます。

UGEキュー利用状況概要
UGE全体利用状況
研究用UGEキュー利用状況(Phase1)
研究用UGEキュー利用状況(Phase2)
業務用UGEキュー利用状況
スーパーコンピュータシステムアカウント状況
ネットワーク利用状況
Lustre利用状況(Phase1)
Lustre利用状況(Phase2)
スーパーコンピュータシステム環境状況

UGEキュー利用状況概要  topへ移動

現在のUGEキューの利用状況概要です。データは1分置きに更新されます。
下記表は、各計算ノードのスロット、メモリの使用率を表します。
ジョブ投入にあたり、混在状況の参考にして下さい。
利用状況により、新規ジョブは、待ち合わせ時間が発生する可能性があります。

Phase 1

研究用fat/medium計算ノード

qnamehost slot (スロット数) memory (GB)
use / all prcentdisabled in use req / all percent

研究用thin計算ノード

※month_gpu.qとshort.qは実ノードが同じため、in use(使用メモリ量)が同じ値となります。
qnamehost slot (スロット数) memory (GB)
use / all percentdisabled in use req / all percent

Phase 2

研究用medium計算ノード

qnamehost slot (スロット数) memory (GB)
use / all prcentdisabled in use req / all percent

研究用thin計算ノード

※month_gpu.qとshort.qは実ノードが同じため、in use(使用メモリ量)が同じ値となります。
qnamehost slot (スロット数) memory (GB)
use / all percentdisabled in use req / all percent

業務用thin計算ノード

qnamehost slot (スロット数) memory (GB)
use / all percentdisabled in use req / all percent

slot
(単位:スロット数)
use 使用中のジョブスロット数です
all キューが保有する全ジョブスロット数です
percent 使用中ジョブのスロット使用率です
disabled メンテナンス等の理由で無効化されている、または高負荷等の理由で使用できないジョブスロットの数です
memory
(単位:GB)
in use 現在使用中のメモリ量の合計です
req 現在動作中のジョブによって確保されているメモリ量の合計です
all ホストが保有するメモリ量の合計です
percent 現在動作中ジョブのメモリ確保率です
percent
(スロット使用率
メモリ確保率)
0%~50%
51%~79%
80%~100%

 

UGE全体利用状況  topへ移動

UGE全体の利用状況です。

全体概要

Phase1

  fat計算ノード medium計算ノード thin計算ノード
ノード数 1ノード 2ノード 125ノード
CPUコア数 768コア 80コア/1ノード 16コア/1ノード
memory容量 10TB 2TB/1ノード 64GB/1ノード
UGE CPU&メモリ使用率 UGE ジョブスロット&メモリ要求率
UGEに割り当てられている全計算ノードのCPUとメモリの実使用率です。 UGEに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

Gangliaによる稼働状況報告

Gangliaによる稼働状況報告をご覧になれます。
「Gangliaによる稼働状況報告」

 

Phase2

  medium計算ノード thin計算ノード
ノード数 8ノード 185ノード
CPUコア数 80コア/1ノード 20コア/1ノード
memory容量 2TB/1ノード 64GB/1ノード
UGE CPU&メモリ使用率 UGE ジョブスロット&メモリ要求率
UGEに割り当てられている全計算ノードのCPUとメモリの実使用率です。 UGEに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

 

研究用UGEキュー利用状況(Phase1)  topへ移動

全体概要

  fat計算ノード medium計算ノード thin計算ノード
ノード数 1ノード 2ノード 125ノード
CPUコア数 768コア 80コア/1ノード 16コア/1ノード
memory容量 10TB 2TB/1ノード 64GB/1ノード
研究用UGE CPU&メモリ使用率 研究用UGE ジョブスロット&メモリ要求率
研究用UGEに割り当てられている全計算ノードのCPUとメモリの実使用率です。 研究用UGEに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
研究用UGEジョブ状況
研究用UGEに投入されているジョブの状況です。
実行中のジョブはプラスで、待ち状態のジョブはマイナスで表現されています。
灰色は使用されていないジョブスロット数を表しています。
ジョブスロット数の上限は3,504です。

研究用fat計算ノード

ノード数 1ノード
CPUコア数 768コア
memory容量 10TB

● month_fat.q (対象ノード数:1ノード)

month_fat.q CPU&メモリ 使用率 month_fat.q ジョブスロット&メモリ 要求率
month_fat.q に割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_fat.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

研究用medium計算ノード

ノード数 2ノード
CPUコア数 80コア/1ノード
memory容量 2TB/1ノード

● month_medium.q (対象ノード数:2ノード)

medium計算ノードCPU&メモリ使用率 month_medium.q ジョブスロット&メモリ要求率
month_medium.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_medium.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

研究用thin計算ノード

ノード数 125ノード
CPUコア数 16コア/1ノード
memory容量 64GB/1ノード
thin計算ノード CPU&メモリ使用率
研究用UGEに割り当てられている全thin計算ノードのCPUとメモリの実使用率です。

● debug.q (対象ノード数:3ノード)

debug.q CPU&メモリ使用率 debug.q ジョブスロット&メモリ要求率
debug.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 debug.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● login.q (対象ノード数:8ノード)

login.q CPU&メモリ使用率 login.q ジョブスロット&メモリ要求率
login.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 login.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_gpu.q (対象ノード数:62ノード)

month_gpu.q CPU&メモリ使用率 month_gpu.q ジョブスロット&メモリ要求率
month_gpu.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_gpu.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
month_gpu.q GPU使用率
GPUの使用率です。

● short.q (対象ノード数:62ノード(仮想ノード))

short.q CPU&メモリ使用率 short.q ジョブスロット&メモリ要求率
short.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 short.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_hdd.q (対象ノード数:84ノード)

month_hdd.q CPU&メモリ使用率 month_hdd.q ジョブスロット&メモリ要求率
month_hdd.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_hdd.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

 

研究用UGEキュー利用状況(Phase2)  topへ移動

全体概要

  medium計算ノード thin計算ノード
ノード数 8ノード 185ノード
CPUコア数 80コア/1ノード 20コア/1ノード
memory容量 2TB/1ノード 64GB/1ノード
研究用UGE CPU&メモリ使用率 研究用UGE ジョブスロット&メモリ要求率
研究用UGEに割り当てられている全計算ノードのCPUとメモリの実使用率です。 研究用UGEに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
研究用UGEジョブ状況
研究用UGEに投入されているジョブの状況です。
実行中のジョブはプラスで、待ち状態のジョブはマイナスで表現されています。
灰色は使用されていないジョブスロット数を表しています。
ジョブスロット数の上限は4,480です。

研究用medium計算ノード

ノード数 8ノード
CPUコア数 80コア/1ノード
memory容量 2TB/1ノード

● month_medium.q (対象ノード数:8ノード)

medium計算ノードCPU&メモリ使用率 month_medium.q ジョブスロット&メモリ要求率
month_medium.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_medium.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

研究用thin計算ノード

ノード数 193ノード
CPUコア数 20コア/1ノード
memory容量 64GB/1ノード
thin計算ノード CPU&メモリ使用率
研究用UGEに割り当てられている全thin計算ノードのCPUとメモリの実使用率です。

● debug.q (対象ノード数:4ノード)

debug.q CPU&メモリ使用率 debug.q ジョブスロット&メモリ要求率
debug.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 debug.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● login.q (対象ノード数:12ノード)

login.q CPU&メモリ使用率 login.q ジョブスロット&メモリ要求率
login.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 login.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● login_sp.q (対象ノード数:2ノード)

login_sp.q CPU&メモリ使用率 login_sp.q ジョブスロット&メモリ要求率
login_sp.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 login_sp.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_gpu.q (対象ノード数:62ノード)

month_gpu.q CPU&メモリ使用率 month_gpu.q ジョブスロット&メモリ要求率
month_gpu.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_gpu.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
month_gpu.q GPU使用率
GPUの使用率です。

● month_phi.q (対象ノード数:30ノード)

month_phi.q CPU&メモリ使用率 month_phi.q ジョブスロット&メモリ要求率
month_phi.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_phi.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
month_phi.q Phi使用率
Phiの使用率です。

● short.q (対象ノード数:62ノード(仮想ノード))

short.q CPU&メモリ使用率 short.q ジョブスロット&メモリ要求率
short.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 short.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_hdd.q (対象ノード数:43ノード)

month_hdd.q CPU&メモリ使用率 month_hdd.q ジョブスロット&メモリ要求率
month_hdd.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_hdd.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_ssd.q (対象ノード数:32ノード)

month_ssd.q CPU&メモリ使用率 month_ssd.q ジョブスロット&メモリ要求率
month_ssd.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_ssd.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

 

業務用UGEキュー利用状況  topへ移動

全体概要

  thin計算ノード
ノード数 33ノード
CPUコア数 16コア/1ノード
memory容量 64GB/1ノード
業務用UGE CPU&メモリ使用率 業務用UGE ジョブスロット&メモリ要求率
業務用UGEに割り当てられている全計算ノードのCPUとメモリの実使用率です。 業務用UGEに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。
業務用UGEジョブ状況
業務用UGEに投入されているジョブの状況です。
実行中のジョブはプラスで、待ち状態のジョブはマイナスで表現されています。
灰色は使用されていないジョブスロット数を表しています。
ジョブスロット数の上限は544です。

業務用thin計算ノード

ノード数 33ノード
CPUコア数 16コア/1ノード
memory容量 64GB/1ノード
thin計算ノード CPU&メモリ使用率
業務用UGEに割り当てられている全thin計算ノードのCPUとメモリの実使用率です。

● login.q (対象ノード数:2ノード)

login.q CPU&メモリ使用率 login.q ジョブスロット&メモリ要求率
login.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 login.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

● month_hdd.q (対象ノード数:31ノード)

month_hdd.q CPU&メモリ使用率 month_hdd.q ジョブスロット&メモリ要求率
month_hdd.qに割り当てられている全計算ノードのCPUとメモリの実使用率です。 month_hdd.qに割り当てられている全ジョブスロットとメモリのうちユーザが確保している割合です。

スーパーコンピュータシステムアカウント状況  topへ移動

アカウント数
登録したスーパーコンピュータシステムのアカウント数です。
Phase1ログインユーザ数 Phase2ログインユーザ数
Phase1スーパーコンピュータシステムへのログイン総数とユニーク数です。 Phase2スーパーコンピュータシステムへのログイン総数とユニーク数です。

ネットワーク利用状況  topへ移動

FireWall経由
FireWall経由でのデータ通信量です。単位は(Byte/秒)です。

Lustre利用状況(Phase1)  topへ移動

ユーザが使用する共有ファイルシステム(Lustre)の利用状況です。

Lustre1 ディスク使用状況 Lustre2 ディスク使用状況
Lustre1のディスク使用量です。Lustre1の容量は1PBです。 Lustre2のディスク使用量です。Lustre2の容量は1PBです。
Lustre1 MDS使用状況 Lustre2 MDS使用状況
Lustre1のメタデータサーバ(MDS)でのファイル操作数です。 Lustre2のメタデータサーバ(MDS)でのファイル操作数です。

Lustre1 READ状況

Lustre2 READ状況
Lustre1の読み込み状況です。単位は(MByte/秒)です。
1ファイルシステムのREAD上限値はおよそ35GByte/秒です。
Lustre2の読み込み状況です。単位は(MByte/秒)です。
1ファイルシステムのREAD上限値はおよそ35GByte/秒です。

Lustre1 WRITE状況

Lustre2 WRITE状況
Lustre1の書き込み状況です。単位は(MByte/秒)です。
1ファイルシステムのWRITE上限値はおよそ35GByte/秒です。
Lustre2の書き込み状況です。単位は(MByte/秒)です。
1ファイルシステムのWRITE上限値はおよそ35GByte/秒です。

Lustre1 ロードアベレージ

Lustre2 ロードアベレージ
Lustre1のロードアベレージです。100を上回ると高負荷状態です。 Lustre2のロードアベレージです。100を上回ると高負荷状態です。

 

Lustre利用状況(Phase2)  topへ移動

ユーザが使用する共有ファイルシステム(Lustre)の利用状況です。

Phase2

Lustre3 ディスク使用状況 Lustre4 ディスク使用状況
Lustre3のディスク使用量です。Lustre3の容量は1.7PBです。 Lustre4のディスク使用量です。Lustre4の容量は1.7PBです。
Lustre5 ディスク使用状況
Lustre5のディスク使用量です。Lustre5の容量は1.7PBです。
Lustre3 MDS使用状況 Lustre4 MDS使用状況
Lustre3のメタデータサーバ(MDS)でのファイル操作数です。 Lustre4のメタデータサーバ(MDS)でのファイル操作数です。
Lustre5 MDS使用状況
Lustre5のメタデータサーバ(MDS)でのファイル操作数です。

Lustre3 READ状況

Lustre4 READ状況
Lustre3の読み込み状況です。単位は(MByte/秒)です。
1ファイルシステムのREAD上限値はおよそ35GByte/秒です。
Lustre4の読み込み状況です。単位は(MByte/秒)です。
1ファイルシステムのREAD上限値はおよそ35GByte/秒です。

Lustre5 READ状況
Lustre5の読み込み状況です。単位は(MByte/秒)です。
1ファイルシステムのREAD上限値はおよそ35GByte/秒です。

Lustre3 WRITE状況

Lustre4 WRITE状況
Lustre3の書き込み状況です。単位は(MByte/秒)です。
1ファイルシステムのWRITE上限値はおよそ35GByte/秒です。
Lustre4の書き込み状況です。単位は(MByte/秒)です。
1ファイルシステムのWRITE上限値はおよそ35GByte/秒です。

Lustre5 WRITE状況
Lustre5の書き込み状況です。単位は(MByte/秒)です。
1ファイルシステムのWRITE上限値はおよそ35GByte/秒です。

Lustre3 ロードアベレージ

Lustre4 ロードアベレージ
Lustre3のロードアベレージです。100を上回ると高負荷状態です。 Lustre4のロードアベレージです。100を上回ると高負荷状態です。

Lustre5 ロードアベレージ
Lustre5のロードアベレージです。100を上回ると高負荷状態です。

 

スーパーコンピュータシステム環境状況  topへ移動

スーパーコンピュータシステム使用電力 PUE
スーパーコンピュータシステムの使用電力です。
全計算ノードはUPS経由で給電しています。
UPSの使用電力と空調機の使用電力の総量を表示しています。
PUEです。スーパーコンピュータシステム室のエネルギー効率を示しています。1に近いほどエネルギーを効率的に使用しています。具体的には以下の式で算出されます。
PUE=(計算ノードの使用電力+空調機の使用電力) / 計算ノードの使用電力

スーパーコンピュータシステム室温度

スーパーコンピュータシステム室湿度
スーパーコンピュータシステム室の温度です。センサーは室内に7か所あります。32℃を上回ると高温状態です。 スーパーコンピュータシステム室の湿度です。センサーは室内に3か所あります。30~70%が正常範囲です。

Phase1計算ノード(thin)温度

Phase2計算ノード(thin)温度
thin計算ノードの内部温度です。35℃以下が望ましい状態です。 thin計算ノードの内部温度です。35℃以下が望ましい状態です。