NIG Supercomputer

アドバンスリザベーション

概要

アドバンスリザベーションは予めGrid Engineキューのある範囲のリソースを予約しておき、その予約領域を専有して利用できるサービスです。 なお、本サービスは課金サービスであり、使用には事前に利用計画書の提出が必要です。

赤い点線の四角がアドバンスリザベーションで取られたリソース(計算ノードのスロット数✕利用時間) 他の四角がジョブが専有するリソース(計算ノードの利用スロット数✕計算時間)となっています。 領域を予約したユーザーは赤い四角の領域に対してジョブを投入することが出来ます。

(アドバンスリザベーションサービスを使用しているユーザーも、アドバンスリザベーションサービスを使用していないユーザーと同様に、 普通にqsubコマンドを利用することにより計算資源の予約枠を利用せずにジョブを投入することは可能です。)

課金対象期間について

アドバンスリザベーションサービス使用手順

アドバンスリザベーションサービスを使用する場合は、以下の手順で実施してください。

  1. 利用計画表の提出
    • 本サービスは課金サービスであり、使用には事前に利用計画表の提出が必要です。手続きの詳細は課金サービスの利用方法をご参照ください。
  2. 計算資源の予約枠の取得
    • 計算資源の予約枠の取得はQRSUBコマンドで実施します。
  3. 計算資源の予約枠の確認
    • 取得した計算資源の予約枠の確認はqrstatコマンドで実施します。
  4. ジョブの実行
    • 計算資源の予約枠の取得後のジョブ実行は、qsubコマンドに-arオプションでar-id(予約番号)を指定して実施します。
  5. 計算資源の予約枠の削除
    • 取得した計算資源の予約枠の削除はQRDELコマンドで実施します。

QRSUBコマンドおよびQRDELコマンドは遺伝研スパコン上での課金金額の計算のために作成した、Grid Engineのqrsub, qrdelコマンドのラッパープログラムです。 QRSUB,QRDELともコマンドオプションは、それぞれqrsubコマンド、qrdelコマンドのオプションが使用可能です。 各コマンドのオプションについては、Grid Engineユーザーズマニュアル(英語のみ)を参照してください。

計算資源の予約枠の取得方法

予約枠は、スパコンSEに依頼して確保することも出来ますし、コマンドを使ってユーザー自身で確保することも可能です。

実行中のジョブによりリソースに空きがなくQRSUBで計算資源の予約枠の取得ができないことがあります。 その場合は、確保する日時をさらに未来の日時にずらしていただき、再度QRSUBコマンドを実施していただくようお願いいたします。

実行例(1)

medium.qを1ノードで、メモリ量4GB、スロット数3、使用期間2020年4月2日13時15分から2020年5月4日10時00分までの 予約枠を取得する場合 この場合に確保されるメモリ量は12GB(メモリ4GB×3スロット)となり、計算資源の予約枠を取得する際は その分の空き容量が必要となります。

QRSUB -l medium -l mem_req=4G -l s_vmem=4G -pe def_slot 3 -a 202004021315 -e 202005041000

実行例(2)

medium.qを複数ノードに跨るmpiジョブ(並列数は2~5)で、使用期間10月10日00時00分から10月20日7時5分までの予約枠を取得する場合 この場合に確保される最大メモリ量は、40GB(8GB(デフォルト値)×10スロット)となり、計算資源の予約枠を取得する際はその分の空き容量が必要となります。

QRSUB -l medium -pe mpi 2-10 -a 10100000 -e 10200705

*メモリ量は指定されていないので、デフォルト値が指定されたとみなされます。

実行結果

QRSUBコマンドが正常終了した場合は、以下のメッセージが出力され、ar-id(4桁の予約番号)が発行されます。

Your advance reservation XXXX has been granted

ここでXXXXにはar-id(予約番号)が入ります。

QRSUBコマンドが正常終了しなかった場合は、指定オプションを見直し、再度実行してください。

予約開始時刻、予約終了時刻の指定方法

QRSUBコマンドの以下の引数で予約開始時刻、終了時刻を指定します。

時刻は以下の形式で指定できます。

*CC:西暦の上2桁 YY:西暦の下2桁 MM:月 DD:日 hh:時 mm:分 SS:秒

予約枠取得状況の確認方法

予約枠取得状況の一覧表示

qrstat

実行結果

ar-id      name       owner        state start at             end at               duration
------------------------------------------------------------------------------------------
      0001            test-user   w     10/10/2017 00:00:00  10/20/2017 07:05:00  247:05:00
      0002            test-user   r     01/10/2017 00:00:00  10/20/2017 00:00:00  6792:00:00

予約枠取得状況の詳細表示

qrstat -ar ar-id[,ar-id,ar-id・・・・]

実行結果

--------------------------------------------------------------------------------
id                             0001
name
owner                          test-user
state                          w
start_time                     10/10/2017 00:00:00.000
end_time                       10/20/2017 07:05:00.000
duration                       247:05:00.000
project
message                        XXXXXXXXXX
submission_time                03/22/2017 14:56:47.314
group                          test
account                        sge
resource_list                  month=TRUE, medium=TRUE, mem_req=3.1G, s_vmem=3.1G
free_resources                 false
reserve_available_only         true
granted_slots_list             month_medium.q@nm5i=1,month_medium.q@nm6i=1,month_medium.q@nm7i=1
granted_parallel_environment   mpi slots 2-3
--------------------------------------------------------------------------------
id                             0002
name
owner                          test-user
state                          r
start_time                     01/10/2017 00:00:00.000
end_time                       01/20/2017 00:00:00.000
duration                       6792:05:00.000
project
message                        XXXXXXXXXX
submission_time                01/05/2017 13:23:20.001
group                          test
account                        sge
resource_list                  mem_req=3.1G, s_vmem=3.1G
free_resources                 false
reserve_available_only         true
granted_slots_list             month_hdd.q@nt013i=1
--------------------------------------------------------------------------------
id                             0003
name
owner                          test-user1
state                          w
start_time                     01/01/2018 00:00:00.000
end_time                       01/02/2018 00:00:00.000
duration                       24:00:00.000
project
message                        XXXXXXXXXX
submission_time                04/03/2017 10:50:10.285
group                          test
account                        sge
resource_list                  mem_req=10G, s_vmem=10G
free_resources                 false
reserve_available_only         true
granted_slots_list             month_ssd.q@nt060i=3
granted_parallel_environment   def_slot slots

ジョブの実行方法

qsubコマンドに-arオプションでar-id(予約番号)を指定し、ジョブを実行してください。

それ以外のオプションについてはGrid Engineのページと同様です。

計算資源の予約枠の開始時刻前にar-idを指定してqsubコマンドを実行しジョブ投入を行った場合、 予約枠の開始時刻になり次第ジョブが実行されます。

なお、取得した予約枠の終了時刻を過ぎた時点で実行中のジョブは強制終了されますので、ご注意ください。

計算資源の予約枠の削除

計算資源の予約枠の削除するには、QRDELコマンドにar-id(予約番号)を指定して実行してください。

実行例

QRDEL ar-id

ジョブ実行中に⑤計算資源の予約枠の削除(QRDELコマンド)を実施した場合は、 実行中のジョブも終了しますので、ご注意ください。