システムの基本的な利用方法

システムへのログイン、基本的なジョブの投入方法。 キューの実行時間変更(2017.06)。公開鍵による認証。 qloginができない。 ゲートウェイノード。

 

システム利用方法のご案内

システム紹介:基本的使用方法:Univa Grid Engine概説:ジョブを投入するノウハウ:
ユーザ登録:ログイン手順(Windows編):ログイン手順(Mac編): 

 

UGEキューの設定 (実行時間が2017.06に変更されました)

 

公開鍵認証を利用してスーパーコンピュータシステムにログインする方法を教えて下さい。

手順はこちら に図解しています。
ユーザ端末で公開鍵と秘密鍵のペアを作成し、スーパーコンピュータシステムへのログイン認証に用いることで パスワード間違いによるアカウントロックを回避することが可能です。

 

公開鍵による認証が実施できません。

ホームディレクトリのgroup,otherにwrite権限が付与されている場合、公開鍵による認証は失敗します。 また、~/.sshおよび~/.ssh/authorized_keysに、owner以外の権限が付与されている場合も公開鍵認証に失敗します。 以下の3つのディレクトリ・ファイルのパーミッションをご確認願います。 パーミッションはchmodコマンドで変更できます。
(例)
chmod 750 ~/
chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys

  

ゲートウェイノードからqloginができない

一方の環境(phase1またはphase2のどちらか) において、同時に起動しているジョブの数が同時実行可能な最大値(300個)に達している場合、qloginはできません。

qloginも、1つのジョブとして扱いますので、同時実行可能最大値のジョブが稼働している状態でqloginを試みても、すでに最大値に達しているため、ジョブが実行できない(qloginができない)という状態になります。
例えば、slotsを4使用するジョブが75本起動している場合には、同時に300個のジョブが起動している事になりqloginはできなくなります。

qstat により現在実行中のジョブ数を確認できます。qstat コマンドは ゲートウェイノードで使用可能です。

$ qstat
job-ID prior name     user  state submit/start at queue slots ja-task-ID
------------------------------------------------------------------------------
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 1
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 3
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t178i 1 5

起動中のジョブが、実行可能最大値に達していない時でもqloginできない場合には、お名前、所属、アカウント名、お問い合わせ内容、を記載して sc-help1.pngまでお問い合わせください。

 

ゲートウェイノード上でソフトウェアリストにあるソフトウェアが使用できません。

ゲートウェイノードはスーパーコンピュータシステム環境への入り口であり解析処理等の実行を想定していないためソフトウェアは使用できません。 各種アプリケーション・ツール類は、ゲートウェイノード上でqloginコマンドを実行後に使用できるノード上でご利用いただけます。

 

ゲートウェイノードで起動したemacsのプロセスがログアウト後も残ってCPUを 100%消費し続けることがあります。

ゲートウェイノードからログアウトされる場合は、emacsを正しく終了された上でログアウトしていただくことで、この事象を回避できるのではないかと考えられます。 emacsに限らず、スーパーコンピュータシステムの使用を終了される場合は実行プログラムを終了された上でログアウトしていただけますようお願いします。