システムの基本的な利用方法

システムへのログイン、基本的なジョブの投入方法。 キューの実行時間変更(2017.06)。公開鍵による認証。 qloginができない。 ゲートウェイノード。

 

システム利用方法のご案内

システム紹介:基本的使用方法:Univa Grid Engine概説:ジョブを投入するノウハウ:
ユーザ登録:ログイン手順(Windows編):ログイン手順(Mac編): 

 

UGEキューの設定 (実行時間が2017.06に変更されました)

 

公開鍵による認証が実施できません。

ホームディレクトリのgroup,otherにwrite権限が付与されている場合、公開鍵による認証は失敗します。 また、~/.sshおよび~/.ssh/authorized_keysに、owner以外の権限が付与されている場合も公開鍵認証に失敗します。 以下の3つのディレクトリ・ファイルのパーミッションをご確認願います。 パーミッションはchmodコマンドで変更できます。
(例)
chmod 750 ~/
chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys

 

公開鍵認証を利用してスーパーコンピュータシステムにログインする方法を教えて下さい。

手順はこちら に図解しています。

ユーザ端末で公開鍵と秘密鍵のペアを作成し、スーパーコンピュータシステムへのログイン認証に用いることで パスワード間違いによるアカウントロックを回避することが可能です。
秘密鍵のアルゴリズムと鍵の長さは以下の設定を推奨致します。また、パスフレーズを設定することを推奨致します。

鍵タイプ:RSA
鍵の長さ:2048bit以上
生成された秘密鍵は第三者に利用されることが無いよう、取り扱いは十分にご注意願います。
ユーザ端末がMac,Linuxの場合
①ユーザ端末にて鍵ペアを作成
・公開鍵(id_rsa.pub)と秘密鍵(id_rsa)を~/.ssh/に作成します。
ユーザ端末におけるホームディレクトリを/home/usernameとした場合、以下の様となります。
$ ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/home/username/.ssh/id_rsa): ←Enterを押下
Created directory '/home/username/.ssh'.
Enter passphrase (empty for no passphrase):   ←任意のパスフレーズを入力
Enter same passphrase again:          ←パスフレーズを再入力
Your identification has been saved in /home/username/.ssh/id_rsa.
Your public key has been saved in /home/username/.ssh/id_rsa.pub.
The key fingerprint is:

②公開鍵をスーパーコンピュータシステムへ設置
・スーパーコンピュータシステムへ公開鍵を転送します。
$ scp /home/username/.ssh/id_rsa.pub
username@gw.ddbj.nig.ac.jp:~/.ssh/id_rsa.pub_userterminal
(スーパーコンピュータシステム上の既存id_rsa.pubを上書きしないように任意の名前で転送して下さい。)
username@gw.ddbj.nig.ac.jp's password:
id_rsa.pub 100% 395 0.4KB/s 00:00
・転送した公開鍵(id_rsa.pub_userterminal)の内容を~/.ssh/authorized_keysに追記(または新規作成)します。
(スーパーコンピュータシステムへログイン後)
$ cd
$ cd .ssh
$ cat id_rsa.pub_userterminal >> authorized_keys
$ chmod 600 authorized_keys
③注意
・ ~/.sshのパーミッションは"700"にしてください。
・ ~/.ssh/authorized_keysのパーミッションは"600"にしてください。

ユーザ端末がWindowsの場合
Windowsではいくつか公開鍵認証可能なツールがありますが、 ここではTeraTermの例を紹介します。
①ユーザ端末にて鍵ペアを作成
・TeraTermを起動し、(設定)→(SSH鍵生成)を選択します。
・鍵の種類をRSA、ビット数を2048を選択し、生成ボタンを押下します。
・任意のパスフレーズを入力します。
・公開鍵と秘密鍵を任意のディレクトリに保存します。
②公開鍵をスーパーコンピュータシステムへ設置
・WinSCP等のツールを利用してスーパーコンピュータシステムへ公開鍵を転送します。 スーパーコンピュータシステム上の既存id_rsa.pubを上書きしないように任意の名前で転送して下さい。
・転送した公開鍵(ここではid_rsa.pub_userterminalとします)の内容を~/.ssh/authorized_keysに追記(または新規作成)します。
(スーパーコンピュータシステムへログイン後)
$ cd
$ cd .ssh
$ cat id_rsa.pub_userterminal >> authorized_keys
$ chmod 600 authorized_keys
③注意
・~/.sshのパーミッションは"700"にしてください。
・~/.ssh/authorized_keysのパーミッションは"600"にしてください。
上記設定後、設定ユーザ端末からスーパーコンピュータシステムへ接続した場合、次の様に表示されます。
$ ssh username@gw.ddbj.nig.ac.jp
Enter passphrase for key '/home/username/.ssh/id_rsa': ←決定したパスフレーズを入力
Last login: XXX XXX X XX:XX:XX XXXX from XX.XX.XX.XX
---------------------------------------------------------------------
Thank you for using supercomputer system.
This node is in use for login service only. Please use 'qlogin'.
---------------------------------------------------------------------
[username@gw ~]$

 

ゲートウェイノード上でソフトウェアリストにあるソフトウェアが使用できません。

ゲートウェイノードはスーパーコンピュータシステム環境への入り口であり解析処理等の実行を想定していないためソフトウェアは使用できません。 各種アプリケーション・ツール類は、ゲートウェイノード上でqloginコマンドを実行後に使用できるノード上でご利用いただけます。

 

ゲートウェイノードで起動したemacsのプロセスがログアウト後も残ってCPUを 100%消費し続けることがあります。

ゲートウェイノードからログアウトされる場合は、emacsを正しく終了された上でログアウトしていただくことで、この事象を回避できるのではないかと考えられます。 emacsに限らず、スーパーコンピュータシステムの使用を終了される場合は実行プログラムを終了された上でログアウトしていただけますようお願いします。

 

ゲートウェイノードからqloginができない

一方の環境(phase1またはphase2のどちらか) において、同時に起動しているジョブの数が同時実行可能な最大値(300個)に達している場合、qloginはできません。

qloginも、1つのジョブとして扱いますので、同時実行可能最大値のジョブが稼働している状態でqloginを試みても、すでに最大値に達しているため、ジョブが実行できない(qloginができない)という状態になります。
例えば、slotsを4使用するジョブが75本起動している場合には、同時に300個のジョブが起動している事になりqloginはできなくなります。

qstat により現在実行中のジョブ数を確認できます。

$ qstat
job-ID prior name     user  state submit/start at queue slots ja-task-ID
------------------------------------------------------------------------------
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 1
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 3
1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t178i 1 5

起動中のジョブが、実行可能最大値に達していない時でもqloginできない場合には、お問い合わせください。