システムの基本的な利用方法
システム利用方法のご案内
システム紹介:基本的使用方法:Univa Grid Engine概説:ジョブを投入するノウハウ:
ユーザ登録:ログイン手順(Windows編):ログイン手順(Mac編):
公開鍵認証を利用してスーパーコンピュータシステムにログインする方法を教えて下さい。
公開鍵による認証が実施できません。
ホームディレクトリのgroup,otherにwrite権限が付与されている場合、公開鍵による認証は失敗します。 また、~/.sshおよび~/.ssh/id_rsaに、owner以外の権限が付与されている場合も公開鍵認証に失敗します。 以下の3つのディレクトリ・ファイルのパーミッションをご確認願います。 パーミッションはchmodコマンドで変更できます。
(例)
chmod 750 ~/
chmod 700 ~/.ssh
chmod 600 ~/.ssh/id_rsa
ゲートウェイノードからqloginができない
一方の環境(phase1またはphase2のどちらか) において、同時に起動しているジョブの数が同時実行可能な最大値(300個)に達している場合、qloginはできません。
qloginも、1つのジョブとして扱いますので、同時実行可能最大値のジョブが稼働している状態でqloginを試みても、すでに最大値に達しているため、ジョブが実行できない(qloginができない)という状態になります。
例えば、slotsを4使用するジョブが75本起動している場合には、同時に300個のジョブが起動している事になりqloginはできなくなります。
qstat により現在実行中のジョブ数を確認できます。qstat コマンドは ゲートウェイノードで使用可能です。
$ qstat job-ID prior name user state submit/start at queue slots ja-task-ID ------------------------------------------------------------------------------ 1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 1 1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t168i 1 3 1031 0.50000 arraytest. ddbjuser r 03/19/2012 00:43:13 month_hdd.q@t178i 1 5
起動中のジョブが、実行可能最大値に達していない時でもqloginできない場合には、お名前、所属、アカウント名、お問い合わせ内容、を記載して までお問い合わせください。
ゲートウェイノード上でソフトウェアリストにあるソフトウェアが使用できません。
ゲートウェイノードはスーパーコンピュータシステム環境への入り口であり解析処理等の実行を想定していないためソフトウェアは使用できません。 各種アプリケーション・ツール類は、ゲートウェイノード上でqloginコマンドを実行後に使用できるノード上でご利用いただけます。
ゲートウェイノードで起動したemacsのプロセスがログアウト後も残ってCPUを 100%消費し続けることがあります。
ゲートウェイノードからログアウトされる場合は、emacsを正しく終了された上でログアウトしていただくことで、この事象を回避できるのではないかと考えられます。 emacsに限らず、スーパーコンピュータシステムの使用を終了される場合は実行プログラムを終了された上でログアウトしていただけますようお願いします。
スパコンへのSSH接続が切れてしまう
macをご利用の場合
mac側で以下設定を追加してください。
$ vi ~/.ssh/config
ServerAliveInterval 300
TCPKeepAlive yes
tera term をご利用の場合
[設定]ー[SSH]にてハートビート(keepalaive)を設定してください。