Grid Engine の概要
Grid Engine はジョブスケジューラあるいはリソーススケジューラと呼ばれるプログラムの一種で、 多数のユーザーが利用している環境で、各ユーザに自動的に計算リソース(CPU コアやメモリ)を割り当てるものです。 クラスタ計算機全体を一つの計算機と見たときの Operating System に相当する働きをします。
- 一般解析区画では、Grid Engine を用いています。
- 個人ゲノム解析区画では、Grid Engine または Slurm が利用可能です。
バイオインフォマティックス系では伝統的に Sun Grid Engine(SGE)が広く用いられてきました。SGE は Univa 社の Grid Engineを経て、現在は Altair 社がサポートしており Altair Grid Engine(AGE)となっています。(こういった経緯で、現在の AGE 公式マニュアルの中でも SGE, UGE, AGE, さらには総称としての Grid Engine という書き方が混在しています。)
参考資料
- Sun Grid Engine for Dummies [PDF] [Internet Archive]
- Altair Grid Engine 公式サイト
Grid Engine 各種コマンド(qsub, qlogin, qstat, qalter, qdel, qacct)の man ページもご参照ください。
ジョブの種類
Grid Engine では以下の4種類のジョブが主に使われます。
- インタラクティブジョブ (interactive job)
- スパコンを対話的に利用する場合に用いる。
- バッチジョブ (batch job)
- CPU コアを 1 コアだけ使用するプログラムを少数実行する場合に用いる。
- パラレルジョブ (parallel job)
- CPU コアを複数同時に使用するプログラムを少数実行する場合に用いる。
- アレイジョブ (array job)
- バッチジョブまたはパラレルジョブを多数順次実行する場合に用いる。
(その他のジョブについての説明など詳細については公式のマニュアルをご参照下さい。)
その他のコマンド
主に使うコマンドは以下のとおりです。
- qstat
- ジョブの現在の状況を確認する。
- qdel
- ジョブを削除する。
- qalter
- ジョブの設定を変更する。
詳細はその他のコマンドの項および公式マニュアルをご参照下さい。
ジョブの実行が開始されない場合
- ジョブの設定が間違っていないか確認する。
- 設定が適切化チェックするプログラムを提供しています。qsub_beta の使い方をご参照下さい。
- スパコンの混雑状況を確認する。
- 稼働状況概要の項で現在の稼働状況と混み具合が確認できます。