TogoImputation (beta) チュートリアル2、制限公開レファレンスパネルを使う場合
前提
このチュートリアルは制限公開レファレンスパネルを使うため、JGAへのデータ利用申請が必要です。 利用申請していない場合は、丸ごとスキップして次のチュートリアルに進んでください。
システム利用方法
この作業は、遺伝研個人ゲノム解析区画Guacamole環境から行いますので、VPN接続を行いGuacamoleに接続してください
本システムでは、以下の流れでワークフローを実行します。
- 制限公開データの準備
- Imputation Workflow用の設定ファイルの生成
- Imputation Workflowの実行
制限公開データの準備
チュートリアルをすすめるにあたって、制限公開データは、すでに遺伝研スパコン個人ゲノム解析区画にすでにあるものとします。
制限公開データのファイル名に関する注意点
ファイル名に +
が含まれているとその後の処理で問題が発生することがあるため、_
等に置換してください。
制限公開データの展開と準備
この作業は、遺伝研個人ゲノム解析区画Guacamole環境から行いますので、VPN接続を行いGuacamoleに接続しターミナルを開いてください
以下の方法で、ファイルを展開し、コンフィグファイルの作成、コンフィグファイルが正しく作成されたことの確認します。
ファイルの展開。
tar zxvf <制限公開データのファイル名.tar.gz>
コンフィグファイルの作成。
cd <制限公開データが展開されたディレクトリ>
./generate-default-conofig-file.sh $(pwd)
コンフィグファイルが正しく作成されたことの確認。
ls -l default.config.yaml
このファイルは次のUIで、 Reference panel config file
として、UIに入力します。
ここで作業を終える場合は、手元のPC上で開いている、遺伝研個人ゲノム解析環境のGuacamoleを表示しているタブを閉じてください
2. Imputation Workflow用の設定ファイルの生成
この作業は、遺伝研個人ゲノム解析区画Guacamole環境から行いますので、VPN接続を行いGuacamoleに接続し、Guacamole環境で、Firefoxを開いてください
遺伝研スパコンのguacamole 経由で以下のアドレスにアクセスします。
http://localhost:5000
実際にアクセスすると、次のような画面になります。
以下の項目について設定を行います。
- Target VCF file
- Reference panel preset config or other
- Output genotype probability
- Number of threads
Target VCF file には、解析対象の VCFファイル (*.vcf.gz ファイル) のフルパスを指定します。
ここでは先程アップロードした、ファイルを使います。
具体的なフルパスは /home/youraccountname/制限公開データ/データvcf.gz
のようになります。
次にReference panel preset config orを選択します。 デフォルトで以下の4つについて、選択が可能です。
- GRCh37.1KGP
- GRCh37.1KGP-EAS
- GRCh38.1KGP
- GRCh38.1KGP-EAS
それぞれについては利用可能なリファレンスパネルの種類を参照ください。
上記以外のものをReference Panelとして使いたいときは other を選択し、Reference panel config fileに使いたいものを指定します。
今回は、otherを選択し、Reference panel config file を指定します。
Output genotyhpe probabilityを選択します。 選択可能は以下の2種類で、デフォルトでは false が選択されています。
- false
- true
Number of threadsは、ワークフローを実行する際のジョブのスレッド数を指定します。
デフォルトでは、16 が指定されています。
パラメータの指定が終わったら、Set up job ボタンを押します。 画面下部に、生成された パラメータが表示されます。これをsapporo-web で使います。
ここで作業を終える場合は、手元のPC上で開いている、遺伝研個人ゲノム解析環境のGuacamoleを表示しているタブを閉じてください
3. Imputation Workflowの実行
この作業は、遺伝研個人ゲノム解析区画Guacamole環境から行いますので、VPN接続を行いGuacamoleに接続し、Guacamole環境で、Firefoxを開いてください
Firefox経由で、以下のアドレスにアクセスします。
http://localhost:1121
以下のような画面が表示されます
次に、デフォルトで使用可能になっている Sapporo Service on localhost を選択します。
クリックすると以下のような画面がでてきます
次にバックエンドワークフローを使用するために少し下にスクロールし、 Workflows という項目から beagle をクリックします。
Compose Run の項目から、Workflow Engine の項目で cwltool 3.1
を選択します。
Workflow Parameters に先程、 imputationserver-web-ui で生成したパラメータを入力します。
このとき、デフォルトで書かれている {}
を消して、生成したパラメータを入力します。
一番下にあるExecute ボタンを押して、ワークフローを実行します。 ジョブの状態がRunning になります。