パイプライン設定ファイルについて¶
process.executor = 'uge'
process.penv = 'def_slot'
process.errorStrategy = 'retry'
process.maxRetries = 2
params {
ref_fa = '/share/pub/hgc_ppl/CovidPipeLine/1.0.0/database/NC_045512/NC_045512.fasta'
amino_acid_letter_code_file = '/share/pub/hgc_ppl/CovidPipeLine/1.0.0/main/python/aa_list.tsv'
//tool
trimmomatic = '/share/pub/hgc_ppl/CovidPipeLine/1.0.0/tool/Trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar'
bamsort = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bamsort'
bammarkdup = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bammarkduplicates'
library_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
fisher = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/bin/fisher'
python_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib/python'
python_home = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python/2.7.10'
python_lib = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib:/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
//trimmomatic
trimmomatic_enable = true
trimmomatic_option = 'ILLUMINACLIP:/share/pub/hgc_ppl/CovidPipeLine/1.0.0/tool/Trimmomatic/Trimmomatic-0.39/adapters/TruSeq3-PE.fa:2:30:10 \
LEADING:3 \
TRAILING:3 \
SLIDINGWINDOW:4:15 \
MINLEN:36 '
//align
bwa_option = ' -T 0 '
bamsort_option = 'index=1 \
level=1 \
inputthreads=2 \
outputthreads=2 \
calmdnm=1 \
calmdnmrecompindentonly=1 '
bammarkdup_option = 'markthreads=2 \
rewritebam=1 \
rewritebamlevel=1 \
index=1 \
md5=1 '
//mutation call
mutation_call_enable = true
fisher_option = ' --min_depth 100 \
--base_quality 20 \
--min_variant_read 50 \
--min_allele_freq 0.0001 \
--post_10_q 0'
fisher_samtools_params = '-q 20 \
-BQ0 \
-d 10000000 \
--ff UNMAP,SECONDARY,QCFAIL'
//bcftools
bcftools_enable = true
pangolin_dir = '/share/pub/hgc_ppl/CovidPipeLine/1.0.0/tool/miniconda3'
}
process {
withName: trimmomatic {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
withName: align {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
withName: mutation_call {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=8G '
}
withName: bcftools {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
}
Note
リファレンスゲノム
このパイプラインで使っているリファレンスゲノム
( /share/pub/hgc_ppl/CovidPipeLine/1.0.0/database/NC_045512/NC_045512.fasta ) は NC_045512 の NC_045512.2 バージョン を使っています。
ジョブで実行するツールの設定¶
項目 |
説明 |
---|---|
ref_fa |
リファレンスファイルのパス |
amino_acid_letter_code_file |
アミノ酸の1文字表記と3文字表記が書かれたファイルのパス |
trimmomatic |
trimmomaticのパス |
bamsort |
bamsortのパス |
bammarkdup |
bammarkdupのパス |
library_path |
libのパス |
fisher |
GenomonFisherのパス |
python_path |
libのパス |
python_home |
PYTHONHOMEのパス |
python_lib |
libのパス |
trimmomatic_enable |
trueの場合, trimmomaticを実行します。 |
trimmomatic_option |
trimmomaticのオプションを設定します。 |
bwa_option |
bwaのオプションを設定します。 |
bamsort_option |
bamsortのオプションを設定します。 |
bammarkdup_option |
bammarkdupのオプションを設定します。 |
mutation_call_enable |
trueの場合, mutation callを実行します。 |
fisher_option |
Genomon Fisherのオプションを設定します。 |
fisher_samtools_params |
Genomon Fisherの-Sオプションを使う場合に設定します。 |
bcftools_enable |
trueの場合, bcftoolsを実行します。 |
pangolin_dir |
pangolinをインストールしたcondaのディレクトリパス |
設定を変更するときは「=」の右側の文字を書き換えてください。
例えば
trimmomatic_enable = true
の場合はtrue
trimmomatic_enable = false
の場合はfalseを設定したことになります。
数値などのクオテーションで囲まれた中身を変更するときはクオテーション(‘)は残しておいてください。
例えば
bwa_option = ' -T 0 '
の場合は-T 0
bwa_option = '-T 1 '
の場合は-T 1を設定したことになります。
ジョブの設定¶
例えばtrimmomaticのジョブについてCPUコアを1個, メモリを5GBに設定する場合は下のようになります。
withName: trimmomatic {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G'
}
s_vmemは1コアあたりのメモリ量でcpusはCPUコア数になります。