パイプライン設定ファイルについて¶
process.executor = 'uge'
process.penv = 'def_slot'
process.errorStrategy = 'retry'
process.maxRetries = 2
params {
ref_fa = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512.fasta'
amino_acid_letter_code_file = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/main/python/aa_list.tsv'
//tool
trimmomatic = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar'
bamsort = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bamsort'
bammarkdup = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bammarkduplicates'
library_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
fisher = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/bin/fisher'
python_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib/python'
python_home = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python/2.7.10'
python_lib = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib:/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
//trimmomatic
trimmomatic_enable = true
trimmomatic_option = 'ILLUMINACLIP:/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/adapters/TruSeq3-PE.fa:2:30:10 \
LEADING:3 \
TRAILING:3 \
SLIDINGWINDOW:4:15 \
MINLEN:36 '
//align
bwa_option = ' -T 0 '
bamsort_option = 'index=1 \
level=1 \
inputthreads=2 \
outputthreads=2 \
calmdnm=1 \
calmdnmrecompindentonly=1 '
bammarkdup_option = 'markthreads=2 \
rewritebam=1 \
rewritebamlevel=1 \
index=1 \
md5=1 '
//mutation call
mutation_call_enable = true
fisher_option = ' --min_depth 100 \
--base_quality 20 \
--min_variant_read 50 \
--min_allele_freq 0.0001 \
--post_10_q 0'
fisher_samtools_params = '-q 20 \
-BQ0 \
-d 10000000 \
--ff UNMAP,SECONDARY,QCFAIL'
//bcftools
bcftools_enable = true
bcftools_mpileup_option = '--max-depth 10000'
bcftools_call_option = '-mv --ploidy 1'
bcftools_consensus_option = ''
pangolin_dir = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/miniconda3'
//VF_consensus
VF_consensus_enable = true
VF_consensus_option = '--vf_min 0.8 --dp_min 20'
bowtie2_option = '-x /share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512'
//summary_excel
summary_excel_enable = false
samtools_pileup_option = '-a \
-q 20 \
-BQ0 \
-d 10000000 \
--ff UNMAP,SECONDARY,QCFAIL'
summary_excel_option = '--vf_min 0.8 --dp_min 20'
}
process {
withName: trimmomatic {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
withName: align {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
withName: mutation_call {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=8G '
}
withName: bcftools {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G '
}
withName: VF_consensus {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=11G '
}
withName: samtools_mpileup {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G '
}
withName: summary_excel {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G '
}
}
Note
リファレンスゲノム
このパイプラインで使っているリファレンスゲノム
( /share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512.fasta ) は NC_045512 の NC_045512.2 バージョン を使っています。
ジョブで実行するツールの設定¶
項目 | 説明 |
---|---|
ref_fa | リファレンスファイルのパス |
amino_acid_letter_code_file | アミノ酸の1文字表記と3文字表記が書かれたファイルのパス |
trimmomatic | trimmomatic のパス |
bamsort | bamsort のパス |
bammarkdup | bammarkdup のパス |
library_path | lib のパス |
fisher | GenomonFisher のパス |
python_path | lib のパス |
python_home | PYTHONHOME のパス |
python_lib | lib のパス |
trimmomatic_enable | true の場合, trimmomatic を実行します。 |
trimmomatic_option | trimmomatic のオプションを設定します。 |
bwa_option | bwa のオプションを設定します。 |
bamsort_option | bamsort のオプションを設定します。 |
bammarkdup_option | bammarkdup のオプションを設定します。 |
mutation_call_enable | true の場合, mutation call を実行します。 |
fisher_option | GenomonFisher のオプションを設定します。 |
fisher_samtools_params | GenomonFisher の -S オプションを使う場合に設定します。 |
bcftools_enable | true の場合, bcftools を実行します。 |
bcftools_mpileup_option | bcftools mpileup のオプションを設定します。 |
bcftools_call_option | bcftools call のオプションを設定します。 |
bcftools_consensus_option | bcftools consensus のオプションを設定します。 |
pangolin_dir | pangolin をインストールした conda のディレクトリパス |
VF_consensus_enable | true の場合, VF_consensus を実行します。 |
VF_consensus_option | VF_consensus のオプションを設定します。 |
bowtie2_option | bowtie2 のオプションを設定します。 |
summary_excel_enable | true の場合, summary_excel を実行します。 |
samtools_pileup_option | samtools mpileup のオプションを設定します。
-a オプションが必要です。
|
summary_excel_option | summary_excel のオプションを設定します。 |
設定を変更するときは「=」の右側の文字を書き換えてください。
例えば
trimmomatic_enable = true
の場合は true
trimmomatic_enable = false
の場合は false を設定したことになります。
数値などのクオテーションで囲まれた中身を変更するときはクオテーション(‘)は残しておいてください。
例えば
bwa_option = ' -T 0 '
の場合は -T 0
bwa_option = '-T 1 '
の場合は -T 1 を設定したことになります。
ジョブの設定¶
例えば trimmomatic のジョブについて CPU コアを1個, メモリを5GB に設定する場合は下のようになります。
withName: trimmomatic {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G'
}
s_vmem は1コアあたりのメモリ量で cpus は CPU コア数になります。