パイプライン設定ファイルについて

process.executor = 'uge'
process.penv = 'def_slot'
process.errorStrategy = 'retry'
process.maxRetries = 2

params {
    ref_fa = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512.fasta'
    amino_acid_letter_code_file = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/main/python/aa_list.tsv'

    //tool
    trimmomatic = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar'
    bamsort = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bamsort'
    bammarkdup = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bammarkduplicates'
    library_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
    fisher = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/bin/fisher'
    python_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib/python'
    python_home  = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python/2.7.10'
    python_lib = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib:/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/'
    //trimmomatic
    trimmomatic_enable = true

    trimmomatic_option = 'ILLUMINACLIP:/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/adapters/TruSeq3-PE.fa:2:30:10 \
                          LEADING:3 \
                          TRAILING:3 \
                          SLIDINGWINDOW:4:15 \
                          MINLEN:36 '

    //align
    bwa_option = ' -T 0 '

    bamsort_option = 'index=1 \
                      level=1 \
                      inputthreads=2 \
                      outputthreads=2 \
                      calmdnm=1 \
                      calmdnmrecompindentonly=1 '

    bammarkdup_option = 'markthreads=2 \
                         rewritebam=1 \
                         rewritebamlevel=1 \
                         index=1 \
                         md5=1  '

    //mutation call
    mutation_call_enable = true
    fisher_option = ' --min_depth 100 \
                      --base_quality 20 \
                      --min_variant_read 50 \
                      --min_allele_freq 0.0001 \
                      --post_10_q 0'

    fisher_samtools_params = '-q 20 \
                              -BQ0 \
                              -d 10000000 \
                              --ff UNMAP,SECONDARY,QCFAIL'

    //bcftools
    bcftools_enable = true
    bcftools_mpileup_option = '--max-depth 10000'
    bcftools_call_option = '-mv --ploidy 1'
    bcftools_consensus_option = ''
    pangolin_dir = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/miniconda3'

    //VF_consensus
    VF_consensus_enable = true
    VF_consensus_option = '--vf_min 0.8 --dp_min 20'
    bowtie2_option = '-x /share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512'

    //summary_excel
    summary_excel_enable = false
    samtools_pileup_option = '-a \
                              -q 20 \
                              -BQ0 \
                              -d 10000000 \
                              --ff UNMAP,SECONDARY,QCFAIL'
    summary_excel_option = '--vf_min 0.8 --dp_min 20'

}

process  {

    withName: trimmomatic {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=6G  '
    }

    withName: align {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=6G  '
    }

    withName: mutation_call {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=8G  '
    }

    withName: bcftools {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=6G  '
    }

    withName: VF_consensus {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=11G  '
    }

    withName: samtools_mpileup {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=5G  '
    }

    withName: summary_excel {
    cpus = 1
    maxForks = 100
    clusterOptions = '-S /bin/bash -cwd   -l s_vmem=5G  '
    }

}

Note

リファレンスゲノム

このパイプラインで使っているリファレンスゲノム
( /share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512.fasta ) は NC_045512 の NC_045512.2 バージョン を使っています。

ジョブで実行するツールの設定

configの設定
項目 説明
ref_fa リファレンスファイルのパス
amino_acid_letter_code_file アミノ酸の1文字表記と3文字表記が書かれたファイルのパス
trimmomatic trimmomatic のパス
bamsort bamsort のパス
bammarkdup bammarkdup のパス
library_path lib のパス
fisher GenomonFisher のパス
python_path lib のパス
python_home PYTHONHOME のパス
python_lib lib のパス
trimmomatic_enable true の場合, trimmomatic を実行します。
trimmomatic_option trimmomatic のオプションを設定します。
bwa_option bwa のオプションを設定します。
bamsort_option bamsort のオプションを設定します。
bammarkdup_option bammarkdup のオプションを設定します。
mutation_call_enable true の場合, mutation call を実行します。
fisher_option GenomonFisher のオプションを設定します。
fisher_samtools_params GenomonFisher の -S オプションを使う場合に設定します。
bcftools_enable true の場合, bcftools を実行します。
bcftools_mpileup_option bcftools mpileup のオプションを設定します。
bcftools_call_option bcftools call のオプションを設定します。
bcftools_consensus_option bcftools consensus のオプションを設定します。
pangolin_dir pangolin をインストールした conda のディレクトリパス
VF_consensus_enable true の場合, VF_consensus を実行します。
VF_consensus_option VF_consensus のオプションを設定します。
bowtie2_option bowtie2 のオプションを設定します。
summary_excel_enable true の場合, summary_excel を実行します。
samtools_pileup_option
samtools mpileup のオプションを設定します。
-a オプションが必要です。
summary_excel_option summary_excel のオプションを設定します。
設定を変更するときは「=」の右側の文字を書き換えてください。

例えば
trimmomatic_enable = true
の場合は true
trimmomatic_enable = false
の場合は false を設定したことになります。

数値などのクオテーションで囲まれた中身を変更するときはクオテーション(‘)は残しておいてください。

例えば
bwa_option = ' -T 0 '
の場合は -T 0
bwa_option = '-T 1 '
の場合は -T 1 を設定したことになります。


ジョブの設定

例えば trimmomatic のジョブについて CPU コアを1個, メモリを5GB に設定する場合は下のようになります。
withName:  trimmomatic  {
cpus = 1
maxForks = 100
clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G'
}
s_vmem は1コアあたりのメモリ量で cpus は CPU コア数になります。