パイプライン設定ファイルについて ======================================= .. code-block:: bash process.executor = 'uge' process.penv = 'def_slot' process.errorStrategy = 'retry' process.maxRetries = 2 params { ref_fa = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512.fasta' amino_acid_letter_code_file = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/main/python/aa_list.tsv' //tool trimmomatic = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar' bamsort = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bamsort' bammarkdup = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/install/biobambam-0.0.191/src/bammarkduplicates' library_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/' fisher = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/bin/fisher' python_path = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib/python' python_home = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python/2.7.10' python_lib = '/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/python2.7-packages/lib:/share/pub/genomon/.genomon_local/genomon_pipeline-2.6.3/local/lib/' //trimmomatic trimmomatic_enable = true trimmomatic_option = 'ILLUMINACLIP:/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/Trimmomatic/Trimmomatic-0.39/adapters/TruSeq3-PE.fa:2:30:10 \ LEADING:3 \ TRAILING:3 \ SLIDINGWINDOW:4:15 \ MINLEN:36 ' //align bwa_option = ' -T 0 ' bamsort_option = 'index=1 \ level=1 \ inputthreads=2 \ outputthreads=2 \ calmdnm=1 \ calmdnmrecompindentonly=1 ' bammarkdup_option = 'markthreads=2 \ rewritebam=1 \ rewritebamlevel=1 \ index=1 \ md5=1 ' //mutation call mutation_call_enable = true fisher_option = ' --min_depth 100 \ --base_quality 20 \ --min_variant_read 50 \ --min_allele_freq 0.0001 \ --post_10_q 0' fisher_samtools_params = '-q 20 \ -BQ0 \ -d 10000000 \ --ff UNMAP,SECONDARY,QCFAIL' //bcftools bcftools_enable = true bcftools_mpileup_option = '--max-depth 10000' bcftools_call_option = '-mv --ploidy 1' bcftools_consensus_option = '' pangolin_dir = '/share/pub/hgc_ppl/CovidPipeLine/2.1.0/tool/miniconda3' //VF_consensus VF_consensus_enable = true VF_consensus_option = '--vf_min 0.8 --dp_min 20' bowtie2_option = '-x /share/pub/hgc_ppl/CovidPipeLine/2.1.0/database/NC_045512/NC_045512' //summary_excel summary_excel_enable = false samtools_pileup_option = '-a \ -q 20 \ -BQ0 \ -d 10000000 \ --ff UNMAP,SECONDARY,QCFAIL' summary_excel_option = '--vf_min 0.8 --dp_min 20' } process { withName: trimmomatic { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G ' } withName: align { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G ' } withName: mutation_call { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=8G ' } withName: bcftools { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=6G ' } withName: VF_consensus { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=11G ' } withName: samtools_mpileup { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G ' } withName: summary_excel { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G ' } } .. note:: **リファレンスゲノム** | このパイプラインで使っているリファレンスゲノム | ( /share/pub/hgc_ppl/CovidPipeLine/|version|/database/NC_045512/NC_045512.fasta ) は `NC_045512 の NC_045512.2 バージョン `_ を使っています。 ジョブで実行するツールの設定 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ .. csv-table:: configの設定 :header: 項目, 説明 ref_fa, リファレンスファイルのパス amino_acid_letter_code_file, アミノ酸の1文字表記と3文字表記が書かれたファイルのパス trimmomatic, trimmomatic のパス bamsort, bamsort のパス bammarkdup, bammarkdup のパス library_path, lib のパス fisher, GenomonFisher のパス python_path, lib のパス python_home, PYTHONHOME のパス python_lib, lib のパス trimmomatic_enable, "true の場合, trimmomatic を実行します。" trimmomatic_option, trimmomatic のオプションを設定します。 bwa_option, bwa のオプションを設定します。 bamsort_option, bamsort のオプションを設定します。 bammarkdup_option, bammarkdup のオプションを設定します。 mutation_call_enable, "true の場合, mutation call を実行します。" fisher_option, GenomonFisher のオプションを設定します。 fisher_samtools_params, GenomonFisher の -S オプションを使う場合に設定します。 bcftools_enable, "true の場合, bcftools を実行します。" bcftools_mpileup_option, bcftools mpileup のオプションを設定します。 bcftools_call_option, bcftools call のオプションを設定します。 bcftools_consensus_option, bcftools consensus のオプションを設定します。 pangolin_dir, pangolin をインストールした conda のディレクトリパス VF_consensus_enable, "true の場合, VF_consensus を実行します。" VF_consensus_option, VF_consensus のオプションを設定します。 bowtie2_option, bowtie2 のオプションを設定します。 summary_excel_enable, "true の場合, summary_excel を実行します。" samtools_pileup_option, "| samtools mpileup のオプションを設定します。 | -a オプションが必要です。" summary_excel_option, summary_excel のオプションを設定します。 | 設定を変更するときは「=」の右側の文字を書き換えてください。 | | 例えば .. code-block:: bash trimmomatic_enable = true | の場合は true .. code-block:: bash trimmomatic_enable = false | の場合は false を設定したことになります。 | | 数値などのクオテーションで囲まれた中身を変更するときはクオテーション(')は残しておいてください。 | | 例えば .. code-block:: bash bwa_option = ' -T 0 ' | の場合は -T 0 .. code-block:: bash bwa_option = '-T 1 ' | の場合は -T 1 を設定したことになります。 | | ジョブの設定 ^^^^^^^^^^^^^^^^^^^^^^^^^^^ | 例えば trimmomatic のジョブについて CPU コアを1個, メモリを5GB に設定する場合は下のようになります。 .. code-block:: bash withName: trimmomatic { cpus = 1 maxForks = 100 clusterOptions = '-S /bin/bash -cwd -l s_vmem=5G' } | s_vmem は1コアあたりのメモリ量で cpus は CPU コア数になります。