MEGAHIT

简介

Megahit是一个二代测序从头组装工具, 用于以时间和成本有效的方式组装大型和复杂的宏基因组数据,和其他基因组组装软件相比,Megahit在计算时间和内存消耗方面有着巨大优势,适用于土壤等复杂环境样本的组装和大量样本的混合组装。 MEGAHIT将数据整体组装在一起,即不需要像分区和规范化那样的预处理。

安装环境

序号

集群

平台

版本

位置

安装方式

1

hpckapok1

cpu

1.2.9

/share/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static

二进制文件

2

hpckapok2

cpu

1.2.9

/public/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static

二进制文件

注意

MEGAHIT不支持MPI计算,详见

备注

以下为命令行解释,请勿直接复制运行,作业内容请保持与脚本作业目录一致。

使用方法

  1. 加载环境

    module load anaconda       #集群2为:module load apps/anaconda3
    module load megahit        #集群2为:module load apps/megahit
    
  2. 编辑slurm脚本

    #!/bin/bash
    #FILENAME:megahit.slurm
    
    #SBATCH --job-name=megahit
    #SBATCH --partition=cpuXeon6458
    #SBATCH -N 1
    #SBATCH --cpus-per-task=40
    #SBATCH --output=job.%j.out
    #SBATCH --error=job.%j.err
    
    module load anaconda       #集群2为:module load apps/anaconda3
    module load megahit        #集群2为:module load apps/megahit
    #以下脚本运行参数以实质为准
    megahit -1 xxxxxx_1.fastq.gz -2 xxxxxx_2.fastq.gz -o xxxxxx
    
  3. 提交slurm脚本

    sbatch megahit.slurm
    

Megahit案例运行

备注

算例资料所在目录:

集群1:/share/software/megahit/sample

集群2:/public/software/megahit/sample

  1. 在加载运行环境

    module load anaconda       #集群2为:module load apps/anaconda3
    module load megahit        #集群2为:module load apps/megahit
    
  2. 拷贝算例脚本

    cp ${MEGAHIT_SAMPLE}/megahit_sample.slurm ~         #拷贝案例脚本
    
  3. 算例脚本内容

    #!/bin/bash
    #SBATCH --job-name=megahit_demo
    #SBATCH --partition=cpuXeon6458
    #SBATCH -N 1
    #SBATCH --cpus-per-task=20
    #SBATCH --output=job.%j.out
    #SBATCH --error=job.%j.err
    
    module load apps/anaconda3
    module load apps/megahit
    megahit -1 $MEGAHIT_SAMPLE/SRR341725_1.fastq.gz -2 $MEGAHIT_SAMPLE/SRR341725_2.fastq.gz -o SRR341725.megahit_asm_demo
    
  4. 提交megahit计算任务

    sbatch megahit_sample.slurm
    
  5. 计算输出结果在~/SRR341725.megahit_asm_demo目录中

参考资料

Megahit Github

Contributor:肥恩


最后更新: 2025 年 06 月 30 日