MEGAHIT¶

简介¶

Megahit是一个二代测序从头组装工具，用于以时间和成本有效的方式组装大型和复杂的宏基因组数据,和其他基因组组装软件相比，Megahit在计算时间和内存消耗方面有着巨大优势，适用于土壤等复杂环境样本的组装和大量样本的混合组装。 MEGAHIT将数据整体组装在一起，即不需要像分区和规范化那样的预处理。

安装环境¶

序号	集群	平台	版本	位置	安装方式
1	hpckapok1	cpu	1.2.9	/share/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static	二进制文件
2	hpckapok2	cpu	1.2.9	/public/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static	二进制文件

注意

MEGAHIT不支持MPI计算，详见。

备注

以下为命令行解释，请勿直接复制运行，作业内容请保持与脚本作业目录一致。

使用方法¶

加载环境

module load anaconda       #集群2为：module load apps/anaconda3
module load megahit        #集群2为：module load apps/megahit

编辑slurm脚本

#!/bin/bash
#FILENAME:megahit.slurm

#SBATCH --job-name=megahit
#SBATCH --partition=cpuXeon6458
#SBATCH -N 1
#SBATCH --cpus-per-task=40
#SBATCH --output=job.%j.out
#SBATCH --error=job.%j.err

module load anaconda       #集群2为：module load apps/anaconda3
module load megahit        #集群2为：module load apps/megahit
#以下脚本运行参数以实质为准
megahit -1 xxxxxx_1.fastq.gz -2 xxxxxx_2.fastq.gz -o xxxxxx

提交slurm脚本
sbatch megahit.slurm

Megahit案例运行¶

备注

算例资料所在目录：

集群1：/share/software/megahit/sample

集群2：/public/software/megahit/sample

在加载运行环境

module load anaconda       #集群2为：module load apps/anaconda3
module load megahit        #集群2为：module load apps/megahit

拷贝算例脚本

cp ${MEGAHIT_SAMPLE}/megahit_sample.slurm ~         #拷贝案例脚本

算例脚本内容

#!/bin/bash
#SBATCH --job-name=megahit_demo
#SBATCH --partition=cpuXeon6458
#SBATCH -N 1
#SBATCH --cpus-per-task=20
#SBATCH --output=job.%j.out
#SBATCH --error=job.%j.err

module load apps/anaconda3
module load apps/megahit
megahit -1 $MEGAHIT_SAMPLE/SRR341725_1.fastq.gz -2 $MEGAHIT_SAMPLE/SRR341725_2.fastq.gz -o SRR341725.megahit_asm_demo

提交megahit计算任务
sbatch megahit_sample.slurm
计算输出结果在~/SRR341725.megahit_asm_demo目录中

参考资料¶

Megahit Github

Contributor：肥恩

最后更新: 2026 年 07 月 14 日