MEGAHIT¶
简介¶
Megahit是一个二代测序从头组装工具, 用于以时间和成本有效的方式组装大型和复杂的宏基因组数据,和其他基因组组装软件相比,Megahit在计算时间和内存消耗方面有着巨大优势,适用于土壤等复杂环境样本的组装和大量样本的混合组装。 MEGAHIT将数据整体组装在一起,即不需要像分区和规范化那样的预处理。
安装环境¶
序号 |
集群 |
平台 |
版本 |
位置 |
安装方式 |
---|---|---|---|---|---|
1 |
hpckapok1 |
cpu |
1.2.9 |
/share/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static |
二进制文件 |
2 |
hpckapok2 |
cpu |
1.2.9 |
/public/software/megahit/MEGAHIT-1.2.9-Linux-x86_64-static |
二进制文件 |
注意
MEGAHIT不支持MPI计算,详见。
备注
以下为命令行解释,请勿直接复制运行,作业内容请保持与脚本作业目录一致。
使用方法¶
加载环境
module load anaconda #集群2为:module load apps/anaconda3 module load megahit #集群2为:module load apps/megahit
编辑slurm脚本
#!/bin/bash #FILENAME:megahit.slurm #SBATCH --job-name=megahit #SBATCH --partition=cpuXeon6458 #SBATCH -N 1 #SBATCH --cpus-per-task=40 #SBATCH --output=job.%j.out #SBATCH --error=job.%j.err module load anaconda #集群2为:module load apps/anaconda3 module load megahit #集群2为:module load apps/megahit #以下脚本运行参数以实质为准 megahit -1 xxxxxx_1.fastq.gz -2 xxxxxx_2.fastq.gz -o xxxxxx
提交slurm脚本
sbatch megahit.slurm
Megahit案例运行¶
备注
算例资料所在目录:
集群1:/share/software/megahit/sample
集群2:/public/software/megahit/sample
在加载运行环境
module load anaconda #集群2为:module load apps/anaconda3 module load megahit #集群2为:module load apps/megahit
拷贝算例脚本
cp ${MEGAHIT_SAMPLE}/megahit_sample.slurm ~ #拷贝案例脚本
算例脚本内容
#!/bin/bash #SBATCH --job-name=megahit_demo #SBATCH --partition=cpuXeon6458 #SBATCH -N 1 #SBATCH --cpus-per-task=20 #SBATCH --output=job.%j.out #SBATCH --error=job.%j.err module load apps/anaconda3 module load apps/megahit megahit -1 $MEGAHIT_SAMPLE/SRR341725_1.fastq.gz -2 $MEGAHIT_SAMPLE/SRR341725_2.fastq.gz -o SRR341725.megahit_asm_demo
提交megahit计算任务
sbatch megahit_sample.slurm
计算输出结果在~/SRR341725.megahit_asm_demo目录中
参考资料¶
Contributor:肥恩
最后更新:
2025 年 06 月 30 日