AlphaFold3¶
简介¶
AlphaFold3是Google DeepMind和Isomorphic Labs团队开发的一种新型AI模型。AlphaFold模型可用于预测蛋白质结构和相互作用。其最新版本AlphaFold3能够对多种生物分子的结构进行预测,涵盖蛋白质、核酸(包括 DNA 和 RNA)、小分子、离子以及修饰残基等几乎所有在蛋白质数据库(PDB)中存在的分子类型。可以极限缩短新药、疫苗等研发进程,以帮助推动科学研究。
安装环境¶
序号 |
集群 |
平台 |
版本 |
位置 |
安装方式 |
---|---|---|---|---|---|
1 |
hpckapok1 |
gpu |
AlphaFold3 |
/share/software/AlphaFold3/ |
容器镜像 |
2 |
hpckapok2 |
gpu |
AlphaFold3 |
/public/software/AlphaFold3/ |
容器镜像 |
使用方法¶
小技巧
以下为命令行解释,请勿直接复制运行,作业内容请保持与脚本作业目录一致
slurm作业提交¶
hpckapok1¶
1.创建用于跑alphafold3的文件夹,在这个文件夹下创建用于挂载的输入输出文件夹input和output
mkdir alpha && cd alpha
mkdir input
mkdir output
2.将输入的json文件放置input文件夹下,创建一个fold_input.json文件,蛋白质结构预测json示例:
{
"name": "2PV7",
"sequences": [
{
"protein": {
"id": ["A", "B"],
"sequence": "GMRESYANENQFGFKTINSDIHKIVIVGGYGKLGGLFARYLRASGYPISILDREDWAVAESILANADVVIVSVPINLTLETIERLKPYLTENMLLADLTSVKREPLAKMLEVHTGAVLGLHPMFGADIASMAKQVVVRCDGRFPERYEWLLEQIQIWGAKIYQTNATEHDHNMTYIQALRHFSTFANGLHLSKQPINLANLLALSSPIYRLELAMIGRLFAQDAELYADIIMDKSENLAVIETLKQTYDEALTFFENNDRQGFIDAFHKVRDWFGDYSEQFLKESRQLLQQANDLKQG"
}
}
],
"modelSeeds": [1],
"dialect": "alphafold3",
"version": 1
}
3.在alpha文件夹下创建用于提交平台作业的脚本文件alphafold3.sh,以下为申请一张gpu卡进行计算
#!/bin/bash
#SBATCH --job-name=alphafold3
#SBATCH --partition=gpuA800
#SBATCH --nodes=1
#SBATCH -n 9
#SBATCH --gres=gpu:1
#SBATCH --output=%j.out
#SBATCH --error=%j.err
module load singularity/3.7.1
singularity exec --nv --bind $PWD/input:/root/af_input --bind $PWD/output:/root/af_output --bind /share/software/AlphaFold3/alphafold3/models:/root/models --bind /share/software/AlphaFold3/alphafold3/database:/root/public_databases /share/software/AlphaFold3/alphafold3.sif /alphafold3_venv/bin/python /app/alphafold/run_alphafold.py --json_path=/root/af_input/fold_input.json --model_dir=/root/models --db_dir=/root/public_databases --output_dir=/root/af_output
使用sbatch alphafold3.sh提交作业
4.作业结束后,输出结果在alpha/output/目录下
hpckapok2¶
hpckapok2上提交与hpckapok1上一致,提交脚本内容略有不同,参考以上hpckapok1步骤1、2后,以下为hpckapok2上实现脚本,创建用于提交平台作业的脚本文件alphafold3.sh
#!/bin/bash
#SBATCH --job-name=alphafold3
#SBATCH --partition=gpuA800
#SBATCH --nodes=1
#SBATCH -n 8
#SBATCH --gres=gpu:1
#SBATCH --output=%j.out
#SBATCH --error=%j.err
module load apps/singularity/3.9.9
singularity exec --nv --bind $PWD/input:/root/af_input --bind $PWD/output:/root/af_output --bind /public/software/AlphaFold3/alphafold3/models:/root/models --bind /public/software/AlphaFold3/alphafold3/database:/root/public_databases /public/software/AlphaFold3/alphafold3.sif /alphafold3_venv/bin/python /app/alphafold/run_alphafold.py --json_path=/root/af_input/fold_input.json --model_dir=/root/models --db_dir=/root/public_databases --output_dir=/root/af_output
使用sbatch alphafold3.sh提交作业
作业结束后,输出结果在alpha/output/目录下
参考资料¶
Contributor:qbxie