超算中心
安装nvcc和pytorch
先用conda安装cuda-toolkit
,-
不能省略。这里我选择的12.6版本,之前试了12.9,编译lammps的时候报错了。
再用pip安装pytorch
。
用conda安装nvcc后,lammps的nvcc_wrapper可能找不到cuda_runtime.h,可以手动指定
export CPLUS_INCLUDE_PATH=/home-ssd/Users/nsgm_zcx/miniconda3/envs/mace/targets/x86_64-linux/include:$CPLUS_INCLUDE_PATH
加载模块
source /home-ssd/hpc/ini_module.bash
export MODULEPATH=/home-ssd/hpc/modulefiles:/home-ssd/Soft/modules/modulefiles/Soft
export MODULEPATH=/home-ssd/hpc/modulefiles
module av
查看当前可用模块
联网
ssh gn001
进入编译节点
source /home-ssd/Soft/modules/bashrc
module load proxy/proxy
openmpi
下载后解压,进入发行版的文件夹,然后创建一个build
文件夹用于编译和安装。
安装命令,在build文件夹中运行:../configure --prefix=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build --with-slurm 2>&1 | tee config.out
export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH
export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH
LAMMPS
cmake的编译缓存可能会记录错误的依赖路径,即使自己下载了新的openmpi,也会因为没有及时更新而报错找不到。
所以要删干净,再进行一次cmake。
export PATH=/home-ssd/Users/nsgm_zcx/lammps-develop/build-mliap:$PATH
zlib
安装完cuda-toolkit
和pytorch
后,conda自动安装的zlib可能只是libzlib
,只有库,没有头文件,需要手动安装一个完整的zlib
,保证lammps编译的时候不报错。
conda install zlib
提交任务
gpu任务
#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH -e job.%j.out
#SBATCH -J lmp_job_gpu
#SBATCH --partition=gpu
#SBATCH -N 1
#SBATCH -G 1
#SBATCH --gres=gpu:1
#SBATCH --exclusive
export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH
export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH
export PATH=/home-ssd/Users/nsgm_zcx/lammps-develop/build-mliap:$PATH
source /home-ssd/Users/nsgm_zcx/miniconda3/etc/profile.d/conda.sh
conda activate cuda
mace_run_train --config parameters.yaml
cpu任务
#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH -J lmp_job_gpu
#SBATCH --partition=gpu
#SBATCH -N 1
#SBATCH -G 1
#SBATCH --exclusive
export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH
export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH
export PATH=/home-ssd/Users/nsgm_zcx/lammps-manybody/lammps-develop/build:$PATH
source /home-ssd/Users/nsgm_zcx/miniconda3/etc/profile.d/conda.sh
conda activate cuda
mpirun -np 64 lmp -in contactangle.in