🗓️ 2025-06-04 🗂️ 超算

超算中心

安装nvcc和pytorch

先用conda安装cuda-toolkit-不能省略。这里我选择的12.6版本,之前试了12.9,编译lammps的时候报错了。

再用pip安装pytorch

用conda安装nvcc后,lammps的nvcc_wrapper可能找不到cuda_runtime.h,可以手动指定

export CPLUS_INCLUDE_PATH=/home-ssd/Users/nsgm_zcx/miniconda3/envs/mace/targets/x86_64-linux/include:$CPLUS_INCLUDE_PATH

加载模块

source /home-ssd/hpc/ini_module.bash

export MODULEPATH=/home-ssd/hpc/modulefiles:/home-ssd/Soft/modules/modulefiles/Soft

export MODULEPATH=/home-ssd/hpc/modulefiles

module av查看当前可用模块

联网

ssh gn001进入编译节点

source /home-ssd/Soft/modules/bashrc

module load proxy/proxy

openmpi

下载后解压,进入发行版的文件夹,然后创建一个build文件夹用于编译和安装。

安装命令,在build文件夹中运行:../configure --prefix=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build --with-slurm 2>&1 | tee config.out

export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH

export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH

LAMMPS

cmake的编译缓存可能会记录错误的依赖路径,即使自己下载了新的openmpi,也会因为没有及时更新而报错找不到。

所以要删干净,再进行一次cmake。

export PATH=/home-ssd/Users/nsgm_zcx/lammps-develop/build-mliap:$PATH

zlib

安装完cuda-toolkitpytorch后,conda自动安装的zlib可能只是libzlib,只有库,没有头文件,需要手动安装一个完整的zlib,保证lammps编译的时候不报错。

conda install zlib

提交任务

gpu任务

#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH -e job.%j.out
#SBATCH -J lmp_job_gpu
#SBATCH --partition=gpu        
#SBATCH -N 1                    
#SBATCH -G 1
#SBATCH --gres=gpu:1
#SBATCH --exclusive


export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH
export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH
export PATH=/home-ssd/Users/nsgm_zcx/lammps-develop/build-mliap:$PATH

source /home-ssd/Users/nsgm_zcx/miniconda3/etc/profile.d/conda.sh
conda activate cuda

mace_run_train --config parameters.yaml

cpu任务

#!/bin/bash
#SBATCH -o job.%j.out
#SBATCH -J lmp_job_gpu
#SBATCH --partition=gpu        
#SBATCH -N 1                    
#SBATCH -G 1
#SBATCH --exclusive 

export PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/bin:$PATH
export LD_LIBRARY_PATH=/home-ssd/Users/nsgm_zcx/openmpi-5.0.5/build/lib:$LD_LIBRARY_PATH
export PATH=/home-ssd/Users/nsgm_zcx/lammps-manybody/lammps-develop/build:$PATH

source /home-ssd/Users/nsgm_zcx/miniconda3/etc/profile.d/conda.sh
conda activate cuda

mpirun -np 64 lmp -in contactangle.in

Comment