mmcv中dist_train.sh的一些命令的含义

CONFIG=$1
GPUS=$2
NNODES=${NNODES:-1}
NODE_RANK=${NODE_RANK:-0}
PORT=${PORT:-29500}
MASTER_ADDR=${MASTER_ADDR:-"127.0.0.1"}

PYTHONPATH="$(dirname $0)/..":$PYTHONPATH \
python -m torch.distributed.launch \
    --nnodes=$NNODES \
    --node_rank=$NODE_RANK \
    --master_addr=$MASTER_ADDR \
    --nproc_per_node=$GPUS \
    --master_port=$PORT \
    $(dirname "$0")/train.py \
    $CONFIG \
    --seed 0 \
    --launcher pytorch \
    ${@:3}  # 表示从第三个参数开始,也就是从$3开始,接收进来的参数会全部给train.py

 

训练模型的一个示例命令:

export PYTHONPATH=./
cd /mnt/data/wangpeng/flashocc
bash ./tools/dist_train_wangpeng.sh ./projects/configs/flashocc/flashocc-r50_wangpeng.py 2 --work-dir ../exp_results/flashocc/

  

 

posted @ 2024-12-04 11:39  Picassooo  阅读(140)  评论(0)    收藏  举报