多GPU本地布署Wan2.2-TI2V-5B文本转视频模型

一，#本机环境检查

执行nvidia-smi，查看右上角。验证显卡驱动已安装最高支持的版本。

nvidia-smi

#在调试时，为了实时观察GPU利用率，一般新开一个命令窗口，执行以下命令，一秒刷新一次。

watch -n 1 nvidia-smi

执行nvcc -V验证cuda

nvcc -V

执行conda --version验证conda版本

conda --version

#列出所有已创建的Conda 环境：

conda env list
或
conda info --envs

#若存在，先删除已存在环境

conda env remove -n conda_wan2

#创建新环境

conda create -n conda_wan2 python=3.10

#激活环境

conda activate conda_wan2

二，依赖库安装

根据CUDA版本安装PyTorch：
CUDA 12.1:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

CUDA 12.2:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu122

#验证PyTorch是否能正确识别GPU

python3 -c "import torch; print('PyTorch版本:', torch.__version__); print('CUDA可用:', torch.cuda.is_available()); print('CUDA版本:', torch.version.cuda); print('GPU设备:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else 'None'); print('GPU数量:', torch.cuda.device_count());"

#魔搭modelscope库安装

pip3 install modelscope

克隆仓库

git clone https://github.com/Wan-Video/Wan2.2.git
cd Wan2.2

安装依赖项

# Ensure torch >= 2.4.0
pip install -r requirements.txt

#使用 modelscope-cli 下载模型：

modelscope download Wan-AI/Wan2.2-TI2V-5B --local_dir ./Wan2.2-TI2V-5B

#解决显存碎片问题

export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True

单GPU

python3 generate.py --task ti2v-5B --size 704*1280 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --prompt "两猫对战"

单GPU

CUDA_VISIBLE_DEVICES=4 python3 generate.py \
--task ti2v-5B \
--size 704*1280 \
--ckpt_dir ./Wan2.2-TI2V-5B \
--offload_model True \
--convert_model_dtype \
--t5_cpu \
--prompt "极致情绪王家卫风络，高清4K，准备点烟又放下。"

使用 FSDP + DeepSpeed Ulysses 进行多 GPU 推理
我们使用 PyTorch FSDP 和 DeepSpeed Ulysses 来加速推理

torchrun --nproc_per_node=8 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --dit_fsdp --t5_fsdp --ulysses_size 8 --prompt "两只鼠对战"

#单GPU，图生视频

CUDA_VISIBLE_DEVICES=4 python3 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --image examples/i2v_input2.JPG --prompt "古风武侠动画，两名剑客于碧波之上凌空对决，身着飘逸汉服，手持寒光闪烁的长剑，姿态凝重，眼神坚定，仿佛空气中弥漫着剑拔弩张的气氛。背景是水墨画般的青峰倒映在宁静的湖面，飞鸟划过天际，增添画面动态美感。中景广角镜头捕捉二人腾空交手瞬间，剑气纵横，水花四溅。画面中央，“Qwen3 coder挑战赛”金色大字浮现，结合古典意境与未来科技元素，营造出独特的视觉冲击。动态构图，高速镜头捕捉空中打斗细节，展现剑客轻功与剑法的精妙结合。"

#单GPU，图生视频示例

CUDA_VISIBLE_DEVICES=7 python3 generate.py --task ti2v-5B --size 704*1280 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --image examples/i2v_input5.jpg --prompt "举起双手"

#多GPU，图生视频

CUDA_VISIBLE_DEVICES=4,5,6 torchrun --nproc_per_node=8 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --dit_fsdp --t5_fsdp --ulysses_size 8 --image examples/i2v_input2.JPG --prompt "古风武侠动画，剑气纵横，水花四溅。动态构图，高速镜头捕捉空中打斗细节，展现剑客轻功与剑法的精妙结合。"

#文件找不到错误处理，批量重命名

mv diffusion_pytorch_model-00001-of-00003-bf16.safetensors diffusion_pytorch_model-00001-of-00003.safetensors
mv diffusion_pytorch_model-00002-of-00003-bf16.safetensors diffusion_pytorch_model-00002-of-00003.safetensors
mv diffusion_pytorch_model-00003-of-00003-bf16.safetensors diffusion_pytorch_model-00003-of-00003.safetensors

posted on 2025-09-25 21:10 yi-sheng 阅读(116) 评论(0) 收藏举报