一,#本机环境检查
执行nvidia-smi,查看右上角。验证显卡驱动已安装最高支持的版本。
nvidia-smi
#在调试时,为了实时观察GPU利用率,一般新开一个命令窗口,执行以下命令,一秒刷新一次。
watch -n 1 nvidia-smi
执行nvcc -V验证cuda
nvcc -V
执行conda --version验证conda版本
conda --version
#列出所有已创建的Conda 环境:
conda env list 或 conda info --envs
#若存在,先删除已存在环境
conda env remove -n conda_wan2
#创建新环境
conda create -n conda_wan2 python=3.10
#激活环境
conda activate conda_wan2
二,依赖库安装
根据CUDA版本安装PyTorch:
CUDA 12.1:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
CUDA 12.2:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu122
#验证PyTorch是否能正确识别GPU
python3 -c "import torch; print('PyTorch版本:', torch.__version__); print('CUDA可用:', torch.cuda.is_available()); print('CUDA版本:', torch.version.cuda); print('GPU设备:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else 'None'); print('GPU数量:', torch.cuda.device_count());"
#魔搭modelscope库安装
pip3 install modelscope
克隆仓库
git clone https://github.com/Wan-Video/Wan2.2.git cd Wan2.2
安装依赖项
# Ensure torch >= 2.4.0 pip install -r requirements.txt
#使用 modelscope-cli 下载模型:
modelscope download Wan-AI/Wan2.2-TI2V-5B --local_dir ./Wan2.2-TI2V-5B
#解决显存碎片问题
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
单GPU
python3 generate.py --task ti2v-5B --size 704*1280 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --prompt "两猫对战"
单GPU
CUDA_VISIBLE_DEVICES=4 python3 generate.py \ --task ti2v-5B \ --size 704*1280 \ --ckpt_dir ./Wan2.2-TI2V-5B \ --offload_model True \ --convert_model_dtype \ --t5_cpu \ --prompt "极致情绪王家卫风络,高清4K,准备点烟又放下。"
使用 FSDP + DeepSpeed Ulysses 进行多 GPU 推理
我们使用 PyTorch FSDP 和 DeepSpeed Ulysses 来加速推理
torchrun --nproc_per_node=8 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --dit_fsdp --t5_fsdp --ulysses_size 8 --prompt "两只鼠对战"
#单GPU,图生视频
CUDA_VISIBLE_DEVICES=4 python3 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --image examples/i2v_input2.JPG --prompt "古风武侠动画,两名剑客于碧波之上凌空对决,身着飘逸汉服,手持寒光闪烁的长剑,姿态凝重,眼神坚定,仿佛空气中弥漫着剑拔弩张的气氛。背景是水墨画般的青峰倒映在宁静的湖面,飞鸟划过天际,增添画面动态美感。中景广角镜头捕捉二人腾空交手瞬间,剑气纵横,水花四溅。画面中央,“Qwen3 coder挑战赛”金色大字浮现,结合古典意境与未来科技元素,营造出独特的视觉冲击。动态构图,高速镜头捕捉空中打斗细节,展现剑客轻功与剑法的精妙结合。"
#单GPU,图生视频示例
CUDA_VISIBLE_DEVICES=7 python3 generate.py --task ti2v-5B --size 704*1280 --ckpt_dir ./Wan2.2-TI2V-5B --offload_model True --convert_model_dtype --t5_cpu --image examples/i2v_input5.jpg --prompt "举起双手"
#多GPU,图生视频
CUDA_VISIBLE_DEVICES=4,5,6 torchrun --nproc_per_node=8 generate.py --task ti2v-5B --size 1280*704 --ckpt_dir ./Wan2.2-TI2V-5B --dit_fsdp --t5_fsdp --ulysses_size 8 --image examples/i2v_input2.JPG --prompt "古风武侠动画,剑气纵横,水花四溅。动态构图,高速镜头捕捉空中打斗细节,展现剑客轻功与剑法的精妙结合。"
#文件找不到错误处理,批量重命名
mv diffusion_pytorch_model-00001-of-00003-bf16.safetensors diffusion_pytorch_model-00001-of-00003.safetensors
mv diffusion_pytorch_model-00002-of-00003-bf16.safetensors diffusion_pytorch_model-00002-of-00003.safetensors
mv diffusion_pytorch_model-00003-of-00003-bf16.safetensors diffusion_pytorch_model-00003-of-00003.safetensors