摘要:
下载模型 sudo ollama pull modelscope.cn/Embedding-GGUF/bge-large-zh-v1.5:latest 测试 curl -X POST http://localhost:11434/api/embeddings \ -H "Content-Type: 阅读全文
posted @ 2025-11-14 17:18
yi-sheng
阅读(6)
评论(0)
推荐(0)
摘要:
使用 vLLM 本地部署 Qwen3-Embedding-8B 模型并接入 Dify 完整指南 环境准备与验证 在开始部署前,需要确保本地环境满足基本要求。以下是环境验证步骤: 1. 显卡驱动和CUDA验证 # 验证NVIDIA驱动状态 nvidia-smi # 实时监控GPU使用情况(新开终端执行 阅读全文
posted @ 2025-11-14 00:01
yi-sheng
阅读(112)
评论(0)
推荐(0)
浙公网安备 33010602011771号