• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
magicat
博客园    首页    新随笔    联系   管理    订阅  订阅
npu配置Xinference环境,并部署embedding和rerank模型

在我司服务器上部署,但是尝试了其他文章的docker镜像,出现算子错误等问题,后面又用回

参考文献
https://blog.csdn.net/sccum/article/details/145995250
https://blog.csdn.net/qq_41994821/article/details/147223327
https://ascend.readthedocs.io/zh-cn/latest/sources/sentence_transformers/install.html

docker run -it -d --net=host --shm-size=20g  \
  --name Xinf \
  --device /dev/davinci4 \
  --device /dev/davinci5 \
  --device /dev/davinci_manager \
  --device /dev/devmm_svm \
  --device /dev/hisi_hdc \
  -v /usr/local/dcmi:/usr/local/dcmi \
  -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
  -v /usr/local/Ascend/driver/lib64/:/usr/local/Ascend/driver/lib64/ \
  -v /usr/local/Ascend/driver/version.info:/usr/local/Ascend/driver/version.info \
  -v /etc/ascend_install.info:/etc/ascend_install.info \
  -v /root/.cache:/root/.cache \
  -v /share/models/embedding/bge-reranker-v2-m3:/bge-reranker-v2-m3:ro \
  -p 9997:9997 \
  -it $IMAGE bash

# 终端1
export XINFERENCE_ENDPOINT=http://0.0.0.0:9997
xinference-local --host 0.0.0.0 --port 9997
# 终端2
export XINFERENCE_ENDPOINT=http://127.0.0.1:9997
## 本地下载重排序模型之后
xinference launch --model-name bge-reranker-v2-m3 --model-type rerank --model-path /bge-reranker-v2-m3

后面我直接通过打开http://127.0.0.1:9997配置embedding和rerank模型。

本文来自博客园,作者:magicat,转载请注明原文链接:https://www.cnblogs.com/magicat/p/19161008

posted on 2025-10-23 16:32  magicat  阅读(5)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3