FunASR

　　FunASR是一个框架，里面有多个语音模型。

一、下载并运行funasr镜像。镜像有多个，以GPU版本为例：

docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1
docker run -itd -p 10095:10095 --name=funasr --privileged=true --runtime=nvidia -v /app/models/voice:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1

二、安装需要的组建和模型

# 安装ffmpeg
apt install ffmpeg -y
# 安装python组件
pip install websocket
# 相关语音模型，下面是此次运行所需，模型名称前缀是必须的（damo/等）
damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx
damo/speech_fsmn_vad_zh-cn-16k-common-onnx
damo/speech_ngram_lm_zh-cn-ai-wesp-fst
damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
thuduj12/fst_itn_zh

三、目录

/app/models
└─ voice
   ├─ damo
   │  ├─ punc_ct-transformer_cn-en-common-vocab471067-large-onnx
   │  ├─ speech_fsmn_vad_zh-cn-16k-common-onnx
   │  ├─ speech_ngram_lm_zh-cn-ai-wesp-fst
   │  └─ speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
   └─ thuduj12
      └─ fst_itn_zh

四、运行

cd /workspace/FunASR/runtime && nohup bash run_server.sh \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch  \
  --punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
  --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

五、验证

python runtime/python/websocket/funasr_wss_client.py --host "192.168.145.11" --port 10095 --ssl 0 --mode 2pass --audio_in "runtime/funasr_apiasr_example.wav" --output_dir "./results"

六、注意

　　如果没有在workspace/models/目录下放置对应模型，在运行run_server.sh脚本后会自动去下载，内网服务器要在运行脚本前开启代理。

七、链接

《使用Docker部署FunASR服务》

posted @ 2025-11-03 16:19 badwood 阅读(395) 评论(0) 收藏举报

刷新页面返回顶部

FunASR

公告