FunASR

  FunASR是一个框架,里面有多个语音模型。

一、下载并运行funasr镜像。镜像有多个,以GPU版本为例:

docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1
docker run -itd -p 10095:10095 --name=funasr --privileged=true --runtime=nvidia -v /app/models/voice:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1

二、安装需要的组建和模型

# 安装ffmpeg
apt install ffmpeg -y
# 安装python组件
pip install websocket
# 相关语音模型,下面是此次运行所需,模型名称前缀是必须的(damo/等)
damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx
damo/speech_fsmn_vad_zh-cn-16k-common-onnx
damo/speech_ngram_lm_zh-cn-ai-wesp-fst
damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
thuduj12/fst_itn_zh

三、目录

/app/models
└─ voice
   ├─ damo
   │  ├─ punc_ct-transformer_cn-en-common-vocab471067-large-onnx
   │  ├─ speech_fsmn_vad_zh-cn-16k-common-onnx
   │  ├─ speech_ngram_lm_zh-cn-ai-wesp-fst
   │  └─ speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
   └─ thuduj12
      └─ fst_itn_zh

 

四、运行

cd /workspace/FunASR/runtime && nohup bash run_server.sh \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch  \
  --punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
  --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

五、验证

python runtime/python/websocket/funasr_wss_client.py --host "192.168.145.11" --port 10095 --ssl 0 --mode 2pass --audio_in "runtime/funasr_apiasr_example.wav" --output_dir "./results"

六、注意

  如果没有在workspace/models/目录下放置对应模型,在运行run_server.sh脚本后会自动去下载,内网服务器要在运行脚本前开启代理。

posted @ 2025-11-03 16:19  badwood  阅读(31)  评论(0)    收藏  举报
Badwood's Blog