FunASR
FunASR是一个框架,里面有多个语音模型。
一、下载并运行funasr镜像。镜像有多个,以GPU版本为例:
docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1
docker run -itd -p 10095:10095 --name=funasr --privileged=true --runtime=nvidia -v /app/models/voice:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-gpu-0.2.1
二、安装需要的组建和模型
# 安装ffmpeg apt install ffmpeg -y
# 安装python组件
pip install websocket
# 相关语音模型,下面是此次运行所需,模型名称前缀是必须的(damo/等)
damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx
damo/speech_fsmn_vad_zh-cn-16k-common-onnx
damo/speech_ngram_lm_zh-cn-ai-wesp-fst
damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
thuduj12/fst_itn_zh
三、目录
/app/models └─ voice ├─ damo │ ├─ punc_ct-transformer_cn-en-common-vocab471067-large-onnx │ ├─ speech_fsmn_vad_zh-cn-16k-common-onnx │ ├─ speech_ngram_lm_zh-cn-ai-wesp-fst │ └─ speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch └─ thuduj12 └─ fst_itn_zh
四、运行
cd /workspace/FunASR/runtime && nohup bash run_server.sh \ --download-model-dir /workspace/models \ --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \ --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch \ --punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \ --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \ --itn-dir thuduj12/fst_itn_zh \ --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &
五、验证
python runtime/python/websocket/funasr_wss_client.py --host "192.168.145.11" --port 10095 --ssl 0 --mode 2pass --audio_in "runtime/funasr_apiasr_example.wav" --output_dir "./results"
六、注意
如果没有在workspace/models/目录下放置对应模型,在运行run_server.sh脚本后会自动去下载,内网服务器要在运行脚本前开启代理。
浙公网安备 33010602011771号