摘要:
参考在ec2上部署qwen3-VL-2B模型一文已经自行部署了模型。之前只做过文本模型的对话实现,由于Qwen3-VL支持图像识别,需要考虑如何将客户端的图片传输给模型。 AI给出的方案有如下 通过base64编码的方式将图片数据嵌入到请求中 上传文件到文件服务器,将文件url传递给模型 使用对象存 阅读全文
posted @ 2025-11-14 21:00
zhaojie10
阅读(72)
评论(0)
推荐(0)
摘要:
模型比较,来自AI输出的结果如下 需求优先级 推荐模型 音色最像真人 + 多音字可控 IndexTTS 情感丰富 + 支持笑声/呼吸等 CosyVoice 低资源 + 快速部署 + 音色克隆 SparkTTS 部署indexTTS模型 https://www.modelscope.cn/models 阅读全文
posted @ 2025-11-14 11:42
zhaojie10
阅读(50)
评论(0)
推荐(0)

浙公网安备 33010602011771号