摘要: 参考在ec2上部署qwen3-VL-2B模型一文已经自行部署了模型。之前只做过文本模型的对话实现,由于Qwen3-VL支持图像识别,需要考虑如何将客户端的图片传输给模型。 AI给出的方案有如下 通过base64编码的方式将图片数据嵌入到请求中 上传文件到文件服务器,将文件url传递给模型 使用对象存 阅读全文
posted @ 2025-11-14 21:00 zhaojie10 阅读(72) 评论(0) 推荐(0)
摘要: 模型比较,来自AI输出的结果如下 需求优先级 推荐模型 音色最像真人 + 多音字可控 IndexTTS 情感丰富 + 支持笑声/呼吸等 CosyVoice 低资源 + 快速部署 + 音色克隆 SparkTTS 部署indexTTS模型 https://www.modelscope.cn/models 阅读全文
posted @ 2025-11-14 11:42 zhaojie10 阅读(50) 评论(0) 推荐(0)