2025 年 11月 14 日随笔档案 - zhaojie10

2025年11月14日

使用streamlit和qwen-agent实现Qwen3-VL模型图文对话应用的思路

摘要：参考在ec2上部署qwen3-VL-2B模型一文已经自行部署了模型。之前只做过文本模型的对话实现，由于Qwen3-VL支持图像识别，需要考虑如何将客户端的图片传输给模型。 AI给出的方案有如下通过base64编码的方式将图片数据嵌入到请求中上传文件到文件服务器，将文件url传递给模型使用对象存阅读全文

posted @ 2025-11-14 21:00 zhaojie10 阅读(72) 评论(0) 推荐(0)

在ec2上部署indexTTS和sparkTTS模型

摘要：模型比较，来自AI输出的结果如下需求优先级推荐模型音色最像真人 + 多音字可控 IndexTTS 情感丰富 + 支持笑声/呼吸等 CosyVoice 低资源 + 快速部署 + 音色克隆 SparkTTS 部署indexTTS模型 https://www.modelscope.cn/models 阅读全文

posted @ 2025-11-14 11:42 zhaojie10 阅读(50) 评论(0) 推荐(0)

zhaojiew10学习记录

公告