上一页 1 2 3 4 5 6 ··· 10 下一页
摘要: 这里介绍一个新的音频克隆工具,有Bilibili开源的一个TTS工具:IndexTTS 开源地址:https://github.com/index-tts/index-tts IndexTTS 是一个工业级、可控且高效的零样本文本到语音 (Text-to-Speech, TTS) 系统。它是一个开源 阅读全文
posted @ 2025-07-08 14:41 Joy_CShow 阅读(1627) 评论(6) 推荐(4)
摘要: 之前介绍了将图片加音频进行对嘴处理,生成新的视频:基础版: https://www.cnblogs.com/cj8988/p/18952604 进阶版(加表情) :https://www.cnblogs.com/cj8988/p/18957718 这里介绍一个视频对嘴,一个视频加音频进行对嘴,生成新 阅读全文
posted @ 2025-07-04 12:19 Joy_CShow 阅读(512) 评论(0) 推荐(0)
摘要: 前面做了一个视频拆分工具,随便添加了音频的一些处理,有一个功能是视频+文字生成一个新的音频。 使用的是TTS进行处理的,效果不行。 你的浏览器不支持 audio 标签。 所以这里介绍一个更加强大的开源工具:GPT-SoVITS、 一:开源仓库: 仓库:https://github.com/RVC-B 阅读全文
posted @ 2025-07-02 19:56 Joy_CShow 阅读(313) 评论(0) 推荐(0)
摘要: 借助AI IED 完成了一个视频处理工具。 视频: 1:视频拆分 2:视频提取音频 3:视频音频合成 音频:1:音频拆分 2:音频提取文字 3:文字转音频(效果不是很好) ### 核心库 * **视频处理**: `moviepy` * **语音转文字**: `openai-whisper` * ** 阅读全文
posted @ 2025-07-02 14:16 Joy_CShow 阅读(37) 评论(0) 推荐(0)
摘要: 上一章介绍了通过ComfyUI_Sonic模型实现图片+音频导出视频的图片对嘴的模型搭建,今天介绍一个进阶版(带表情的)。 1:官方要求的是GPU:20GB或更多 VRAM 的 GPU ,我的是8G的GPU,能运行起来,就是生成速度慢些。 2:代码下载。 下载地址:https://github.co 阅读全文
posted @ 2025-07-02 09:47 Joy_CShow 阅读(151) 评论(0) 推荐(0)
摘要: 图片+音频=说话视频 这就是本次需要实现的功能。 一:环境 window10电脑(GPU越大越好,我的是专享8G,有点小了)。 Python 3.11.9。 CUDA Version: 12.9。(驱动支持的最大 CUDA 版本,之前版本太低了,下载个新的安装,升级,重新启动电脑) 二:ComfyU 阅读全文
posted @ 2025-06-27 16:48 Joy_CShow 阅读(672) 评论(0) 推荐(1)
摘要: 前一章介绍了模型相关,现在开始搭建。 一:下载,解压ComfyUI https://github.com/comfyanonymous/ComfyUI 上面链接中也有安装过程,可以参考。 也可以直接进入文件夹,直接运行,差什么,安装什么(我比较喜欢这样,因为我之前pip可能已经安装过了某些包)。最好 阅读全文
posted @ 2025-06-26 12:04 Joy_CShow 阅读(628) 评论(0) 推荐(2)
摘要: 在AI如火如荼发展的今天,让图片变视频的功能已经相当成熟了,很多AI软件都可以实现:上传一张图片,一段描述,就可以输出一个视频,实现了让一张图片动起来的效果。 今天教大家这么在自己的电脑上搭建一个:让图片变视频的AI根据(本内容需要有一定编程基础) 前期准备:特别注意,你的电脑如果GPU特别小,就不 阅读全文
posted @ 2025-06-26 11:19 Joy_CShow 阅读(245) 评论(0) 推荐(0)
摘要: 前面搭建的DeepSeek已经可以使用了,但是有些特别的定制型聊天可能不太行,这里介绍下数据训练:将你的数据投喂给DeepSeek ,然后询问一些跟数据相关的问题,AI会给你更准确的回答。 一:下载AnythingLLM,一个数据投喂的工具。https://anythingllm.com/ 下载完成 阅读全文
posted @ 2025-02-11 11:14 Joy_CShow 阅读(1057) 评论(0) 推荐(1)
摘要: 前面已经搭建好了本地DeepSeek ,可以使用OpenWebUi进行聊天访问,这里介绍使用本地的DeepSeek-Api进行访问。 1:在配置中打开api使用: 2:DeepSeek 模型自己是没有Api的,这里使用的是Ollama的代领Api。上面打开后就可以在本机上使用 http://loca 阅读全文
posted @ 2025-02-10 14:32 Joy_CShow 阅读(1793) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 10 下一页