Joy_CShow - 博客园

2025年7月8日

摘要：这里介绍一个新的音频克隆工具，有Bilibili开源的一个TTS工具：IndexTTS 开源地址：https://github.com/index-tts/index-tts IndexTTS 是一个工业级、可控且高效的零样本文本到语音 (Text-to-Speech, TTS) 系统。它是一个开源阅读全文

posted @ 2025-07-08 14:41 Joy_CShow 阅读(1973) 评论(6) 推荐(4)

2025年7月4日

视频音频对嘴--Wav2Lip

摘要：之前介绍了将图片加音频进行对嘴处理，生成新的视频：基础版： https://www.cnblogs.com/cj8988/p/18952604 进阶版(加表情) ：https://www.cnblogs.com/cj8988/p/18957718 这里介绍一个视频对嘴，一个视频加音频进行对嘴，生成新阅读全文

posted @ 2025-07-04 12:19 Joy_CShow 阅读(710) 评论(0) 推荐(0)

2025年7月2日

音频克隆-GPT-SoVITS

摘要：前面做了一个视频拆分工具，随便添加了音频的一些处理，有一个功能是视频+文字生成一个新的音频。使用的是TTS进行处理的，效果不行。你的浏览器不支持 audio 标签。所以这里介绍一个更加强大的开源工具：GPT-SoVITS、一：开源仓库：仓库：https://github.com/RVC-B 阅读全文

posted @ 2025-07-02 19:56 Joy_CShow 阅读(405) 评论(0) 推荐(0)

自己写了一个视频拆分工具

摘要：借助AI IED 完成了一个视频处理工具。视频： 1：视频拆分 2：视频提取音频 3：视频音频合成音频：1：音频拆分 2：音频提取文字 3：文字转音频（效果不是很好） ### 核心库 * **视频处理**: `moviepy` * **语音转文字**: `openai-whisper` * ** 阅读全文

posted @ 2025-07-02 14:16 Joy_CShow 阅读(44) 评论(0) 推荐(0)

本地搭建一个图片对嘴转视频工具-进阶版

摘要：上一章介绍了通过ComfyUI_Sonic模型实现图片+音频导出视频的图片对嘴的模型搭建，今天介绍一个进阶版（带表情的）。 1：官方要求的是GPU:20GB或更多 VRAM 的 GPU ,我的是8G的GPU,能运行起来，就是生成速度慢些。 2：代码下载。下载地址：https://github.co 阅读全文

posted @ 2025-07-02 09:47 Joy_CShow 阅读(192) 评论(0) 推荐(0)

2025年6月27日

本地搭建一个对嘴AI工具

摘要：图片+音频=说话视频这就是本次需要实现的功能。一：环境 window10电脑（GPU越大越好，我的是专享8G，有点小了）。 Python 3.11.9。 CUDA Version: 12.9。（驱动支持的最大 CUDA 版本，之前版本太低了，下载个新的安装，升级，重新启动电脑）二：ComfyU 阅读全文

posted @ 2025-06-27 16:48 Joy_CShow 阅读(755) 评论(0) 推荐(1)

2025年6月26日

搭建一个图片变视频的AI(二)：开始搭建

摘要：前一章介绍了模型相关，现在开始搭建。一：下载，解压ComfyUI https://github.com/comfyanonymous/ComfyUI 上面链接中也有安装过程，可以参考。也可以直接进入文件夹，直接运行，差什么，安装什么（我比较喜欢这样，因为我之前pip可能已经安装过了某些包）。最好阅读全文

posted @ 2025-06-26 12:04 Joy_CShow 阅读(719) 评论(0) 推荐(2)

搭建一个图片变视频的AI(一)：模型介绍

摘要：在AI如火如荼发展的今天，让图片变视频的功能已经相当成熟了，很多AI软件都可以实现：上传一张图片，一段描述，就可以输出一个视频，实现了让一张图片动起来的效果。今天教大家这么在自己的电脑上搭建一个：让图片变视频的AI根据（本内容需要有一定编程基础）前期准备：特别注意，你的电脑如果GPU特别小，就不阅读全文

posted @ 2025-06-26 11:19 Joy_CShow 阅读(321) 评论(0) 推荐(0)

2025年2月11日

window10本地搭建DeepSeek R1（五）DeepSeek数据训练

摘要：前面搭建的DeepSeek已经可以使用了，但是有些特别的定制型聊天可能不太行，这里介绍下数据训练：将你的数据投喂给DeepSeek ，然后询问一些跟数据相关的问题，AI会给你更准确的回答。一：下载AnythingLLM，一个数据投喂的工具。https://anythingllm.com/ 下载完成阅读全文

posted @ 2025-02-11 11:14 Joy_CShow 阅读(1090) 评论(0) 推荐(1)

2025年2月10日

window10本地搭建DeepSeek R1（四）DeepSeek Api使用

摘要：前面已经搭建好了本地DeepSeek ，可以使用OpenWebUi进行聊天访问，这里介绍使用本地的DeepSeek-Api进行访问。 1：在配置中打开api使用： 2：DeepSeek 模型自己是没有Api的，这里使用的是Ollama的代领Api。上面打开后就可以在本机上使用 http://loca 阅读全文

posted @ 2025-02-10 14:32 Joy_CShow 阅读(1834) 评论(0) 推荐(0)

但行好事.莫问前程

公告