AI - 随笔分类 - weiwei22844

摘要：本文详细介绍了Stable Diffusion最强大的插件ControlNet的原理及典型应用，并介绍其安装及相关模型下载注意事项，最后还结合实例介绍了主要模型的使用方法。阅读全文

posted @ 2025-10-14 11:37 weiwei22844 阅读(1101) 评论(0) 推荐(3)

摘要：FunASR是由阿里达摩院开发的开源语音识别工具包，本文首先简单介绍了其安装过程，然后对其几个主要功能分别进行了介绍，最后以一个实时录音并识别的小例子进行了收尾。阅读全文

posted @ 2025-09-24 08:59 weiwei22844 阅读(1531) 评论(0) 推荐(5)

摘要：本文pytorch的入门系列文章第一篇，首先介绍了张量tensor这一基础内容，尤其详细介绍其关键概念自动求导autograd原理及简单应用。阅读全文

posted @ 2025-09-15 15:12 weiwei22844 阅读(353) 评论(2) 推荐(0)

摘要：本文对较为成熟文生图模型Stable Diffusion的使用进行了总结，并结合实例复原了相应图片的生成过程，最后给出了API的调用方法，以支持在程序中实现批量自动化生成图片！阅读全文

posted @ 2025-09-11 16:33 weiwei22844 阅读(1393) 评论(2) 推荐(2)

摘要：本文较为详细的介绍了OpenAI的开源语音转文字模型Whisper基本情况及安装过程，并介绍了它在处理音视频文件中语音时各种参数的详细用法，最后还介绍了如何使用python语言对该模型进行调用。阅读全文

posted @ 2025-08-20 15:10 weiwei22844 阅读(1393) 评论(0) 推荐(1)

GPT-SoVITS初探

摘要：本文详细介绍了GPT-SoVITS的安装过程，并结合一个应用实例介绍了它的使用方法，最后对其和IndexTTS进行了简单的对比。阅读全文

posted @ 2025-07-26 23:12 weiwei22844 阅读(1478) 评论(0) 推荐(0)

摘要：本来详细介绍了开源语音生成项目index-tts在纯windows环境及WSL下的安装使用说明，其中在WSL下能通过GPU加速，实现高速语音生成。阅读全文

posted @ 2025-07-21 12:32 weiwei22844 阅读(2619) 评论(2) 推荐(4)

随笔分类 - AI