随笔分类 -  AI

人工智能等相关前言技术
摘要:本文详细介绍了Stable Diffusion最强大的插件ControlNet的原理及典型应用,并介绍其安装及相关模型下载注意事项,最后还结合实例介绍了主要模型的使用方法。 阅读全文
posted @ 2025-10-14 11:37 weiwei22844 阅读(954) 评论(0) 推荐(3)
摘要:FunASR是由阿里达摩院开发的开源语音识别工具包,本文首先简单介绍了其安装过程,然后对其几个主要功能分别进行了介绍,最后以一个实时录音并识别的小例子进行了收尾。 阅读全文
posted @ 2025-09-24 08:59 weiwei22844 阅读(1216) 评论(0) 推荐(5)
摘要:本文pytorch的入门系列文章第一篇,首先介绍了张量tensor这一基础内容,尤其详细介绍其关键概念自动求导autograd原理及简单应用。 阅读全文
posted @ 2025-09-15 15:12 weiwei22844 阅读(268) 评论(2) 推荐(0)
摘要:本文对较为成熟文生图模型Stable Diffusion的使用进行了总结,并结合实例复原了相应图片的生成过程,最后给出了API的调用方法,以支持在程序中实现批量自动化生成图片! 阅读全文
posted @ 2025-09-11 16:33 weiwei22844 阅读(1168) 评论(2) 推荐(2)
摘要:本文较为详细的介绍了OpenAI的开源语音转文字模型Whisper基本情况及安装过程,并介绍了它在处理音视频文件中语音时各种参数的详细用法,最后还介绍了如何使用python语言对该模型进行调用。 阅读全文
posted @ 2025-08-20 15:10 weiwei22844 阅读(949) 评论(0) 推荐(1)
摘要:本文详细介绍了GPT-SoVITS的安装过程,并结合一个应用实例介绍了它的使用方法,最后对其和IndexTTS进行了简单的对比。 阅读全文
posted @ 2025-07-26 23:12 weiwei22844 阅读(1114) 评论(0) 推荐(0)
摘要:本来详细介绍了开源语音生成项目index-tts在纯windows环境及WSL下的安装使用说明,其中在WSL下能通过GPU加速,实现高速语音生成。 阅读全文
posted @ 2025-07-21 12:32 weiwei22844 阅读(2314) 评论(2) 推荐(4)