随笔分类 - AI
人工智能等相关前言技术
摘要:本文详细介绍了Stable Diffusion最强大的插件ControlNet的原理及典型应用,并介绍其安装及相关模型下载注意事项,最后还结合实例介绍了主要模型的使用方法。
阅读全文
摘要:FunASR是由阿里达摩院开发的开源语音识别工具包,本文首先简单介绍了其安装过程,然后对其几个主要功能分别进行了介绍,最后以一个实时录音并识别的小例子进行了收尾。
阅读全文
摘要:本文pytorch的入门系列文章第一篇,首先介绍了张量tensor这一基础内容,尤其详细介绍其关键概念自动求导autograd原理及简单应用。
阅读全文
摘要:本文对较为成熟文生图模型Stable Diffusion的使用进行了总结,并结合实例复原了相应图片的生成过程,最后给出了API的调用方法,以支持在程序中实现批量自动化生成图片!
阅读全文
摘要:本文较为详细的介绍了OpenAI的开源语音转文字模型Whisper基本情况及安装过程,并介绍了它在处理音视频文件中语音时各种参数的详细用法,最后还介绍了如何使用python语言对该模型进行调用。
阅读全文
摘要:本文详细介绍了GPT-SoVITS的安装过程,并结合一个应用实例介绍了它的使用方法,最后对其和IndexTTS进行了简单的对比。
阅读全文
摘要:本来详细介绍了开源语音生成项目index-tts在纯windows环境及WSL下的安装使用说明,其中在WSL下能通过GPU加速,实现高速语音生成。
阅读全文
浙公网安备 33010602011771号