2-20日至2月24日——一些尝试和下一步的计划

2月20日——2月22日尝试了各种绘画采样器在不同采样步骤和噪声强度下的效果,并制作了一份文档记录每一次测试
DDIM采样器可以尝试制作油画和童话绘本风格的图片———
部分采样器在低噪声强度下表现不佳,将在其他测试环境下再次测试。
绝大部分采样器在低噪声强度下没有表现出自己的特点,但在对图像的细节处理上各有优点。

2月20日制定了接下来的计划:
接下来打算利用3D建模训练交于AI处理后出大量图片后,再让AI学习,制作出针对单个人物的绘画模型。(建模已经完成,正在整理AI学习用的图片)
尝试了配音AI并用自己的声音经过变声处理后训练自己的模型,用于工作和生活。(还在研究)
打算在三月份MossAI开放源码后在本机部署并训练为自己工作上的助手,可以接入我目前使用的两个AI并将他们的输出结果回答给我。
2月23日——尝试训练配音AI的途中,运行.py文件直接闪退,网上的解决办法都试了一下,没有结果,我在电脑上自己写了一个Python文件,可以正常运行,查询过后,微软研发的tacotron2(包括它和以它为基础的延伸出的新AI在内一共尝试了5个AI,训练都是闪退)最低要求显卡为N卡,我的笔记本是A卡,打算后面换电脑了再试试,如果等不及了,就尝试一下云端训练。(一路下来也解决了不少问题,以为终于可以训练了,结果被这种低级的问题卡住..........)
目前利用已有的模型研究怎么让AI像人一样自然地说话。
开始训练绘画的模型。
2月24日——打不起精神,只是安装并学会了使用controlnet的插件,看了开发者写的一篇论文,对方的思维方式启发了我,我和SDai的交流方式不需要局限于当初开发团队发明的TAG模式,不能用文字说明白的东西,用其他方式说明就好,但或许是因为对方是国外的,抑或是高学历(斯坦福大学的毕业生)的人才的原因,他并没有受到我能接触到的网络环境的因素,真正地开发了这个AI的潜力,让它可以稳定地帮助人类设计出服饰,鞋子,室内装修的各种款式和图案,而保留其原本的结构不变,我由衷地认为他是个天才。这个AI刚面世的时候,网上就有一群人曲解了它的用途,用它不断生成好看但毫无用处的二次元图片,更有甚者称其为神明,将跑图称为召唤。只会依靠AI大量的创作只会产生一大堆电子垃圾,而不是艺术,AI更不是什么神明,而是人类的助手,是工具,提升工作的效率,帮助人类创作。
说个题外话,这个AI最初就可以生成3D的图片,但是我所接触的网络环境并不清楚这件事,现在他们又为AI生成的高质量3D图片而惊叹,认为3D的时代也要到来了。(当然我也不认为自己有多高尚,我应该和他们算是一类人吧...........。

还是挺迷茫的,估计今天就这样了。

posted @ 2023-02-24 19:10  apeiriaDolce  阅读(36)  评论(0编辑  收藏  举报