基于文本环境下的强化学习算法:文本游戏环境下的强化学习的一些思考?文本比图像的抽象度更高,或许基于文本的强化学习算法更加强大
这里说一个个人的思考,那就是:
文本比图像的抽象度更高,或许基于文本的强化学习算法更加强大。
基于文本环境的强化学习算法一直被认为是比较小众的一个场景,一般认为文本的AI处理能力是不如图片的,尤其文本对事物描述的能力是十分有限的,但是随着ChatGPT-3.5的大火,或许这个状况得到了改写。
现在的资料显示,文本的描述和处理、总结能力已经得到了质的飞跃,使用文本的AI系统对场景进行描述已经具备了基础的技术条件,同时由于文本对事物的描述能力和抽象能力天然的在本质上要优于图像的,使用文本往往具有更强的抽象能力,因此尝试使用文本环境下的强化学习算法的研发或许是一个有前途的研究途径。
之前已经有了很多文本游戏环境的强化学习算法,虽然并不系统化,有些像Demo,但是毕竟也是有这方面的尝试,但是现在由于ChatGPT的能力,使用文本和图像结合,或者使用文本作为指令输入或人机接口来进行强化学习的训练可能是为更多人采用的途径。
但是,不管如何使用文本环境来训练强化学习算法,其目的都是利用文本AI的强大能力,而且个人也是比较看好这个赛道的,毕竟从本质上来讲文本是比图像具有更强的总结能力和抽象能力的,而且文本系统在强化学习系统重一直是处于缺失的地位的,如今ChatGPT的发展是足以带动这个方向的发展的。
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2024-01-31 17:08 Angry_Panda 阅读(34) 评论(0) 收藏 举报
浙公网安备 33010602011771号