摘要: 一、介绍 1、强化学习(reinforcement learning, RL)是人工智能(AI)的核心分支之一。 人工智能核心的分支有: 机器学习:一些经典的学习算法,例如线性回归、随机森林等,目前工业界主流已经很少单独使用 深度学习:通过神经网络进行学习 强化学习:通过试错进行学习 大模型:参数量 阅读全文
posted @ 2025-07-12 16:38 牧云文仔 阅读(42) 评论(0) 推荐(0)
摘要: 一、介绍 1、2014年提出Generative Adversarial Networks 2、基于博弈论,由生成器和判别器组成 3、目的:估测数据样本的潜在分布,并生成新的数据样本 4、其他生成网络:自回归模型、变分自编码VAE等 二、概念 1、生成器:根据真实数据的特征,生成假数据 2、判别器: 阅读全文
posted @ 2025-07-12 16:18 牧云文仔 阅读(23) 评论(0) 推荐(0)
摘要: 一、引入 1、机器翻译中,seq2seq,输入和输出都是序列,且输出长度不确定 2、RNN作为编码器和解码器,不能并行计算,效率低 3、2017年提出基于注意力机制的Transformer模型,解决RNN的问题 二、注意力机制 1、类似人类视觉,把注意力放在关键信息上,忽略不重要的信息 2、注意力机 阅读全文
posted @ 2025-07-12 15:33 牧云文仔 阅读(22) 评论(0) 推荐(0)
摘要: 一、引入 1、神经网络的实际使用中,会处理跟时序相关的数据 2、传统的神经网络,输入和输出独立,不能很好处理时序数据 3、1986年提出RNN 二、网络结构 1、3层:输入层、隐藏层、输出层 2、使用时,按时间线展开,特别注意:循环的不是隐藏层,而是整个3层结构 3、输入 2个:当前时刻的输入Xt, 阅读全文
posted @ 2025-07-12 11:23 牧云文仔 阅读(17) 评论(0) 推荐(0)