摘要: 增强学习与马尔科夫决策过程 2015年11月17日 增强学习与马尔科夫决策过程 写在前面 现有的机器学习算法根据模型的学习过程大致可以分为四类:监督式学习,无监督式学习,半监督式学习和增强学习。监督式学习是从标记好的训练数据中进行模型的训练,常用来做分类和回归,例如逻辑回归、反向神经网络;无监督式学 阅读全文
posted @ 2018-05-18 11:37 特洛伊-Micro 阅读(399) 评论(0) 推荐(0)