摘要:
一、目录: Distributed dynamic programming (as applied to path-planning problems). Distributed solutions to Markov Decision Problems (MDPs). Optimization a 阅读全文
摘要:
1. 马尔可夫模型的几类子模型 大家应该还记得马尔科夫链(Markov Chain),了解机器学习的也都知道隐马尔可夫模型(Hidden Markov Model,HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态无关。 马尔可 阅读全文
摘要:
机器学习算法大致可以分为三种: 1. 监督学习(如回归,分类) 2. 非监督学习(如聚类,降维) 3. 增强学习 什么是增强学习呢? 增强学习(reinforcementlearning, RL)又叫做强化学习,是近年来机器学习和智能控制领域的主要方法之一。 定义: Reinforcement le 阅读全文
摘要:
一、介绍及资料 强化学习介绍:http://www.cse.unsw.edu.au/~cs9417ml/RL1/introduction.html 强化学习博客站点:http://www.algorithmdog.com/ml/rl-series JS库: http://cs.stanford.ed 阅读全文
摘要:
demo 参见 MDP DEMO 本文是对 http://mnemstudio.org/path-finding-q-learning-tutorial.htm 的翻译,共分两部分,第一部分为中文翻译,第二部分为英文原文。翻译时为方便读者理解,有些地方采用了意译的方式,此外,原文中有几处笔误,在翻译 阅读全文
摘要:
一个问题由5部分组成:初始状态,行动集合,转移模型,目标测试函数,路径代价函数。问题的环境用状态空间表示。状态空间中从初始状态到达目标状态的路径是一个解。 可以从完备性、最优性、时间复杂度和空间复杂度等方面来评价一个搜索算法。 主要分为:无信息搜索策略(盲搜)、有信息搜索策略(启发式搜索) 无信息搜 阅读全文
摘要:
BIOS与CMOS的区别 : 1. 所谓BIOS,实际上就是微机的基本输入输出系统(Basic Input-Output System),其内容集成在微机主板上的一个ROM芯片上,主要保存着有关微机系统最重要的基本输入输出程序,系统信息设置、开机上电自检程序和系统启动自举程序等。 2. CMOS(本 阅读全文
摘要:
Spring-session & redis 子域名共享session 例子: a.example.com b.example.com spring 版本 4.2.6.RELEASE Spring-session Maven 依赖相关的包 Redis.xml 以上配置完后,分别启动 a tomcat 阅读全文