用寻常语言介绍神经网络
url=23jM13V3Qe9Zx84FuEMebOMbTSk4i0Oaa5YPAVL1dfbSFC4G20GYDkUbbRvcJILgTGliXHPQgZqx5ToZscEOt0Iwp4eT71mRZhZ64USYk63
用寻常语言介绍神经网络
(Neural Networks in Plain English)
由于我们没有能够非常好了解大脑。我们经常试图用最新的技术作为一种模型来解释它。
在我童年的时候,我们都坚信大脑是一部电话 交换机 。(否则它还能是什么呢?) 我当时还看到英国著名神经学家谢林顿把大脑的工作挺有趣地比作一部电报机。
更早些时候,弗罗伊德经常把大脑比作一部水力发电机。而莱布尼茨则把它比作了一台磨粉机。我还听人说,古希腊人把大脑功能想象为一付弹弓。显然,眼下要来比喻大脑的话,那仅仅可能是一台数字电子计算机了。 - John R.Searle [注1]
神经网络介绍 ( Introduction to Neural Networks )
曾有非常长一个时期,人工神经网络对我来说是全然神奇的东西。
当然。有关它们我在文献中已经读过了,我也能描写叙述它们的结构和工作机理。但我始终没有能“啊哈!”一声,如同你头脑中一个难于理解的概念有幸突然得到理解时的感觉那样。我的头上好象一直有个榔头在敲着,或者像电影Animal House(中文片名为“动物屋”)中那个在痛苦地尖叫“先生,谢谢您,再给我一个啊!
”的可怜家伙那样。
我无法把数学概念转换成实际的应用。有时我甚至想把我读过的全部神经网络的书的作者都抓起来。把他们缚到一棵树上。大声地向他们吼叫:“不要再给我数学了,快给我一点实际 东西吧!”。但无需说,这是永远不可能发生的事情。我不得不自己来填补这个空隙...由此我做了在那种条件下唯一能够做的事情。我開始干起来了。<一笑>
这样几个星期后。在一个漂亮的日子里。当时我在苏格兰海边度假,当我越过一层薄雾凝视着狭长的海湾时,我的头脑突然受到一个冲击。一下子悟到了人工神经网络是如何工作的。我得到“啊哈。”的感觉了!但我此时身边仅仅有一个帐篷和一个睡袋。还有半盒子的脆玉米片,没有电脑能够让我迅速写出一些代码来证实我的直觉。Arghhhhh。这时我才想到我应该买一台手提电脑。
无论如何。几天后我回到家了,我立马让我的手指在键盘上飞舞起来。几个小时后我的第一人工神经网络程序终于编成和执行了,而且工作得挺好!自然。代码写的有点乱。须要进行整理。但它确实已能工作了,而且,更重要的是,我还知道它为什么能工作!我能够告诉你。那天我是一位非常得意的人。
我希望本书传递给你的就是这样的“啊哈!”感觉。当我们学完遗传算法时,你可能已尝到了一点感觉,但你希望这样的感觉是美妙的话。那就要等把神经网络部分整个学完。
生物学的神经网络-大脑
(A Biological Neural Network–The Brain )
你的大脑是一块灰色的、像奶冻一样的东西。它并不像电脑中的CPU那样,利用单个的处理单元来进行工作。假设你有一具新奇地保存到福尔马林中的尸体。用一把锯子小心地将它的头骨锯开,搬掉头盖骨后,你就能看到熟悉的脑组织皱纹。大脑的外层象一个大核桃那样。全部都是起皱的[图0左] 。这一层组织就称皮层(Cortex)。假设你再小心地用手指把整个大脑从头颅中端出来,再去拿一把外科医生用的手术刀,将大脑切成片,那么你将看到大脑有两层[图0右] : 灰色的外层(这就是“灰质”一词的来源,但没有经过福尔马林固定的新奇大脑实际是粉红色的。) 和白色的内层。灰色层仅仅有几毫米厚,当中紧密地压缩着几十亿个被称作neuron(神经细胞、神经元)的微小细胞。白色层在皮层灰质的以下,占领了皮层的大部分空间。是由神经细胞相互之间的无数连接组成。
皮层象核桃一样起皱,这能够把一个非常大的表面区域塞进到一个较小的空间里。
这与光滑的皮层相比能容纳很多其它的神经细胞。人的大脑大约含有1OG(即100亿)个这样的微小处理单元;一仅仅蚂蚁的大脑大约也有250,OOO个。
以下表1 显示了人和几种动物的神经细胞的数目。
表l 人和几种动物的神经细胞的数目
动 物 种 类 经细胞的数目(数量级)
蜗 牛 10,000 (=10^4)
蜜 蜂 100,000 (=10^5)
蜂 雀 10,000,000 (=10^7)
老 鼠 100,000,000 (=10^8)
人 类 10,000,000,000 (=10^10)
大 象 100,000,000,000 (=10^11)
图0-1 大脑半球像核桃 图0-2 大脑皮层由灰质和白质组成
图0 大脑的外形和切片形状
图1 神经细胞的结构
在人的生命的最初9个月内,这些细胞以每分钟25,000个的惊人速度被创建出来。
神经细胞和人身上不论什么其它类型细胞十分不同,每一个神经细胞都长着一根像电线一样的称为轴突(axon)的东西。它的长度有时伸展到几厘米[译注],用来将信号传递给其它的神经细胞。神经细胞的结构如图1 所看到的。
它由一个细胞体(soma)、一些树突(dendrite) 、和一根能够非常长的轴突组成。神经细胞体是一颗星状球形物。里面有一个核(nucleus)。树突由细胞体向各个方向长出,本身可有分支,是用来接收信号的。轴突也有很多的分支。轴突通过分支的末梢(terminal)和其它神经细胞的树突相接触,形成所谓的突触(Synapse。图中未画出),一个神经细胞通过轴突和突触把产生的信号送到其它的神经细胞。
每一个神经细胞通过它的树突和大约10,000个其它的神经细胞相连。这就使得你的头脑中全部神经细胞之间连接总计可能有l,000,000,000,000,000个。
这比100兆个现代电话交换机的连线数目还多。
所以毫不奇怪为什么我们有时会产生头疼毛病!
有趣的事实
曾经有人估算过,假设将一个人的大脑中全部神经细胞的轴突和树突依次连接起来,并拉成一根直线,可从地球连到月亮。再从月亮返回地球。假设把地球上全部人脑的轴突和树突连接起来,则能够伸展到离开们近期的星系!
神经细胞利用电-化学过程交换信号。输入信号来自还有一些神经细胞。这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse)。信号就从树突上的突触进入本细胞。信号在大脑中实际如何传输是一个相当复杂的过程,但就我们而言。重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也仅仅有两种状态:兴奋(fire)和不兴奋(即抑制)。
发射信号的强度不变,变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把全部从树突上突触进来的信号进行相加。假设全部信号的总和超过某个阀值。就会激发神经细胞进入兴奋(fire)状态。这时就会有一个电信号通过轴突发送出去给其它神经细胞。
假设信号总和没有达到阀值。神经细胞就不会兴奋起来。
这样的解释有点过分简单化,但已能满足我们的目的。
神经细胞利用电-化学过程交换信号。
输入信号来自还有一些神经细胞。这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse)。信号就从树突上的突触进入本细胞。信号在大脑中实际如何传输是一个相当复杂的过程。但就我们而言。重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也仅仅有两种状态:兴奋(fire)和不兴奋(即抑制)。发射信号的强度不变。变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把全部从树突上突触进来的信号进行相加,假设全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋(fire)状态,这时就会有一个电信号通过轴突发送出去给其它神经细胞。
假设信号总和没有达到阀值,神经细胞就不会兴奋起来。这样的解释有点过分简单化,但已能满足我们的目的。
正是由于数量巨大的连接,使得大脑具备难以置信的能力。虽然每一个神经细胞仅仅工作于大约100Hz的频率,但因各个神经细胞都以独立处理单元的形式并行工作着。使人类的大脑具有以下这些非常明显的特点:
能实现无监督的学习。 有关我们的大脑的难以置信的事实之中的一个。就是它们能够自己进行学习。而不须要导师的监督教导。假设一个神经细胞在一段时间内受到高频率的刺激。则它和输入信号的神经细胞之间的连接强度就会按某种过程改变。使得该神经细胞下一次受到激励时更easy兴奋。这一机制是50多年曾经由Donard Hebb在他写的Organination of Behavior一书中阐述的。他写道:
“当神经细胞 A的一个轴突反复地或持久地激励还有一个神经细胞B后,则当中的一个或同一时候两个神经细胞就会发生一种生长过程或新陈代谢式的变化。使得激励B细胞之中的一个的A细胞的效能会添加”
与此相反的是,假设一个神经细胞在一段时间内不受到激励,那么它的连接的有效性就会慢慢地衰减。这一现象就称可塑性(plasticity)。
对损伤有冗余性(tolerance)。
大脑即使有非常大一部分受到了损伤,它仍然能够执行复杂的工作。
一个著名的试验就是训练老鼠在一个迷宫中行走。然后。科学家们将其大脑一部分一部分地、越来越大地加以切除。
他们发现。即使老鼠的非常大的一部大脑被切除后。它们仍然能在迷宫中找到行走路径。这一事实证明了,在大脑中。知识并非保存在一个局部地方。另外所作的一些试验则表明。假设大脑的一小部分受到损伤,则神经细胞能把损伤的连接又一次生长出来。
处理信息的效率极高。 神经细胞之间电-化学信号的传递。与一台数字计算机中CPU的传输数据相比,速度是非常慢的,但因神经细胞採用了并行的工作方式,使得大脑能够同一时候处理大量的数据。比如。大脑视觉皮层在处理通过我们的视网膜输入的一幅图象信号时。大约仅仅要100ms的时间就能完毕。考虑到你的神经细胞的平均工作频率仅仅有100Hz,100ms的时间就意味仅仅能完毕10个计算步骤!
想一想通过我们眼睛的数据量有多大,你就能够看到这真是一个难以置信的伟大project了。
善于归纳推广。 大脑和数字计算机不同。它极擅长的事情之中的一个就是模式识别,并能依据已熟悉信息进行归纳推广(generlize)。
比如,我们能够阅读他人所写的手稿上的文字,即使我们曾经从来没见过他所写的东西。
它是有意识的。
意识(consciousness)是神经学家和人工智能的研究者广泛而又热烈地在辩论的一个话题。
有关这一论题已有大量的文献出版了,但对于意识实际到底是什么。至今尚未取得实质性的统一看法。我们甚至不能同意仅仅有人类才有意识,或者包括动物王国中人类的近亲在内才有意识。一头猩猩有意识吗?你的猫有意识吗?上星期晚餐中被你吃掉的那条鱼有意识吗?
因此。一个人工神经网络(Artificial neural network,简称ANN)就是要在当代数字计算机现有规模的约束下,来模拟这样的大量的并行性,并在实现这一工作时。使它能显示很多和生物学大脑相类似的特性。
以下就让我们瞧瞧它们的表演吧!
***************************************************************888
(连载之二)
3 数字版的神经网络 (The Digital Version)
上面我们看到了生物的大脑是由很多神经细胞组成,相同,模拟大脑的人工神经网络ANN是由很多叫做人工神经细胞(Artificial neuron,也称人工神经原,或人工神经元)的细小结构模块组成。人工神经细胞就像真实神经细胞的一个简化版。但採用了电子方式来模拟实现。一个人工神经网络中须要使用多少个数的人工神经细胞,区别能够非常大。有的神经网络仅仅须要使用10个以内的人工神经细胞。而有的神经网络可能须要使用几千个人工神经细胞。
这全然取决于这些人工神经网络准备实际用来做什么。
有趣的事实
有一个叫 Hugo de Garis的同行。曾在一个雄心勃勃的project中创建并训练了一个包括1000,000,000个人工神经细胞的网络。这个人工神经网络被他非常巧妙地建立起来了,它採用蜂房式自己主动机结构,目的就是为一机器客户定制一个叫做CAM BrainMachine(“CAM大脑机器”) 的机器(CAM就是Cellular Automata Machine的缩写)。此人曾自夸地宣称这一人工网络机器将会有一仅仅猫的智能。很多神经网络研究人员觉得他是在“登星”了。但不幸的是,雇用他的公司在他的梦想尚未实现之前就破产了。
此人如今犹他州,是犹他州大脑project(Utah Brain Project)的领导。时间将会告诉我们他的思想终于能否变成实际有意义的东西。[译注]
我想你如今可能非常想知道,一个人工神经细胞到底是一个什么样的东西?可是,它实际上什么东西也不像; 它仅仅是一种抽象。还是让我们来察看一下图2吧。这是表示一个人工神经细胞的一种形式。
[译注]Hugo de Garis如今为犹他州立大学教授,有关他和他的CAM机器,可在该校站点的一个网页上看到报道,其上有真实的照片。 见http://www.cs.usu.edu/~degaris
图2 一个人工神经细胞
图中,左边几个灰底圆中所标字母w代表浮点数。称为权重(weight,或权值,权数)。进入人工神经细胞的每一个input(输入)都与一个权重w相联系,正是这些权重将决定神经网络的总体活跃性。
你如今临时能够设想全部这些权重都被设置到了-1和1之间的一个随机小数。由于权重可正可负,故能对与它关联的输入施加不同的影响,假设权重为正,就会有激发(excitory)作用,权重为负,则会有抑制(inhibitory)作用。当输入信号进入神经细胞时,它们的值将与它们相应的权重相乘,作为图中大圆的输入。大圆的‘核’是一个函数,叫激励函数(activation function),它把全部这些新的、经过权重调整后的输入全部加起来。形成单个的激励值(activation value)。
激励值也是一浮点数,且相同可正可负。然后,再依据激励值来产生函数的输出也即神经细胞的输出:假设激励值超过某个阀值(作为样例我们假设阀值为1.0),就会产生一个值为1的信号输出;假设激励值小于阀值1.0,则输出一个0。这是人工神经细胞激励函数的一种最简单的类型。在这里。从激励值产生输出值是一个阶跃函数[译注]。
看一看图3后你就能猜到为什么有这样的名称。
图3 阶跃激励函数
[译注] 由图可知阶跃函数是一元的,而激励函数既然能把多个输入相加应为多元,故需加以区别。
假设到眼下为止你对这些还没有获得非常多感觉,那也不必操心。窍门就是: 不要企图去感觉它,临时就随波逐流地跟我一起向前走吧。
在经历本章的若干处后,你终于就会開始弄清楚它们的意义。而如今。就放松一点继续读下去吧。
3.1 如今须要一些数学了(Now for Some Math)
今后讨论中。我将尽量把数学降低到绝对少量,但学习一些数学记号对以下还是非常实用的。我将把数学一点一点地喂给你,在到达有关章节时向你介绍一些新概念。我希望採用这样的方式能使你的头脑能更舒适地吸收全部的概念,并使你在开发神经网络的每一个阶段都能看到如何把数学应用到工作中。
如今首先让我们来看一看。如何把我在此之前告诉你的全部知识用数学方式表达出来。
一个人工神经细胞(从如今開始,我将把“人工神经细胞”简称它为“神经细胞”) 能够有随意n个输入,n代表总数。能够用以下的数学表达式来代表全部n个输入:
x1, x2, x3, x4, x5, ..., xn
相同 n 个权重可表达为:
w1, w2, w3, w4, w5 ..., wn
请记住。激励值就是全部输入与它们相应权重的之乘积之总和,因此,如今就能够写为:
a = w1x1 + w2x2 + w3x3 + w4x4 + w5x5 +...+ wnxn
以这样的方式写下的求和式,我在第5章“建立一个更好的遗传算法”中已提到,能够用希腊字母Σ来简化:
注:
神经网络的各个输入,以及为各个神经细胞的权重设置,都能够看作一个n维的向量。你在很多技术文献中经常能够看到是以这样的方式来引用的。
以下我们来考察在程序中应该如何实现?假设输入数组和权重数组均已初始化为x[n]和w[n],则求和的代码例如以下:
double activation = 0;
for(int i=0; i<n; ++i)
{
activation += x[i] * w[i];
}
图4以图形的方式表示了此方程。
请别忘记,假设激励值超过了阀值,神经细胞就输出1; 假设激活小于阀值,则神经细胞的输出为0。这和一个生物神经细胞的兴奋和抑制是等价的。
我们假设一个神经细胞有5个输入,他们的权重w都初始化成正负1之间的随机值(-1 < w < 1) 。
表2说明了激励值的求和计算过程。
图4 神经细胞的激励函数
假设我们假定激活所需阀值=1。则因激励值1.1 > 激活阀值1,所以这个神经细胞将输出1。
在进一步读下去之前,请你一定要确切弄懂激励函数如何计算。
表2 神经细胞激励值的计算
3.2 行。我知道什么是神经细胞了,但用它来干什么呢?
大脑里的生物神经细胞和其它的神经细胞是相互连接在一起的。为了创建一个人工神经网络。人工神经细胞也要以相同方式相互连接在一起。为此能够有很多不同的连接方式,当中最easy理解而且也是最广泛地使用的。就是如图5所看到的那样。把神经细胞一层一层地连结在一起。
这一种类型的神经网络就叫前馈网络(feedforword network)。这一名称的由来。就是由于网络的每一层神经细胞的输出都向前馈送(feed)到了它们的下一层(在图中是画在它的上面的那一层),直到获得整个网络的输出为止。
图5 一个前馈网络
由图可知,网络共同拥有三层(译注:输入层不是神经细胞,神经细胞仅仅有两层)。输入层中的每一个输入都馈送到了隐藏层,作为该层每一个神经细胞的输入。然后,从隐藏层的每一个神经细胞的输出都连到了它下一层(即输出层)的每一个神经细胞。图中仅仅画了一个隐藏层,作为前馈网络,一般地能够有随意多个隐藏层。
但在对付你将处理的大多数问题时一层一般是足够的。其实,有一些问题甚至根本不须要不论什么隐藏单元。你仅仅要把那些输入直接连结到输出神经细胞即可了。另外,我为图5选择的神经细胞的个数也是全然随意的。每一层实际都能够有不论什么数目的神经细胞。这全然取决于要解决的问题的复杂性。但神经细胞数目愈多。网络的工作速度也就愈低,由于这一缘故,以及为了其它的几种原因(我将在第9章作出解释),网络的规模总是要求保持尽可能的小。
到此我能想象你也许已对全部这些信息感到有些茫然了。
我觉得,在这样的情况下,我能做的最好的事情,就是向你介绍一个神经网络在现实世界中的实际应用样例,它有望使你自己的大脑神经细胞得到兴奋!不错吧?好的,以下就来了...
你可能已听到或读到过神经网络经常常使用来作模式识别。
这是由于它们善于把一种输入状态(它所企图识别的模式)映射到一种输出状态(它曾被训练用来识别的模式)。
以下我们来看它是怎么完毕的。我们以字符识别作为样例。设想有一个由8x8个格子组成的一块面板。每一个格子里放了一个小灯,每一个小灯都可独立地被打开(格子变亮)或关闭(格子变黑),这样面板就能够用来显示十个数字符号。图6显示了数字“4”。
图6 用于字符显示的矩阵格点
要解决这一问题。我们必需设计一个神经网络。它接收面板的状态作为输入。然后输出一个1或0。输出1代表ANN确认已显示了数字“4”,而输出0表示没有显示“4”。
因此,神经网络须要有64个输入(每一个输入代表面板的一个详细格点) 和由很多神经细胞组成的一个隐藏层,还有仅有一个神经细胞的输出层,隐藏层的全部输出都馈送到它。
我真希望你能在你的头脑中画出这个图来。由于要我为你把全部这些小圆和连线统统画出来确实不是一桩愉快的事<一笑>。
一旦神经网络体系创建成功后,它必须接受训练来认出数字“4”。为此可用这样一种方法来完毕:先把神经网的全部权重初始化为随意值。然后给它一系列的输入,在本例中。就是代表面板不同配置的输入。对每一种输入配置。我们检查它的输出是什么,并调整相应的权重。
假设我们送给网络的输入模式不是“4”, 则我们知道网络应该输出一个0。因此每一个非“4”字符时的网络权重应进行调节,使得它的输出趋向于0。当代表“4”的模式输送给网络时。则应把权重调整到使输出趋向于1。
假设你考虑一下这个网络,你就会知道要把输出添加到10是非常easy的。然后通过训练,就能够使网络能识别0到9 的全部数字。
但为什么我们到此停止呢?我们还能够进一步添加输出,使网络能识别字母表中的全部字符。这本质上就是手写体识别的工作原理。对每一个字符,网络都须要接受很多训练,使它认识此文字的各种不同的版本号。
到最后,网络不单能认识已经训练的笔迹,还显示了它有显著的归纳和推广能力。也就是说。假设所写文字换了一种笔迹,它和训练集中全部字迹都略有不同,网络仍然有非常大几率来认出它。正是这样的归纳推广能力。使得神经网络已经成为能够用于无数应用的一种无价的工具。从人脸识别、医学诊断,直到跑马赛的预測,另外还有电脑游戏中的bot(作为游戏角色的机器人)的导航。或者硬件的robot(真正的机器人)的导航。
这样的类型的训练称作有监督的学习(supervised learnig),用来训练的数据称为训练集(training set)。调整权重能够採用很多不同的方法。
对本类问题最经常使用的方法就是反向传播(backpropagation。简称backprop或BP)方法。
有关反向传播问题。我将会在本书的后面,当你已能训练神经网络来识别鼠标走势时,再来进行讨论。在本章剩余部分我将集中注意力来考察另外的一种训练方式。即根本不须要不论什么导师来监督的训练,或称无监督学习(unsupervised learnig)。
这样我已向你介绍了一些主要的知识。如今让我们来考察一些有趣的东西,并向你介绍第一个代码project。
(连载之三)
4. 聪明的扫雷机project(Smart Minesweeper Project)
我要向你介绍的第一个完整样例。是怎么使用神经网络来控制具有人工智能的扫雷机的行为。
扫雷机工作在一个非常easy的环境中,那里仅仅有扫雷机以及随机散布的很多地雷。
图7 执行中的演示程序。
虽然书上图形画成了黑白色。但当你执行程序时性能最好的扫雷机将显现为红色。地雷,你可能已经猜到,就是那些小方形。project的目标是创建一个网络,它不须要从我们这里得到不论什么帮助。就能自己进行演化(evolve)去寻找地雷。
为了实现这一功能。网络的权重将被编码到基因组中,并用一个遗传算法来演化它们。
怎么样。非常酷吧?
提示(重要)
假设你跳过前面的一些章节来到这里,而你又不了解如何使用遗 传算法,则在进一步阅读以下的内容之前,你应回到前面去补读一下有关遗传算法的内容。
首先让我解释人工神经网络(ANN)的体系结构。我们须要决定输入的数目、输出的数目、还有隐藏层和每一个隐藏层中隐藏单元的数目。
4.1 选择输出(Choosing the Outputs)
那么,人工神经网络如何控制扫雷机的行动呢?非常好!
我们把扫雷机想象成和坦克车一样。通过左右2个能转动的履带式轮轨(track)来行动的。见图案9.8。
图8 扫雷机的控制
扫雷机向前行进的速度,以及向左、向右转弯的角度。都是通过改变2个履带轮的相对速度来实现的。因此,神经网络须要2个输入。1个是左側履带轮的速度,还有一个是右側履带轮的速度。
啊,可是..., 我听见你在嘀咕了。
假设网络仅仅能输出一个1或一个0。我们怎么能控制车轨移动的快慢呢? 你是对的;假设利用曾经描写叙述的阶跃函数来决定输出。我们就根本无法控制扫雷机实际移动。幸好,我有一套戏法。让我卷起袖子来。把激励函数的输出由阶跃式改变成为在0-1之间连续变化的形式,这样就能够供扫雷机神经细胞使用了。为此,有几种函数都能做到这样。我们使用的是一个被称为逻辑斯蒂S形函数(logistic sigmoid function)[译注1]。该函数所实现的功能,本质上说。就是把神经细胞原有的阶跃式输出曲线钝化为一光滑曲线。后者绕y轴0.5处点对称[译注2]。如图9所看到的。
[译注1] logistic有’计算的’或’符号逻辑的’等意思在内,和’逻辑的(logic)’意义不同。
[译注2] 点对称图形绕对称点转180度后能与原图重合。
若f(x)以原点为点对称,则有f(-x)=-f(x)
图9 S形曲线。
当神经细胞的激励值趋于正、负无穷时,S形函数分别趋于1或0。负的激励值相应的函数值都<0.5; 正激励值相应的函数值都>0.5。S形函数用数学表达式写出来则为:
这个方程看上去可能会恐吓一些人,但其实非常easy。e是数学常数,近似等于2.7183。a是神经细胞的激励值,它是函数的自变量。而p是一个用来控制曲线形状变化快慢或陡峭性的參数。p通常设定为1。当p赋以较大值时,曲线就显得平坦,反之,就会使曲线变为陡峭。见图1O。非常低的p值所生成的函数就和阶跃函数近似。P值的大小用来控制何时使神经网络由低变高開始翻转有非常大作用。可是在本样例中我们将它保持为1。
注:“S型”的英文原名Sigmoid 或Sigmoidal 原来是依据希腊字“Sigma”得来的。但非常巧它也能够说成是曲线的一种形状。
图7。10 不同的S形响应曲线。
4.2 选择输入(Choosing the Inputs)
上面我们已经把输出安排好了,如今我们来考虑输入。确定网络须要什么样的输入?为此,我们必须想象一下扫雷机的详细细节:须要什么样的信息才干使它朝地雷前进?你可能想到的第一个输入信息清单是:
扫雷机的位置(x1,y1)
与扫雷机最靠近的地雷的位置(x2,y2)
代表扫雷机前进方向的向量(x3,y3)
这样一共得到6个输入。
可是,要网络使用这些输入,工作起来就非常困难。由于。网络在像我们希望的那样执行工作之前,必须寻找全部6个输入之间的数学关系。而这有相当工作量。
能够把此作为一个练习倒是非常理想的:去试试如何给出最少数量的输入而仍能为网络传达解决这个问题所须要的全部信息。
你的网络使用的输入愈少,网络所要求的神经细胞数目也愈少。
而较少的神经细胞就意味更高速的训练和更少的计算,有利于网络更高速度的工作。
仅仅要作少量的额外考虑,就能够把输入的个数降低为4。这就是图11中所画出的两个向量的4个參数。
把神经网络的全部输入进行规范化是一种好想法。这里的意思并非说每一个输入都要改变大小使它们都在0~1间,而是说每一个输入应该受到同等重视。比如,拿我们已经讨论过的扫雷机输入为例。
瞄准向量或视线向量(look-at vector)总是一个规范化向量,即长度等于1,分量x和y都在0~1间。但从扫雷机到达其近期地雷的向量就可能非常大。当中的一个分量甚至有可能和窗口的宽度或高度一样大。假设这个数据以它的原始状态输入到网络。网络对有较大值的输入将显得更灵敏,由此就会使网络性能变差。因此,在信息输入到神经网络中去之前。数据应预先定比(scaled)和标准化(standardized),使它们大小类似(similar)。在本特例中,由扫雷机引到与其最接近地雷的向量须要进行规范化(normalized)。
这样能够使扫雷机的性能得到改良。
图11 选择输入。
小技巧:
有时,你把输入数据又一次换算(rescale)一下。使它以0点为中心。就能从你的神经网络获得最好的性能。这一小窍门在你设计网络时永远值得一试。
但我在扫雷机project中没有採用这一方法,这是由于我想使用一种更直觉的方法。
4.3 隐藏的神经细胞要多少?(How many Hidden Neurons?)
到此我们已把输入、输出神经细胞的数目和种类确定下来了,下一步是确定隐藏层的数目。并确定每一个隐藏层中神经细胞必须有多少?但遗憾的是,还没有一种确切的规则可用来计算这些。它们的开发又须要凭个人的“感觉”了。
某些书上和文章中确实给过一些提纲性的东西,告诉你如何去决定隐藏神经细胞个数,但业内专家们的一致看法是:你仅仅能把不论什么建议当作不可全信的东西,主要还要靠自己的不断尝试和失败中获得经验。但你一般会发现,你所遇到的大多数问题都仅仅要用一个隐藏层就能解决。
所以,本领的高低就在于如何为这一隐藏层确定最合适的神经细胞数目了。
显然,个数是愈少愈好,由于我前面已经提及,数目少的神经细胞能够造就高速的网络。通常,为了确定出一个最优总数,我总是在隐藏层中採用不同数目的神经细胞来进行试验。我在本章所编写的神经网络project的.
第一版本号中一共使用了10个隐藏神经细胞(当然,我的这个数字也不一定是最好的<一笑>)。你应围绕这个数字的附近来做游戏,并观察隐藏层神经细胞的数目对扫雷机的演化会产生什么样的影响。无论如何,理论已经够了。让我们拿一个详细程序来看看吧。你能够在本书所附光盘的Chapter7/Smart Sweepers v1.0文件夹中找到本章以下几页即将描写叙述的全部程序的源代码。
(连载之四)
4.4 CNeuralNet.h(神经网络类的头文件)
在CNeuralNet.h 文件里,我们定义了人工神经细胞的结构、定义了人工神经细胞的层的结构、以及人工神经网络本身的结构。首先我们来考察人工神经细胞的结构。
4.4.1 SNeuron(神经细胞的结构)
这是非常easy的结构。人工神经细胞的结构中必须有一个正整数来纪录它有多少个输入,还须要有一个向量std:vector来表示它的权重。
请记住,神经细胞的每一个输入都要有一个相应的权重。
Struct SNeuron
{
// 进入神经细胞的输入个数
int m_NumInputs;
// 为每一输入提供的权重
vector<double> m_vecWeight;
//构造函数
SNeuron(int NumInputs);
};
以下就是SNeuron 结构体的构造函数形式:
SNeuron::SNeuron(int NumInputs): m_NumInputs(NumInputs+1)
(
// 我们要为偏移值也附加一个权重,因此输入数目上要 +1
for (int i=0; i<NumInputs+1; ++i)
{
// 把权重初始化为随意的值
m_vecWeight.push_back(RandomClamped());
}
}
由上能够看出,构造函数把送进神经细胞的输入数目NumInputs作为一个变元,并为每一个输入创建一个随机的权重。全部权重值在-1和1之间。
这是什么? 我听见你在说。这里多出了一个权重! 不错。我非常高兴看到你能注意到这一点,由于这一个附加的权重十分重要。但要解释它为什么在那里,我必须很多其它地介绍一些数学知识。回顾一下你就能记得。激励值是全部输入*权重的乘积的总和,而神经细胞的输出值取决于这个激励值是否超过某个阀值(t)。这能够用例如以下的方程来表示:
w1x1 + w2x2 + w3x3 +...+ wnxn >= t
上式是使细胞输出为1的条件。由于网络的全部权重须要不断演化(进化),假设阀值的数据也能一起演化。那将是非常重要的。
要实现这一点不难。你使用一个简单的诡计就能够让阀值变成权重的形式。从上面的方程两边各减去t。得:
w1x1 + w2x2 + w3x3 +...+ wnxn –t >= 0
这个方程能够再换用一种形式写出来,例如以下:
w1x1 + w2x2 + w3x3 +...+ wnxn + t *(–1) >= 0
到此,我希望你已能看出。阀值t为什么能够想像成为始终乘以输入为 -1的权重了。
这个特殊的权重通常叫偏移(bias)。这就是为什么每一个神经细胞初始化时都要添加一个权重的理由。如今,当你演化一个网络时,你就不必再考虑阀值问题,由于它已被内建在权重向量中了。
怎么样,想法不错吧?为了让你心中绝对敲定你所学到的新的人工神经细胞是什么样子。请再參看一下图12。
图12 带偏移的人工神经细胞。
4.4.2 SNeuronLayer(神经细胞层的结构)
神经细胞层SNeuronLayer的结构非常easy。它定义了一个如图13中所看到的的由虚线包围的神经细胞SNeuron所组成的层。
图13 一个神经细胞层。
以下就是层的定义的源代码,它应该不再须要不论什么进一步的解释:
struct SNeuronLayer
{
// 本层使用的神经细胞数目
int m_NumNeurons;
// 神经细胞的层
vector<SNeuron> m_vecNeurons;
SNeuronLayer(int NumNeurons, int NumInputsPerNeuron);
}。
4.4.3 CNeuralNet(神经网络类)
这是创建神经网络对象的类。让我们来通读一下这一个类的定义:
class CNeuralNet
{
private:
int m_NumInputs;
int m_NumOutputs;
int m_NumHiddenLayers;
int m_NeuronsPerHiddenLyr;
// 为每一层(包括输出层)存放全部神经细胞的存储器
vector<SNeuronLayer> m_vecLayers;
全部private成员由其名称easy得到理解。须要由本类定义的就是输入的个数、输出的个数、隐藏层的数目、以及每一个隐藏层中神经细胞的个数等几个參数。
public:
CNeuralNet();
该构造函数利用ini文件来初始化全部的Private成员变量,然后再调用CreateNet来创建网络。
// 由SNeurons创建网络
void CreateNet();
我过一会儿立即就会告诉你这个函数的代码。
// 从神经网络得到(读出)权重
vector<double> GetWeights()const;
由于网络的权重须要演化,所以必须创建一个方法来返回全部的权重。
这些权重在网络中是以实数型向量形式表示的,我们将把这些实数表示的权重编码到一个基因组中。当我開始谈论本project的遗传算法时。我将为您确切说明权重如何进行编码。
// 返回网络的权重的总数
int GetNumberOfWeights()const;
// 用新的权重取代原有的权重
void PutWeights(vector<double> &weights);
这一函数所做的工作与函数GetWeights所做的正好相反。
当遗传算法执行完一代时,新一代的权重必须又一次插入神经网络。为我们完毕这一任务的是PutWeight方法。
// S形响应曲线
inline double Sigmoid(double activation, double response);
当已知一个神经细胞的全部输入*重量的乘积之和时,这一方法将它送入到S形的激励函数。
// 依据一组输入,来计算输出
vector<double> Update(vector<double> &inputs);
对此Update函数函数我立即就会来进行凝视的。
}; // 类定义结束
4.4.3.1 CNeuralNet::CreateNet(创建神经网络的方法)
我在前面没有对CNeuralNet的2个方法加以凝视。这是由于我要为你显示它们的更完整的代码。
这2个方法的第一个是网络创建方法CreateNet。它的工作就是把由细胞层SNeuronLayers所收集的神经细胞SNeurons聚在一起来组成整个神经网络,代码为:
void CNeuralNet::CreateNet()
{
// 创建网络的各个层
if (m_NumHiddenLayers > 0)
{
//创建第一个隐藏层[译注]
m_vecLayers.push_back(SNeuronLayer(m_NeuronsPerHiddenLyr,
m_NumInputs));
for( int i=O; i<m_NumHiddenLayers-l; ++i)
{
m_vecLayers.push_back(SNeuronLayer(m_NeuronsPerHiddenLyr,
m_NeuronsPerHiddenLyr));
}
[译注] 假设同意有多个隐藏层,则由接着for循环即能创建其余的隐藏层。
// 创建输出层
m_vecLayers.push_back(SNeuronLayer(m_NumOutput,m_NeuronsPerHiddenLyr));
}
else //无隐藏层时。仅仅需创建输出层
{
// 创建输出层
m_vecLayers.push_back(SNeuronLayer(m_NumOutputs, m_NumInputs));
}
}
4.4.3.2 CNeuralNet::Update(神经网络的更新方法)
Update函数(更新函数)称得上是神经网络的“主要劳动力”了。
这里,输入网络的数据input是以双精度向量std::vector的数据格式传递进来的。Update函数通过对每一个层的循环来处理输入*权重的相乘与求和,再以所得的和数作为激励值。通过S形函数来计算出每一个神经细胞的输出,正如我们前面最后几页中所讨论的那样。Update函数返回的也是一个双精度向量std::vector。它相应的就是人工神经网络的全部输出。
请你自己花两分钟或几乎相同的时间来熟悉一下例如以下的Update函数的代码,这能使你正确理解我们继续要讲的其它内容:
vector<double> CNeuralNet::Update(vector<double> &inputs)
{
// 保存从每一层产生的输出
vector<double> outputs;
int cWeight = 0;
// 首先检查输入的个数是否正确
if (inputs.size() != m_NumInputs)
{
// 假设不对。就返回一个空向量
return outputs;
}
// 对每一层,...
for (int i=0; i<m_NumHiddenLayers+1; ++i)
{
if (i>O)
{
inputs = outputs;
}
outputs.clear();
cWeight = 0;
// 对每一个神经细胞,求输入*相应权重乘积之总和。
并将总和抛给S形函数,以计算输出
for (int j=0; j<m_vecLayers[i].m_NumNeurons; ++j)
{
double netinput = 0;
int NumInputs = m_vecLayers[i].m_vecNeurons[j].m_NumInputs;
// 对每一个权重
for (int k=O; k<NumInputs-l; ++k)
{
// 计算权重*输入的乘积的总和。
netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[k] *
inputs[cWeight++];
}
// 添加偏移值
netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[NumInputs-1] *
CParams::dBias;
别忘记每一个神经细胞的权重向量的最后一个权重实际是偏移值。这我们已经说明过了。我们总是将它设置成为 –1的。
我已经在ini文件里包括了偏移值。你能够围绕它来做文章,考察它对你创建的网络的功能有什么影响。只是,这个值一般是不应该改变的。
// 每一层的输出。当我们产生了它们后。我们就要将它们保存起来。
但用Σ累加在一起的
// 激励总值首先要通过S形函数的过滤。才干得到输出
outputs.push_back(Sigmoid(netinput,CParams::dActivationResponse)); cWeight = 0:
}
}
return outputs;
}
(连载之五)
4.5 神经网络的编码(Encoding the Network )
在本书的開始几章中,你已经看到过如何用各种各样的方法为遗传算法编码。
但当时我并没有向你介绍过一个用实数编码的详细样例,由于我知道我要留在这里向你介绍。
我曾经讲到。为了设计一个前馈型神经网络,编码是非常easy的。
我们从左到右读每一层神经细胞的权重,读完第一个隐藏层。再向上读它的下一层,把所读到的数据依次保存到一个向量中,这样就实现了网络的编码。因此,假设我们有图14所看到的的网络,则它的权重编码向量将为:
0.3, -O.8, -O.2。 0.6, O.1, -0.l, 0.4, 0.5
在这一网络中,为了简单,我没有把偏移值的权重包括进去。但在实际实现编码时,你必须包括偏移值这个权重。否则你肯定无法获得你所须要的结果。
图14 为权重编码。
在此之前讲的事情你都懂了吗?好极了。那以下就让我们转来考虑,如何用遗传算法来操纵已编码的基因吧。
4.6 遗传算法(The Genetic Algorithm )
到此,全部的权重已经象二进制编码的基因组那样,形成了一个串。我们就能够象本书早先讨论过的那样来应用遗传算法了。遗传算法(GA)是在扫雷机已被同意依照用户指定的帧数(为了某种缘故, 我以下更喜欢将帧数称作滴答数。英文是ticks)运转后执行的。你能够在ini文件里找到这个滴答数(iNumTicks)的设置。
以下是基因组结构体的代码。这些对于你应该是十分面熟的东西了。
Struct SGenome
{
vector <double> vecWeights;
double dFitness;
SGenome():dFitness(0) {}
SGenome(vector <double> w, double f):vecWeights(w),dFitness(f){}
//重载'<'的排序方法
friend bool operator<(const SGenome& lhs, const SGenome& rhs)
{
return (lhs.dFitness < rhs.dFitness);
}
};
从上面的代码你可看出。这一SGenome结构和我们在本书全部其它地方见到的SGenome结构差点儿全然一致,唯一的区别就是这里的染色体是一个双精度向量std::vector。
因此,能够和通常一样来应用杂交操作和选择操作。但突变操作则略微有些不同。这里的权重值是用一个最大值为dMaxPerturbation的随机数来搔扰的。这一參数dMaxPerturbation在ini文件里已作了声明。另外,作为浮点数遗传算法。突变率也被设定得更高些。
在本project中,它被设成为0.1。
以下就是扫雷机project遗传算法类中所见到的突变函数的形式:
void CGenAlg::Mutate(vector<double> &chromo)
{
// 遍历权重向量。按突变率将每一个权重进行突变
for (int i=0; i<chromo.size(); ++i)
{
// 我们要骚扰这个权重吗?
if (RandFloat() < m_dMutationRate)
{
// 为权重添加或减小一个小的数量
chromo[i] += (RandomClamped() * CParams::dMaxPerturbatlon);
}
}
}
如同曾经的project那样。我已为v1.0版本号的Smart Minesweepersproject保留了一个非常easy的遗传算法。这样就能给你留下很多余地,可让你利用曾经学到的技术来改进它。就象大多数别的project一样。v1.O版仅仅用轮盘赌方式选精英,并採用单点式杂交。
注意:
当程序执行时,权重能够被演化成为随意的大小。它们不受不论什么形式的限制。
4.7 扫雷机类(The CMinesweeper Class )
这一个类用来定义一个扫雷机。
就象上一章描写叙述的登月艇类一样。扫雷机类中有一个包括了扫雷机位置、速度、以及如何转换方向等数据的纪录。类中还包括扫雷机的视线向量(look-at vector);它的2个分量被用来作为神经网络的2个输入。这是一个规范化的向量,它是在每一帧中依据扫雷机本身的转动角度计算出来的。它指示了扫雷机当前是朝着哪一个方向,如图11所看到的。 以下就是CMinesweeper扫雷机类的声明:
class CMinesweeper
{
private:
// 扫雷机的神经网络
CNeuralNet m_ItsBrain;
// 它在世界坐标里的位置
SVector2D m_vPosition;
// 扫雷机面对的方向
SVector2D m_vLookAt;
// 它的旋转(surprise surprise)
double m_dRotation;
double m_dSpeed;
// 依据ANN保存输出
double m_lTrack,
m_rTrack;
m_lTrack和m_rTrack依据网络保存当前帧的输出。
这些就是用来决定扫雷机的移动速率和转动角度的数值。
// 用于度量扫雷机适应性的分数
double m_dFitness;
每当扫雷机找到一个地雷,它的适应性分数就要添加。
// 扫雷机画出来时的大小比例
double m_dScale;
// 扫雷机最邻近地雷的下标位置
int m_iClosestMine;
在控制器类CControl1er中。有一个属于全部地雷的成员向量std::vector。
而m_iClosestMine就是代表最靠近扫雷机的那个地雷在该向量中的位置的下标。
public:
CMinesweeper();
// 利用从扫雷机环境得到的信息来更新人工神经网
bool Update(vector<SVector2D> &mines);
// 用来对扫雷机各个顶点进行变换,以便接着能够画它出来
void WorldTransform(vector<SPoint> &sweeper);
// 返回一个向量到最邻近的地雷
5Vector2D GetClosestMine(vector<SVector2D> &objects);
// 检查扫雷机看它是否已经发现地雷
int CheckForMine(vector<SVector2D> &mines, double size);
void Reset();
// ----------------- 定义各种供訪问用的函数
SVector2D Position()const { return m_vPosition; }
void IncrementFitness(double val) { m_dFitness += val; }
double Fitness()const { return m_dFitness; }
void PutWeights(vector<double> &w) { m_ItsBrain.PutWeights(w); }
int GetNumberOfWeights()const
{ return m_ItsBrain.GetNumberOfWeights(); }
};
4.7.1 The CMinesweeper::Update Function (扫雷机更新函数)
须要更详细地向你说明的CMinesweeper类的方法仅仅有一个,这就是Update更新函数。
该函数在每一帧中都要被调用。以更新扫雷机神经网络。
让我们考察这函数的肚子里有些什么货色:
bool CMinesweeper::Update(vector<SVector2D> &mines)
{
//这一向量用来存放神经网络全部的输入
vector<double> inputs;
//计算从扫雷机到与其最接近的地雷(2个点)之间的向量
SVector2D vClosestMine = GetClosestMine(mines);
//将该向量规范化
Vec2DNormalize(vClosestMine);
首先,该函数计算了扫雷机到与其最靠近的地雷之间的向量。然后使它规范化。(记住,向量规范化后它的长度等于1。
)但扫雷机的视线向量(look-at vector)这时不须要再作规范化,由于它的长度已经等于1了。由于两个向量都有效地化成了相同的大小范围。我们就能够觉得输入已经是标准化了。这我前面已讲过了。
//添加扫雷机->近期地雷之间的向量
Inputs.push_back(vClosestMine.x);
Inputs.push_back(vCIosestMine.y);
//添加扫雷机的视线向量
Inputs.push_back(m_vLookAt.x);
Inputs.push_back(m_vLookAt.y);
//更新大脑。并从网络得到输出
vector<double> output = m_ItsBrain.Update(inputs);
然后把视线向量。以及扫雷机与它最接近的地雷之间的向量,都输入到神经网络。函数CNeuralNet::Update利用这些信息来更新扫雷机网络。并返回一个std::vector向量作为输出。
//保证在输出的计算中没有错误发生
if (output.size() < CParams::iNumOutputs)
{
return false;
}
// 把输出赋值到扫雷机的左、右轮轨
m_lTrack = output[0];
m_rTrack = output[1];
在更新神经网络时,当检測到确实没有错误时,程序把输出赋给m_lTrack和m_rTrack。 这些值代表施加到扫雷机左、右履带轮轨上的力。
// 计算驾驶的力
double RotForce = m_lTrack - m_rTrack;
// 进行左转或右转
Clamp(RotForce, -CParams::dMaxTurnRate, CParams::dMaxTurnRate);
m_dSpeed = (m_lTrack + m_rTrack);
扫雷机车的转动力是利用施加到它左、右轮轨上的力之差来计算的。并规定,施加到左轨道上的力减去施加到右轨道上的力,就得到扫雷机车辆的转动力。然后就把此力施加给扫雷机车,使它实行不超过ini文件所规定的最大转动率的转动。
而扫雷机车的行进速度只是就是它的左側轮轨速度与它的右側轮轨速度的和。
既然我们知道了扫雷机的转动力和速度,它的位置和偏转角度也就都能更新了。
//更新扫雷机左右转向的角度
m_dRotation += RotForce;
// 更新视线角度
m_vLookAt.x = -sin(m_dRotation);
m_vLookAt.y = cos(m_dRotation);
// 更新它的位置
m_vPosition += (m_vLookAt* m_dSpeed);
// 假设扫雷机到达窗口四周。则让它实行围绕,使它不至于离开窗口而消失
If (m_vPosition.x > CParams::WindowWidth) m_vPosition.x = 0;
If (m_vPosition.x < 0) m_vPosition.x = CParams::WindowWidth;
If (m_vPosition.y > CParams::WindowHeight) m_vPosition.y = 0;
If (m_vPosition.y < D) m_vPosition.y = CParams::WindowHeight;
为了使事情尽可能简单。我已让扫雷机在碰到窗口边框时就围绕折回(wrap)。採用这样的方法程序就不再需
要做不论什么碰撞-响应方面的工作。围绕一块空地打转对我们人来说是一桩非常不可思议的动作,但对扫雷机,这
就像池塘中的鸭子。
Returen true;
}
4.8 CController Class (控制器类)
CController类是和一切都有联系的类。图15指出了其它的各个类和CController类的关系。
以下就是这个类的定义:
class CController
{
private:
// 基因组群体的动态存储器(一个向量)
vector<SGenome> m_vecThePopulation;
图15 minesweeperproject的程序流程图
// 保存扫雷机的向量
vector<CMinesweeper> m_vecSweepers;
// 保存地雷的向量
vector<SVector2D> m_vecMines;
// 指向遗传算法对象的指针
CGenAIg* m_pGA;
int m_NumSweepers;
int m_NumMines;
// 神经网络中使用的权重值的总数
int m_NumWeightsInNN;
// 存放扫雷机形状各顶点的缓冲区
vector<SPoint> m_SweeperVB;
// 存放地雷形状各顶点的缓冲区
vector<SPoint> m_MineVB;
// 存放每一代的平均适应性分数,供画图用
vector<double> m_vecAvFitness;
// 存放每一代的最高适应性分
vector<double> m_vecBestFitness;
// 我们使用的各种不同类型的画笔
HPEN m_RedPen;
HPEN m_BluePen;
HPEN m_GreenPen;
HPEN m_OldPen;
// 应用程序窗口的句柄
HWND m_hwndMain;
// 切换扫雷机程序执行的速度
bool m_bFastRender;
// 每一代的帧数(滴答数)
int m_iTicks;
// 代的计数
int m_iGenerations;
// 窗口客户区的大小
int cxClient,cyClient;
// 本函数在执行过程中画出具有平均-,和最优适应性值的图
void PlotStats(HDC surface);
public:
CController(HWND hwndMain);
~CController();
void Render(HDC surface);
void WorldTransform(vector<SPoint> &VBuffer,
SVector2D vPos);
bool Update();
// 几个公用的訪问方法
bool FastRender() { return m_bFastRender; }
void FastRender(bool arg){ m_bFastRender = arg; }
void FastRenderToggle() { m_bFastRender = !m_bFastRender; }
};
当创建CController类的某个实例时,会有一系列的事情发生:
*创建CMinesweeper对象。
*统计神经网络中所使用的权重的总数。然后此数字即被利用来初始化遗传算法类的一个实例。
*从遗传算法对象中随机提取染色体(权重)并(利用细心的脑外科手术)插入到扫雷机的经网络中。
*创建了大量的地雷并被随机地散播到各地。
*为画图函数创建了全部须要用到的GDI画笔。
*为扫雷机和地雷的形状创建了顶点缓冲区。
全部的一切现都已完毕初始化,由此Update方法就能在每一帧中被调用来对扫雷机进行演化。
4.8.1 CController::Update Method (控制器的更新方法)
控制器更新方法CController::Update方法(或函数)在每一帧中都要被调用。当调用update函数时。函数的前一半通过对全部扫雷机进行循环。如发现某一扫雷机找到了地雷,就update该扫雷机的适应性分数。由于m_vecThePopulation包括了全部基因组的拷贝。相关的适应性分数也要在这时进行调整。假设为完毕一个代(generation)所须要的帧数均已通过。本方法就执行一个遗传算法时代(epoch)来产生新一代的权重。这些权重被用来取代扫雷机神经网络中原有的旧的权重。使扫雷机的每一个參数被又一次设置,从而为进入新一generation做好准备。
bool CController::Update()
{
// 扫雷机执行总数为CParams::iNumTicks次的循环。在此循环周期中,扫雷机的神经网络
// 不断利用它周围特有的环境信息进行更新。而从神经网络得到的输出。使扫雷机实现所需的
// 动作。假设扫雷机遇见了一个地雷,则它的适应性将相应地被更新,且相同地更新了它相应
// 基因组的适应性。
if (m_iTicks++ < CParams::iNumTicks)
{
for (int i=O; i<m_NumSweepers; ++i)
{
//更新神经网络和位置
if (!m_vecSweepers[i].Update(m_vecMines))
{
//处理神经网络时出现了错误,显示错误后退出
MessageBox(m_hwndMain, 'Wrong amount of NN inputs!",
"Error", MB_OK);
return false;
}
// 检查这一扫雷机是否已经发现地雷
int GrabHit = m_vecSweepers[i].CheckForMine(m_vecMines。
CParams::dMineScale);
if (GrabHit >= 0)
{
// 扫雷机已找到了地雷。所以要添加它的适应性分数
m_vecSweepers[i].IncrementFitness();
// 去掉被扫雷机找到的地雷,用在随机位置放置的一个新地雷来取代
m_vecMines[GrabHit] = SVector2D(RandFloat() * cxClient,
RandFloat() * cyClient);
}
// 更新基因组的适应性值
m-vecThePopulation[i].dFitness = m_vecSweepers[i].Fitness();
}
}
// 一个代已被完毕了。
// 进入执行遗传算法并用新的神经网络更新扫雷机的时期
else
{
// 更新用在我们状态窗口中状态
m_vecAvFitness.push_back(m_pGA->AverageFitness());
m_vecBestFitness.push_back(m_pGA->BestFitness());
// 添加代计数器的值
++m_iGenerations;
// 将帧计数器复位
m_iTicks = 0;
// 执行GA创建一个新的群体
m-vecThePopulation = m_pGA->Epoch(m_vecThePopulation);
// 在各扫雷机中从新插入新的(有希望)被改进的大脑
// 并将它们的位置进行复位。等
for(int i=O; i<m_NumSweepers; ++i)
{m_vecSweepers[i].m_ItsBrain.PutWeights(m_vecThePopulation[i].vecWeights);
m_vecSweepers[i].Reset();
}
}
returen true;
}
概括起来,程序为每一世代做的工作是:
l.为全部扫雷机和为iNumTicks个帧组织循环。调用Update函数并依据情况添加扫雷机适应值的得分。
2.从扫雷机神经网络提取权重向量。
3.用遗传算法去演化出一个新的网络权重群体。
4.把新的权重插入到扫雷机神经网络。
5.转到第1步进行反复。直到获得理想性能时为止。
最后,表3列出了Smart Sweepersproject v1.0版全部缺省參数的设置值。
4.9 执行此程序 (Running the Program )
当你执行程序时,“F”键用来切换2种不同的显示状态,一种是显示扫雷机如何学习寻找地雷,一种是示在执行期中产生的最优的与平均的适当性分数的统计图表。 当显示图表时。程序将会加速执行。
.(连载之六)
4.10 功能的两个改进 (A Couple of Improvements)
仅 管扫雷机学习寻找地雷的本领十分不错。这里我仍有两件事情要告诉你。它们能进一步改进扫雷机的性能。
4 .10.1 改进一(Improvement Number One)
首先,单点crossover算子留下了很多可改进的余地。
依照它的规定,算子是沿着基因组长度随意地方切开的,这样常有可能使个别神经细胞的基因组在权重的中间被一刀两段地分开。
为清楚起见,我们来考察图16的权重。这是我们曾经在说明基因组如何编码时看过的一个简单网络。 在这 里。杂交算子能够沿向量长度的随意一处切开,这样,就会有极大几率在某个神经细胞(如第二个)的权重中 间断开。也就是说,在权重0.6和-0.1之间某处切开。这可能不会是我们想要的。由于。假设我们把神经细胞作 为一个完整的单元来看待,则它在此曾经所获得的不论什么改良就要被骚扰了。其实,这样的杂交操作有可能非 常非常象断裂性突变(disruptive mutation)操作所起的作用。
图16 简单的网络
与此针锋相对,我已创建了还有一种类型的杂交运算,它仅仅在神经细胞的边界上进行切开。在图16的样例中, 就是在第3、4或第6、7的两个基因之间切开,如小箭头所看到的。 为了实现这一算法,我已在CNeuralNet类中补 充了还有一个分割方法: CalculateSplitPoints。这一方法创建了一个用于保存全部网络权重边界的矢量。它的代 码例如以下:
vector<int> CNeuralNet::CalculateSplitPoints() const
{
vector<int> SplitPoints;
int WeightCounter = 0;
// 对每一层
for (int i=O; i<m_NumHiddenLayers + 1; ++i)
{
// 对每一个神经细胞
for (int j=O; j<m_vecLayers[i].m_NumNeurons; ++j)
{
// 对每一个权重
for (int k=O; k<m_vecLayers[i].m_vecNeurons[j].m_NumInputs; ++k)
{
++WeightCounter;
}
SplitPoints.push_back(WeightCounter - 1);
}
}
return SplitPoints;
}
这一方法是CController类构造函数在创建扫雷机并把断裂点向量传递给遗传算法类时调用的。
它们被存储 在一
个名叫m_vecSplitPoints的std::vector向量中。然后遗传算法就利用这些断裂点来实现两点杂交操作。其代 码例如以下:
void CGenAlg::CrossoverAtSplits(const vector<double> &mum,
const vector<double> &dad, vector<double> &babyl,
vector<double> &baby2)
{
// 假设超过了杂交率,就不再进行杂交,把2个上代作为2个子代输出
// 假设2个上辈相同,也把它们作为2个下辈输出
if ( (RandFloat() > m_dCrossoverRate) || (mum == dad))
{
baby1 = mum; baby2 = dad;
return;
}
// 确定杂交的2个断裂点
int index1 = RandInt(0, m_vecSplitPoints.size()-2);
int index2 = RandInt(Index1, m_vecSplitPoints.size()-1);
int cp1 = m_vecSplitPoints[Index1]; int cp2 = m_vecSplitPoints[Index2];
// 创建子代 for (int i=0; i<mum.size(); ++i)
{
if ( (i<cp1) || (i>=cp2) )
{
// 假设在杂交点外,保持原来的基因
babyl.push_back(mum[i]);
baby2.push_back(dad[i]);
}
else
{
// 把中间段进行交换
baby1.push_back(dad[1]);
baby2.push_back(mum[1]);
}
}
return;
}
依据我的经验,我已发现。在进行杂交时,把神经细胞当作一个不可分割的单位,比在染色体长度上随意 一点分裂基因组。能得到更好的结果。
4 .10.2 改进之2(Improvement Number Two)
我想和你讨论的还有一个性能改进,是用还有一种方式来观察网络的那些输入。在你已看到的 例
中,我们为网络使用了4个输入參数: 2个用于表示扫雷机视线方向的向量,另外2个用来指示扫雷
机与其最靠近的地雷的方向的向量。然而,有一种办法,能够把这些參数的个数降低到仅仅剩下一个。
其实你想一想就可知道,扫雷机为了确定地雷的位置。仅仅要知道从它当前的位置和朝向出发。
须要向左或向右转动多大的一个角度这一简单的信息就够了(假设你已经考虑到了这一点。那我在这
里要顺便向您道贺了)。
由于我们已经计算了扫雷机的视线向量和从它到最邻近地雷的向量。再来计
算它们之间的角度(θ)应是一件极为简单的事情 – 这就是这两个向量的点积,这我们在第6章“使登
陆月球easy一点”中已讨论过。见图17。
图17 计算到最邻近地雷的转动角度
不幸的是,点积仅仅给出角度的大小; 它不能指示这一角度是在扫雷机的那一側。
因此。我已
写了还有一个向量函数返回一个向量相对于还有一个向量的正负号。该函数的原型例如以下所看到的:
inline int Vec2DSign(SVector2D &v1,SVector2D &v2);
假设你对它的机理感兴趣,你能够在文件SVector2D.h中找到它的源代码。
但它的基本点就是: 如
果v1至v2是按顺时针方向转的,则函数返回 +1;假设v1至v2是按逆时针方向转,则函数返回 -1。
把点积和Vec2Dsign二者联合起来。就能把输入的精华提纯出来。使网络仅仅需接受一个输入就
行了。
以下就是新的CMinesweeper::Update函数有关段落的代码形式:
// 计算到最邻近地雷的向量
SVector2D vClosestMine = GetClosestMine(mines);
// 将它规范化
Vec2DNormalize(vClosestMine);
// 计算扫雷机视线向量和它到最邻近地雷的向量的点积。
它给出了我们要面对
// 最邻近地雷所需转动的角度
double dot = Vec2DDot(m_vLookAt, vClosestMine);
// 计算正负号 int sign = Vec2DSign(m_vLookAt, vClosestMine);
Inputs.push_back(dot*sig n);
执行一下光盘Chapter7/Smart Sweepers v1.1文件夹下的可执行程序executable,你就知道
经过以上2个改进,能为演化过程提速多少。
须要注意的一桩重要事情是,带有4个输入的网络要花非常长时间进行演化。由于它必须在各输入
数据之间找出很多其它的关系才干确定它应如何行动。其实。网络实际就是在学习怎么做点积并确定它
的正负极性。
因此,当你设计自己的网络时,你应细致权衡一下。是由你自己预先来计算很多输入数
据好呢(它将使CPU负担添加,但导致进化时间加快)还是让网络来找输入数据之间的复杂关系好(它
将使演化时间变长,但能使CPU降低紧张)?
5 结束语(last words)
我希望你已享受到了你第一次攻入神经网络这一奇异世界的快乐。我打赌你一定在为如此简单就
能使用它们而感到吃惊吧,对吗?我想我是猜对了。
在以下几章里我将要向你介绍很多其它的知识。告诉你一些新的训练手段和演绎神经网络结构的很多其它
的方法。但首先请你利用本章以下的提示去玩一下游戏是有意义的。
6 练习题 (Stuff to Try)
1。 在v1.0中,不用look-at向量作为输入,而改用旋转角度θ作为输入。由此就能够使网络的输入
个数降低成为1个。请问这对神经网络的演化有什么影响?你对此的看法如何?
2。 试以扫雷机的位置(x1,y1)、和扫雷机最接近的地雷的位置(x2,y2)、以及扫雷机前进方向
的向量(x3,y3)等6个參数作为输入。来设计一个神经网络。使它仍然能够演化去寻找地雷。
3。 改变激励函数的响应。试用O.1 - O.3 之间的低端值,它将产生和阶跃函数非常相像的一种激
励函数。然后再试用高端值,它将给出较为平坦的响应曲线。
考察这些改变对演化进程具有什么影响?
4。 改变神经网络的适应性函数,使得扫雷机不是去扫除地雷,而是要演化它,使它能避开地雷。
5。 理一理清楚有关遗传算法的各种不同设置和运算中使你感到模糊的东西。
6。
添加其它的对象类型。比方人。给出一个新环境来演化扫雷机,使它能避开人。但照样能扫除地
雷。
(这可能没有你想象那么easy!)
浙公网安备 33010602011771号