【PRML读书笔记-Chapter1-Introduction】引言

模式识别领域主要关注的就是如何通过算法让计算机自动去发现数据中的规则,并利用这些规则来做一些有意义的事情,比如说,分类.


以数字识别为例,我们可以根据笔画规则启发式教学去解决,但这样效果并不理想.

image

我们一般的做法是:

            1,统一尺寸;

            2,简化色彩;

            3,计算灰度平均值;

            4,计算哈希值(生成指纹);

当有新的测试图片时,只需利用"汉明距离"来判断两张图片之间不同的数据位数量就可以了.这是最简单快速的方法.缺陷是如果图片上加几个字,就认不出来了.因此,它的最佳用途就是用来通过缩略图找原图.

书中主要讲了预处理的好处就是可以降维,


a.监督学习:分类:预测离散值;

              回归:预测连续值.

b.无监督学习:聚类

c.强化学习:例子:机器人与高手下棋,通过最大化回报和不断迭代的方式进行学习.可以参考Stanford机器学习课程最后几章.


本书主要围绕三大理论:概率论,决策理论和信息论.
posted @ 2015-05-15 18:17  max_xbw  阅读(305)  评论(0)    收藏  举报