摘要: K最近邻(K-Nearest-Neighbour,KNN)算法是机器学习里简单易掌握的一个算法。通过你的邻居判断你的类型,“近朱者赤,近墨者黑”表达了K近邻的算法思想。一.算法描述:1.1KNN算法的原理KNN算法的前提是存在一个样本的数据集,每一个样本都有自己的标签,表明自己的类型。现在有一个新的未知的数据,需要判断它的类型。那么通过计算新未知数据与已有的数据集中每一个样本的距离,然后按照从近到远排序。取前K个最近距离的样本,来判断新数据的类型。通过两个例子来说明KNN算法的原理(1)下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿 阅读全文
posted @ 2014-03-14 19:44 ps龙之吻 阅读(1660) 评论(0) 推荐(0) 编辑
摘要: 正则表达式通过特定的式子匹配某种类型的字符串。对字符串进行匹配验证或者从大量的字符串里提取出特定的信息。正则表达式包含普通字符和特殊字符。大部分的普通字符如‘A’或‘0’可以简单的来匹配自己。如text可以匹配‘text’。特殊字符,可以来匹配一组字符串,或者来说明字符的用法。特征字符包括:.匹配任意一个字符除了\,如cabcd中ab.可以匹配abc$匹配字符串的结束位置。(如果设置了RegExp对象的Multiline属性,$也匹配“\n”之前的位置),如123folked中fol匹配folked,而fol$匹配fol^匹配字符串的开始位置(如果设置了RegExp对象的Multiline属性 阅读全文
posted @ 2014-03-14 19:42 ps龙之吻 阅读(409) 评论(0) 推荐(0) 编辑