Terry's blog

Focus on bigdata and cloud.

博客园 首页 新随笔 联系 订阅 管理

2018年10月24日 #

摘要: 随着Web2.0的发展,如今已经进入了一个数据爆炸的时代。人们想要找到自己需要的信息也越来越难。 –因此有了Search,在用户对自己需求相对明确的时候,用Search能很快的找到自己需要的数据 –但很多情况下,用户其实并不明确自己的需要,或者他们需要更加符合他们个人口味和喜好的结果,因此出现了Re 阅读全文
posted @ 2018-10-24 19:03 王晓成 阅读(504) 评论(0) 推荐(0) 编辑

摘要: K-近邻算法(KNN)概述 KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只 阅读全文
posted @ 2018-10-24 16:09 王晓成 阅读(333) 评论(0) 推荐(0) 编辑

摘要: 贝叶斯法则 机器学习的任务:在给定训练数据A时,确定假设空间B中的最佳假设。 最佳假设:一种方法是把它定义为在给定数据A以及B中不同假设的先验概率的有关知识下的最可能假设 贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身 先验概率和后验概 阅读全文
posted @ 2018-10-24 11:58 王晓成 阅读(910) 评论(0) 推荐(0) 编辑