zhxg

导航

 

2014年8月6日

摘要: k-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内在含义,决策树的主要优势在于数据形式非常容易理解。比如给你一个100以内的数来猜,通过对你猜的数的是大还是小来引导你得到最后的结果。优点:计算复杂度低,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特诊数据。缺点:可能会产... 阅读全文
posted @ 2014-08-06 16:23 zhxg 阅读(173) 评论(0) 推荐(0)
 

2014年8月5日

摘要: k-近邻算法采取的是利用多个特征值之间的距离进行分析。比如现在有n个数据,类的标签为A,B,C,每个数据对应一个标签,此时来个一个数据没有任何标签,只有其多个特征值信息,那我们就可以计算出这个数据和每个已分类数据的距离,找出其距离前k近的数据,看在这些数据中哪种标签占的比重最多,那么这个数据就分为这... 阅读全文
posted @ 2014-08-05 16:43 zhxg 阅读(154) 评论(0) 推荐(0)