随笔分类 -  MachineLearning

摘要:http://blog.csdn.net/gamer_gyt/article/details/51226904 决策树算法的优点:1:理解和解释起来简单,且决策树模型可以想象2:需要准备的数据量不大,而其他的技术往往需要很大的数据集,需要创建虚拟变量,去除不完整的数据,但是该算法对于丢失的数据不能进 阅读全文
posted @ 2017-09-13 08:46 TobinWang 阅读(330) 评论(0) 推荐(0)
摘要:皮尔逊相关系数是比欧几里德距离更加复杂的可以判断人们兴趣的相似度的一种方法。该相关系数是判断两组数据与某一直线拟合程序的一种试题。它在数据不是很规范的时候,会倾向于给出更好的结果。 如图,Mick Lasalle为<<Superman>>评了3分,而Gene Seyour则评了5分,所以该影片被定位 阅读全文
posted @ 2017-07-28 19:19 TobinWang 阅读(4107) 评论(0) 推荐(0)