关于夏运师兄的数据挖掘
摘要:
今天下午没有去上老蔡的组合数学实在是太值了,听了一下夏运师兄的数据挖掘方面的东西,知道了现在好比说全世界都是用的同一套样本集来做试验,实际上是有36个样本集,每个样本有实例(好比说1W个实例,8K个用来建模,2K个用来预测),有属性,有类标记,他做的主要是分类,就是好比说具有什么样属性的人还贷的可能性很低,什么样的天气状况不适合打羽毛球,主要的算法有 K近临算法,(以还贷样本为例,找出与这个实例的属性(行为)最相似的好比说30个人,看他们的类标签是属于有信用的多还是无信用的多。)贝叶斯算法,就是找出某些条件下,某些属性出现的概率,某些属性同时出现的概率。决策树算法以打羽毛球为例,天气的属性.. 阅读全文
posted @ 2013-10-23 22:07 iamdanger 阅读(224) 评论(0) 推荐(0)
浙公网安备 33010602011771号