摘要: 基于搜狗语料库,建立的一个新闻分类系统;类别包括:classifierMap.put(0, "IT"); classifierMap.put(1, "体育"); classifierMap.put(2, "健康"); classifierMap.put(3, "军事"); class... 阅读全文
posted @ 2014-07-07 14:54 曹守鑫 阅读(793) 评论(0) 推荐(0) 编辑
摘要: 转载:http://www.zhizhihu.com/html/y2010/2202.htmlK-Means算法用来聚类,用来判断哪些东西是一个比较相近的类型,而KNN算法是用来做归类的,也就是说,有一个样本空间里的样本分成很几个类型,然后,给定一个待分类的数据,通过计算接近自己最近的K个样本来判断... 阅读全文
posted @ 2014-07-07 14:43 曹守鑫 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 支持向量机(SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器... 阅读全文
posted @ 2014-07-07 14:11 曹守鑫 阅读(1225) 评论(0) 推荐(0) 编辑