摘要: 一、KNN分类算法 K最近邻(K-Nearest Neighbor,KNN)算法,是著名的模式识别统计学方法,在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一,也是基于实例的学习方法中最基本的,又是最好的文本分类算法之一。 通常,在分类任务中可使用“投 阅读全文
posted @ 2019-06-10 10:24 UniqueColor 阅读(586) 评论(0) 推荐(0)
摘要: 一、K-均值聚类(K-means) k-means算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K个类,且每个类的中心是根据类中所有值的均值得到,每个类用聚类中心来描述。对于给定的一个包含n个d维数据点的数据集X以及要分得的类别K,选取欧式距离作为相似度指标,聚类目标 阅读全文
posted @ 2019-06-10 10:14 UniqueColor 阅读(503) 评论(0) 推荐(0)