随笔分类 -  机器学习

摘要:未完待续。。。 阅读全文
posted @ 2017-03-07 17:34 世人谓我恋长安 阅读(115) 评论(0) 推荐(0)
摘要:1.knn是分类算法 2.监督学习 3.给它的数据是有label的,是已经事先分类好了的, 类别数不变。 1.kmeans是聚类算法 2.非监督学习 3.给它的数据是没有label,是没有事先分类好的, 以“物以类聚”原理进行聚集成簇。 K的含义:来了一个样本x,要给它分类,即求出它的类别,就从数据 阅读全文
posted @ 2017-03-04 12:01 世人谓我恋长安 阅读(1109) 评论(0) 推荐(0)
摘要:kmeans算法思想: 1.从数据集中随机选取k个初始点作为质心。 2.遍历数据集中所有的点,求出每个点到每个质心的距离,找出距离改点最近的质心,并改变此点类型为此质点的类型。 3.重新为每个类别更新其质心。 4.重复2,3,步直到最后两次质心位置相同退出while循环。 补充用python实现的代 阅读全文
posted @ 2017-03-04 01:34 世人谓我恋长安 阅读(844) 评论(0) 推荐(0)
摘要:K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 其算法描述如下: 1)计算已 阅读全文
posted @ 2017-03-02 18:07 世人谓我恋长安 阅读(1033) 评论(0) 推荐(0)