SVM支持向量机
摘要:支持向量机通俗导论(理解SVM的三层境界):https://blog.csdn.net/macyang/article/details/38782399/ 写的真的好。 以及:https://www.cnblogs.com/pinard/p/6097604.html
阅读全文
Apriori算法
摘要:Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据集,那么对于超市,我们可以优化产品的位置摆放,对于电商,我们可以优化商品所在的仓库位置
阅读全文
Adaboost算法
摘要:博客1:https://www.cnblogs.com/pinard/p/6133937.html 博客2:https://blog.csdn.net/v_july_v/article/details/40718799
阅读全文
K-means聚类算法
摘要:K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y
阅读全文
朴素贝叶斯
摘要:参考博客1:https://blog.csdn.net/AMDS123/article/details/70173402 参考博客2:https://blog.csdn.net/fisherming/article/details/79509025
阅读全文
EM最大期望算法
摘要:众所周知,极大似然估计是一种应用很广泛的参数估计方法。例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的方法可以估计出高斯分布的两个参数,均值和方差。这个方法基本上所有概率课本上都会讲,我这就不多说了,不清楚的请百度。 然而现在我面临的是这种情况,我手上的数
阅读全文
SVD奇异值分解
摘要:原文出处http://blog.csdn.net/zhongkejingwang/article/details/43053513
阅读全文
PCA主成分分析
摘要:原贴出处:http://blog.codinglabs.org/articles/pca-tutorial.html PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,
阅读全文
KNN最近邻算法
摘要:算法概述 K最近邻(K-Nearest Neighbor,KNN)算法,是著名的模式识别统计学方法,在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一,也是基于实例的学习方法中最基本的,又是最好的文本分类算法之一。 基本思想 如果一个实例在特征空间中的K
阅读全文