摘要:
聚类就是按照某个标准,把数据集划分成不同的类,不同类的数据差异性尽可能大,同类的数据相似性尽可能大。 k-means聚类算法 K邻近算法,要把数据分成K类,一开始是随机的,后来迭代进行选择,直到收敛,采用平方误差。 E = ∑ i = 1 k ∑ p ∈ C i ∥ p − m i ∥ 2 E=\s 阅读全文
摘要:
参考这篇【机器学习】支持向量机 SVM(非常详细) 支持向量机 SVM 又叫支持向量机,支持向量就是 S 、 R 、 G S、R、G S、R、G这三个点,也就是边界点吧,支持向量机就是通过支持向量运算的分类器。如果对应到超平面的话,就是找到各类样本点到超平面的距离最远,也就是找到最大间隔超平面。 背 阅读全文
摘要:
线性判别分析(LDA) 也是一种降维方法,思想就是 多维空间中,数据处理分类问题较为复杂,LDA算法将多维空间中的数据投影到一条直线上,将 d d d维数据转化成1维数据进行处理。对于训练数据,设法将多维数据投影到一条直线上,同类数据的投影点尽可能接近,异类数据点尽可能远离。对数据进行分类时,将其投 阅读全文