摘要: 向量介绍 向量就是一个数组,数组元素称为向量的每一个维度值;通常情况下每一个维度的值是数字形式。 问题阐述 检索问题,就是在向量数据集中,检索出相似向量簇;本质做法包括下面两种: KNN:K-Nearest Neighbor ANN:Approximate Nearest Neighbor 算法思想 阅读全文
posted @ 2021-10-12 16:13 ghevinn 阅读(2231) 评论(0) 推荐(0)
摘要: 正则化也叫规则化,又叫惩罚项。 作用:正则化是避免过拟合。 原理:根据高中数学中的泰勒展开说,任何一个函数都可以通过多项式的方式逼近,求解多项式的参数的过程就是机器学习中模型训练的过程,机器学习中训练完成的模型本质上就是多项式的参数求解过程,如何求解多项式的参数使得求解出的多项式鲁棒性更好就是好的模 阅读全文
posted @ 2018-04-25 18:50 ghevinn 阅读(373) 评论(0) 推荐(0)
摘要: 矩阵就是线性变换。 奇异值分解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。 特征值分解和奇异值分解目的都是 想提取矩阵有代表性的重要的特征出来。 1 特征值: 如果说一个向量v是方阵A的特征向量,将一定可以 阅读全文
posted @ 2018-04-24 19:54 ghevinn 阅读(284) 评论(0) 推荐(0)
摘要: 灰度共生矩阵,指的是一种通过研究灰度的空间相关特性来描述纹理的常用方法。假设原图的灰度级为L,那么灰度共生矩阵是L*L大小的计数矩阵。 GLCM表其实就是所有像素可能的组合 比如,GLCM(1,1)就是I中像素值为1和1的组合,GLCM(4,5)就是I中像素4和像素5的组合,GLCM(i,j)的值呢 阅读全文
posted @ 2018-04-23 22:15 ghevinn 阅读(9131) 评论(0) 推荐(2)
摘要: 设置classpath 设置classpath 实现WordCount import java.io.*; import org.apache.hadoop.*; import org.apache.hadoop.conf.Configuration; import org.apache.hadoo 阅读全文
posted @ 2017-11-15 17:11 ghevinn 阅读(189) 评论(0) 推荐(0)