机器学习基础梳理—(K-近邻算法浅谈)
摘要:K-近邻算法可用在二类分类,多类分类和回归问题上 基本要素: K值的选择,距离度量和分类决策规则 减小K值:近似误差减小,估计误差增大,增大K值则相反K值通常不大于20;距离 度量:Lp距离;分类决策规则:多数表决 工作原理: 1、有监督学习:标签化数据集 2、测试阶段:输入无标签新数据后,将新数据
阅读全文
机器学习基础梳理—(感知机浅谈)
摘要:1、感知机基础 感知机是一种二类分类模型,训练样本需要完全线性可分,学习策略包括两种:一种是误分 类点的数目,另外一种是误分类点到分离超平面的总距离,通过梯度下降法最小化损失函数。 分离超平面:w * x + b = 0 误分类点:-y(i) * (w * x(i) + b) > 0,若不等式成立,
阅读全文
机器学习基础梳理—(支持向量机浅谈)
摘要:一、SVM基础 支持向量机(SVM)是一种二分类模型,有别于感知机(误分类点到超平面的总距离),SVM的学习策略是间隔 最大化,当训练样本完全线性可分时,采用硬间隔最大化,称为线性可分支持向量机;当训练样本近似线 性可分时,增加松弛变量,采用软间隔最大化,称为线性支持向量机;在非线性问题中引入了核函
阅读全文
机器学习基础梳理—(accuracy,precision,recall浅谈)
摘要:一、TP TN FP FN TP:标签为正例,预测为正例(P),即预测正确(T) TN:标签为负例,预测为负例(N),即预测正确(T) FP:标签为负例,预测为正例(P),即预测错误(F) FN:标签为正例,预测为负例(N),即预测错误(F) 其中 T:True F:False P:Positive
阅读全文