随笔分类 -  机器学习

机器学习笔记-距离度量与相似度(三)余弦相似度
摘要:在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常用余弦相似度来表示。 阅读全文
posted @ 2020-05-15 14:21 WarningMessage 阅读(9459) 评论(0) 推荐(1)
机器学习笔记-k近邻算法
摘要:k近邻(k-NearestNeighbor, KNN)算法是一种基本分类与回归方法。 阅读全文
posted @ 2020-05-14 12:43 WarningMessage 阅读(888) 评论(0) 推荐(0)
机器学习笔记-主成分分析(PCA)的数学原理
摘要:主成分分析(PCA)的数学原理 阅读全文
posted @ 2020-05-13 09:42 WarningMessage 阅读(810) 评论(0) 推荐(0)
机器学习笔记-距离度量与相似度(二)马氏距离
摘要:马氏距离(Mahalanobis Distance) 马氏距离(Mahalanobis Distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。它考虑到数据特征之间的联系,并且是尺度无关的(sc 阅读全文
posted @ 2020-05-12 14:33 WarningMessage 阅读(17737) 评论(2) 推荐(3)
机器学习笔记-距离度量与相似度(一)闵可夫斯基距离
摘要:在机器学习过程中,我们经常需要知道个体(样本)之间的差异大小,进而评价个体的相似性和类别,特征空间中两个样本(点)之间的距离就是两个样本相似性的一种反映。常见的分类和聚类算法,如K近邻、K均值(K means)、层次聚类等等都会选择一种距离或相似性的度量方法。根据数据特性的不同,可以采用不同的度量方 阅读全文
posted @ 2020-05-10 15:01 WarningMessage 阅读(8386) 评论(0) 推荐(2)
机器学习笔记--模型的方差与偏差
摘要:什么是模型的方差和偏差 我们经常用过拟合、欠拟合来定性地描述模型是否很好地解决了特定的问题。从定量的角度来说,可以用模型的偏差(Bias)与方差(Variance)来描述模型的性能。在有监督学习中,模型的期望泛化误差可以分解成三个基本量的和 偏差、方差和噪声。 偏差、方差和噪声 1)使用文字描述的方 阅读全文
posted @ 2020-05-09 10:09 WarningMessage 阅读(3058) 评论(0) 推荐(1)