随笔分类 -  机器学习

摘要:1.应用背景 在进行分类器构建后,要对其分类性能进行评估,或新构建的分类器相对于其他分类器对数据集的分类效果进行评估,这时就会用到相应的评估方法 2.常见的评估方法 2.1评估分类器性能的度量 基本概念理解: 正元组:在一个分类问题中我们感兴趣的元组; 负元组:其他元组; 真比例/真阳性(TP):指 阅读全文
posted @ 2020-07-03 18:57 阿贝尔 阅读(695) 评论(0) 推荐(0)
摘要:1.基本原理 k-均值聚类实在给定数据集的k个簇的算法。簇的个数是由用户自己定义的,每个簇通过其质心,即簇中所有点的中心。具体工作流程如下: 首先随机确定k个初始点作为质心。然后将数据集中每个点分配到一个簇中,即选择距离该点最近簇中,若簇中有新加入的数据点,则从新计算簇中心。 优点:容易实现 缺点: 阅读全文
posted @ 2020-05-23 13:53 阿贝尔 阅读(212) 评论(0) 推荐(0)
摘要:主要是对《机器学习实战》这本书的重现,加深印象 1.k-邻近算法概述 基本原理:存在一个样本集合(也称为训练数据集),并且该样本集合带有相应标签,即对于样本集合中我们知道各个样本所属类别。之后对于输入数据集(测试样本)没有带相应标签,这时,可以通过计算输入数据集到训练数据集中的距离来判断测试样本所属 阅读全文
posted @ 2020-03-26 22:34 阿贝尔 阅读(369) 评论(0) 推荐(0)