摘要: 决策树的剪枝有两种思路: 1.预剪枝 2.后剪枝 预剪枝 预剪枝就是在构造决策树的过程中,先对每个结点在划分前进行估计,如果当前结点的划分不能带来决策树模型泛化性能的提升,则不对当前结点进行划分并且将当前结点标记为叶结点。 所有决策树的构建方法,都是在无法进一步降低熵的情况下才会停止创建分支的过程, 阅读全文
posted @ 2022-11-26 17:10 李仁真 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 一、基本流程 首先,什么是决策树。 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部结点和叶节点。内部结点表示一个特征或属性,叶节点表示一个类。 根据课件所说,决策树分类的思想就好像是找对象,现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对 阅读全文
posted @ 2022-11-14 20:19 李仁真 阅读(781) 评论(0) 推荐(0) 编辑
摘要: 分类任务概述 曼哈顿距离:|x1-x2| + |y1-y2| 欧几里得距离: 汉明距离: 距离测量——“相似”是什么意思? 2.最近邻算法 提供一种思路,即:未知的豆离哪种豆最近就认为未知豆和该豆是同一种类。由此,我们引出最近邻算法的定义:为了判定未知样本的类别,以全部训练样本作为代表点,计算未知样 阅读全文
posted @ 2022-11-13 16:12 李仁真 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 1.性能度量 性能度量是衡量模型泛化能力的评价标准,反映了任务需求;使用不同的性能度量往往会导致不同的评判结果。、 在预测任务中,给定样例集评估学习器的性能 f 也即把预测结果 f (x) 和真实标记比较。 对于分类任务,错误率和精度是最常用的两种性能度量: 错误率:分错样本占样本总数的比例 精 度 阅读全文
posted @ 2022-11-06 16:13 李仁真 阅读(938) 评论(0) 推荐(0) 编辑
摘要: 机器学习的定义 从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。 “训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型 阅读全文
posted @ 2022-11-06 15:14 李仁真 阅读(578) 评论(0) 推荐(0) 编辑
摘要: p++,p++,(p++)是在p所指向的地址上+1 (*p)++是在p所指向的数据上+1 阅读全文
posted @ 2020-12-14 22:47 李仁真 阅读(31) 评论(0) 推荐(0) 编辑