摘要: 一、定义 支持向量机(support vector machine,SVM),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。 支持向量机思想直观,但细节复杂,涵盖凸优化,核函数,拉格朗日算子等理论。 阅读全文
posted @ 2022-12-11 22:22 Moonee 阅读(910) 评论(0) 推荐(0) 编辑
摘要: 一、定义 logistic回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w'x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w'x+b作为因变量,即y =w'x+b,而l 阅读全文
posted @ 2022-12-05 12:07 Moonee 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 一、什么是朴素贝叶斯 1.定义 贝叶斯分类是统计学中的一类分类算法,这类算法以贝叶斯定理为基础。 已知两个独立事件A和B,事件B发生的前提下,事件A发生的概率可以表示为P(A|B),即上图中浅紫色部分占粉色部分的比例,即: 公式中,P(A)也叫做先验概率,P(A|B)叫做后验概率),朴素贝叶斯分类是 阅读全文
posted @ 2022-11-28 14:29 Moonee 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 一、决策树剪枝 (1)目的 剪枝(pruning)是决策树学习算法解决过拟合问题的主要手段。 在决策树学习中,为了尽可能正确分类训练样本,节点划分过程将不断重复,有时会造成决策树分支过多,这时有可能因训练样本学得“太好”了,以至于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合。因此, 阅读全文
posted @ 2022-11-21 16:46 Moonee 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 一、决策树的概述 1.定义 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。 决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一 阅读全文
posted @ 2022-11-13 19:59 Moonee 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 1.简介 K-近邻算法(K-Nearest Neighbor, KNN),属于监督学习,是一中基本分类与回归方法。k 近邻法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类, k 近邻法假设给定一个训练数据集,其中的实例类别已定,分类时,对新的实例,根据其 k 个最近邻的训练 阅读全文
posted @ 2022-10-27 00:22 Moonee 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 1. 概念 PR曲线实则是以precision(精准率)和recall(召回率)这两个为变量而做出的曲线,其中recall为横坐标,precision为纵坐标。一条PR曲线要对应一个阈值。通过选择合适的阈值,比如50%,对样本进行划分,概率大于50%的就认为是正例,小于50%的就是负例,从而计算相应 阅读全文
posted @ 2022-10-19 23:10 Moonee 阅读(848) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2020.cnblogs.com/blog/2193650/202012/2193650-20201214232222160-890395354.png) 阅读全文
posted @ 2020-12-14 23:23 Moonee 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 1.什么是数组 数组是有序的元素序列,由数据类型相同的一系列元素组成。组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量。 2.数组的作用 数组通常被用来存储程序需要的数据。为了使编译器处理方便, 数组能把具有相同类型的若干元素按有序的形式组织起来。 阅读全文
posted @ 2020-11-25 20:31 Moonee 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 一、习题2.1 二、习题2.5 阅读全文
posted @ 2020-11-11 20:19 Moonee 阅读(80) 评论(0) 推荐(0) 编辑