摘要: 导出SVM要优化的问题 对于上图中这样一个二分类线性可分问题,期望找到一个分类超平面将正负类分开,SVM就是一个用来寻找这样的分类超平面的算法。 定义正负类的标签分别为1、-1,分类超平面的表达式为$f(x)=w^Tx+b$,其中x为样本向量,w、b分别为超平面的权重以及偏置项。可以由$f(x)$的 阅读全文
posted @ 2021-01-08 23:59 1033020837 阅读(574) 评论(0) 推荐(0)
摘要: 最大熵原理 最大熵原理是概率模型学习的一个准则,其认为学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。 通常用约束条件来确定概率模型的集合,然后在集合中选择熵最大的模型。 直观地,最大熵原理认为要选择的概率模型首先必须满足已有的事实,即约束条件。在没有更多信息的情况下,那些不确定的 阅读全文
posted @ 2021-01-08 23:41 1033020837 阅读(646) 评论(0) 推荐(0)
摘要: 什么是逻辑回归? 逻辑回归一般指二项逻辑回归,是一种用于二分类的判别式模型。 设输入样本为$x\in\mathbb^n$,样本标签$y\in{0,1}$逻辑回归的参数为:\(w\in\mathbb{R}^n, b\in\mathbb{R}\),逻辑回归按照下式得到样本属于标签1的概率: \[ p=\ 阅读全文
posted @ 2021-01-08 23:39 1033020837 阅读(465) 评论(0) 推荐(0)
摘要: 什么是决策树 ​ 决策树表示基于特征对实例进行分类的树形结构,从给定的训练数据集中,递归选择最优划分特征,依据此特征对训练数据集进行划分,直到结点符合停止条件。决策树可以看作是一系列 if-then 规则的集合。 停止条件 当前结点所有样本属于同一类别。 当前结点属性集为空,或者是所有样本在所有属性 阅读全文
posted @ 2021-01-08 23:24 1033020837 阅读(635) 评论(0) 推荐(0)
摘要: 什么是朴素贝叶斯 朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。 给定训练集$T={(x_1,y_1),(x_2,y_2),..,(x_N,y_N)}$,设类别可选数目为K,即$c_1,c_2,...,c_K$,特征维度为m,即$x_i=(x_i1,x_i2,...x_im)$,第j维的特 阅读全文
posted @ 2021-01-08 23:22 1033020837 阅读(697) 评论(0) 推荐(0)
摘要: 什么是感知机 感知机是一个二分类线性判别模型,假设输入$x\in \mathbb^n$,输出$y\in{-1,+1}$,感知机为如下函数: \[ f(x)=sign(w^Tx+b), \\sign(z)=\left\{\begin{aligned} 1 \qquad \quad x\ge0\\ -1 阅读全文
posted @ 2021-01-08 23:21 1033020837 阅读(1034) 评论(0) 推荐(0)
摘要: 什么是KNN KNN(K近邻)算法:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最近邻的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。 KNN使用的模型实际上对应于特征空间的划分,没有显式的训练过程。 KNN三要素 距离度量 特征空间中两个实例点的距离是两个实例点 阅读全文
posted @ 2021-01-08 23:16 1033020837 阅读(506) 评论(0) 推荐(0)