摘要: 什么是CRF CRF是给定随机变量X的条件下,随机变量Y的马尔科夫随机场(概率无向图)。 这里主要介绍在线性链上的特殊的条件随机场,称为线性链条件随机场,可用于序列标注等问题。 线性链条件随机场如下图所示,输出变量仅与输入变量以及相邻输出变量有连线。 CRF的参数化表示 CRF通常存在两类特征函数, 阅读全文
posted @ 2021-01-09 00:08 1033020837 阅读(411) 评论(0) 推荐(0)
摘要: 隐马尔可夫模型的定义 隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可检测的状态随机序列(状态序列),再由各个状态生成一个观测而产生观测随机序列(观测序列)。 隐马尔可夫模型由初始概率分布、状态转移概率分布、观测概率分布确定。 设$Q={q_1,q_2,...,q_N}$为 阅读全文
posted @ 2021-01-09 00:06 1033020837 阅读(487) 评论(0) 推荐(1)
摘要: 什么是EM算法 EM算法用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。 EM算法详细过程: 输入:观测变量数据Y,隐变量数据Z,联合分布$P(Y,Z|\theta)$,条件分布$P(Z|Y,\theta)$; 输出:模型参数$\theta$. 选择参数的初值$\theta^{(0) 阅读全文
posted @ 2021-01-09 00:05 1033020837 阅读(406) 评论(0) 推荐(1)
摘要: 什么是GBDT Boosting思想 Boosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重。测试时,根据各层分类器的结果的加权得到最终结果。 Bagging与Boosting的串行训 阅读全文
posted @ 2021-01-09 00:02 1033020837 阅读(271) 评论(0) 推荐(0)
摘要: 什么是AdaBoost 标准AdaBoost关注二分类问题,AdaBoost通过训练一系列的弱分类器来组成一个强分类器,每一轮训练时会提高前一轮弱分类器错误分类样本的权值,而降低那些被正确分类的样本的权值。模型最后的预测结果为各弱分类器预测结果的加权多数表决结果。 AdaBoost算法具体流程: 输 阅读全文
posted @ 2021-01-09 00:00 1033020837 阅读(289) 评论(0) 推荐(0)
摘要: 导出SVM要优化的问题 对于上图中这样一个二分类线性可分问题,期望找到一个分类超平面将正负类分开,SVM就是一个用来寻找这样的分类超平面的算法。 定义正负类的标签分别为1、-1,分类超平面的表达式为$f(x)=w^Tx+b$,其中x为样本向量,w、b分别为超平面的权重以及偏置项。可以由$f(x)$的 阅读全文
posted @ 2021-01-08 23:59 1033020837 阅读(561) 评论(0) 推荐(0)
摘要: 最大熵原理 最大熵原理是概率模型学习的一个准则,其认为学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。 通常用约束条件来确定概率模型的集合,然后在集合中选择熵最大的模型。 直观地,最大熵原理认为要选择的概率模型首先必须满足已有的事实,即约束条件。在没有更多信息的情况下,那些不确定的 阅读全文
posted @ 2021-01-08 23:41 1033020837 阅读(617) 评论(0) 推荐(0)
摘要: 什么是逻辑回归? 逻辑回归一般指二项逻辑回归,是一种用于二分类的判别式模型。 设输入样本为$x\in\mathbb^n$,样本标签$y\in{0,1}$逻辑回归的参数为:\(w\in\mathbb{R}^n, b\in\mathbb{R}\),逻辑回归按照下式得到样本属于标签1的概率: \[ p=\ 阅读全文
posted @ 2021-01-08 23:39 1033020837 阅读(439) 评论(0) 推荐(0)
摘要: 什么是决策树 ​ 决策树表示基于特征对实例进行分类的树形结构,从给定的训练数据集中,递归选择最优划分特征,依据此特征对训练数据集进行划分,直到结点符合停止条件。决策树可以看作是一系列 if-then 规则的集合。 停止条件 当前结点所有样本属于同一类别。 当前结点属性集为空,或者是所有样本在所有属性 阅读全文
posted @ 2021-01-08 23:24 1033020837 阅读(601) 评论(0) 推荐(0)
摘要: 什么是朴素贝叶斯 朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。 给定训练集$T={(x_1,y_1),(x_2,y_2),..,(x_N,y_N)}$,设类别可选数目为K,即$c_1,c_2,...,c_K$,特征维度为m,即$x_i=(x_i1,x_i2,...x_im)$,第j维的特 阅读全文
posted @ 2021-01-08 23:22 1033020837 阅读(666) 评论(0) 推荐(0)