摘要:
为什么使用LSTM+CRF进行序列标注 直接使用LSTM进行序列标注时只考虑了输入序列的信息,即单词信息,没有考虑输出信息,即标签信息,这样无法对标签信息进行建模,所以在LSTM的基础上引入一个标签转移矩阵对标签间的转移关系进行建模。这一点和传统CRF很像,CRF中存在两类特征函数,一类是针对观测序 阅读全文
posted @ 2021-01-09 00:23
1033020837
阅读(544)
评论(0)
推荐(0)
摘要:
什么是XGBoost XGBoost是陈天奇等人开发的一个开源机器学习项目,高效地实现了GBDT算法并进行了算法和工程上的许多改进。XGBoost本质上还是一个GBDT,但是力争把速度和效率发挥到极致,所以叫X (Extreme) GBoosted。 先来举个例子,我们要预测一家人对电子游戏的喜好程 阅读全文
posted @ 2021-01-09 00:17
1033020837
阅读(451)
评论(0)
推荐(0)
摘要:
什么是随机森林 自助法(Bootstrap Method,Bootstrapping,或自助抽样法、拔靴法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。 Bagging思想 Bagging(bootstrap aggregating) 阅读全文
posted @ 2021-01-09 00:10
1033020837
阅读(534)
评论(0)
推荐(0)
摘要:
什么是CRF CRF是给定随机变量X的条件下,随机变量Y的马尔科夫随机场(概率无向图)。 这里主要介绍在线性链上的特殊的条件随机场,称为线性链条件随机场,可用于序列标注等问题。 线性链条件随机场如下图所示,输出变量仅与输入变量以及相邻输出变量有连线。 CRF的参数化表示 CRF通常存在两类特征函数, 阅读全文
posted @ 2021-01-09 00:08
1033020837
阅读(431)
评论(0)
推荐(0)
摘要:
隐马尔可夫模型的定义 隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可检测的状态随机序列(状态序列),再由各个状态生成一个观测而产生观测随机序列(观测序列)。 隐马尔可夫模型由初始概率分布、状态转移概率分布、观测概率分布确定。 设$Q={q_1,q_2,...,q_N}$为 阅读全文
posted @ 2021-01-09 00:06
1033020837
阅读(517)
评论(0)
推荐(1)
摘要:
什么是EM算法 EM算法用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。 EM算法详细过程: 输入:观测变量数据Y,隐变量数据Z,联合分布$P(Y,Z|\theta)$,条件分布$P(Z|Y,\theta)$; 输出:模型参数$\theta$. 选择参数的初值$\theta^{(0) 阅读全文
posted @ 2021-01-09 00:05
1033020837
阅读(433)
评论(0)
推荐(1)
摘要:
什么是GBDT Boosting思想 Boosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重。测试时,根据各层分类器的结果的加权得到最终结果。 Bagging与Boosting的串行训 阅读全文
posted @ 2021-01-09 00:02
1033020837
阅读(279)
评论(0)
推荐(0)
摘要:
什么是AdaBoost 标准AdaBoost关注二分类问题,AdaBoost通过训练一系列的弱分类器来组成一个强分类器,每一轮训练时会提高前一轮弱分类器错误分类样本的权值,而降低那些被正确分类的样本的权值。模型最后的预测结果为各弱分类器预测结果的加权多数表决结果。 AdaBoost算法具体流程: 输 阅读全文
posted @ 2021-01-09 00:00
1033020837
阅读(314)
评论(0)
推荐(0)
浙公网安备 33010602011771号