Loading

摘要: 主成分分析(Principal Component Analysis, PCA )是一种利用线性映射来进行数据降维的方法,并去除数据的相关性; 且最大限度保持原始数据的方差信息 线性映射,去相关性,方差保持 线性映射 \[ F = \sum_{i=1}^{p}u_iX_i = u^{T}X \] 相 阅读全文
posted @ 2021-10-28 11:21 笑云博文 阅读(487) 评论(0) 推荐(0)
摘要: bagging原理 bagging的思路是训练k个独立的基学习器,对于每个基学习器的结果进行结合(加权或者多数投票)来获得一个强学习器。 boostrap boost最早用于经济学,为了研究大样本中的特征值,通过有放回的多次采样研究样本的特征。 在原有的样本中通过重抽样抽取一定数量(比如100)的新 阅读全文
posted @ 2021-10-28 11:13 笑云博文 阅读(512) 评论(0) 推荐(0)
摘要: 是《自然语言处理》课程的小作业之一,内容是基于隐马尔科夫模型进行命名实体识别任务。 引言 本文要求基于HMM模型进行命名实体识别任务,数据集中共有十个标签类别,分别为: 地址(address),书名(book),公司(company),游戏 (game)政府(government), 电影(movi 阅读全文
posted @ 2021-10-28 10:56 笑云博文 阅读(2557) 评论(1) 推荐(0)