摘要: 一、简介 情感分析,有时也称为观点挖掘,是NLP领域一个非常重要的一个分支,它主要分析评论、文章、报道等的情感倾向,掌握或了解人们这些情感倾向非常重要。这些倾向对我们处理后续很多事情都有指定或借鉴作用 在NLP中,首先需要把文本或单词等转换为数值格式,为后续机器学习或深度学习使用,把文本或单词转换为 阅读全文
posted @ 2019-03-26 09:27 河水青山1 阅读(2854) 评论(0) 推荐(0)
摘要: 一、利用wiki中文语料进行word2vec模型构建 1)数据获取 到wiki官网下载中文语料,下载完成后会得到命名为zhwiki-latest-pages-articles.xml.bz2的文件,里面是一个XML文件 下载地址如下:https://dumps.wikimedia.org/zhwik 阅读全文
posted @ 2019-03-25 15:19 河水青山1 阅读(5606) 评论(0) 推荐(1)
摘要: 一、情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析、归纳。情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法 基于情感知识的方法通过一些已有的情感词典计算文本的情感极性(正向或负向),其方法是统计文本中出现的正、负向情感词数目或情感词的情感值来判断文本情感类 阅读全文
posted @ 2019-03-25 15:18 河水青山1 阅读(8255) 评论(3) 推荐(1)
该文被密码保护。 阅读全文
posted @ 2019-03-19 18:59 河水青山1 阅读(2) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2019-03-19 10:12 河水青山1 阅读(4) 评论(0) 推荐(0)
摘要: 一、简介 我们知道在windows下输入:win + r,会弹出下面的窗口,而在下面的窗口出现后我们接着按下esc键,下面的窗口会消失 现在设想我们想在python代码里控制键盘,想通过运行代码->弹出上面的窗口->按下esc->窗口消失,那么如何实现这样控制键盘的功能呢? python中pyaut 阅读全文
posted @ 2019-02-21 14:12 河水青山1 阅读(700) 评论(0) 推荐(0)
摘要: 两方面(发散,相关)~三方法(FWE) F:方皮卡互 W:RFE E:惩罚树 一、简介 我们的数据处理后,喂给算法之前,考虑到特征的实际情况,通常会从两个方面考虑来选择特征: 1)特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有 阅读全文
posted @ 2019-02-11 16:31 河水青山1 阅读(896) 评论(0) 推荐(0)
摘要: 一、简介 此文是对利用jieba,word2vec,LR进行搜狐新闻文本分类的准确性的提升,数据集和分词过程一样,这里就不在叙述,读者可参考前面的处理过程 经过jieba分词,产生24000条分词结果(sohu_train.txt有24000行数据,每行对应一个分词结果) 1)TfidfVector 阅读全文
posted @ 2018-12-29 11:24 河水青山1 阅读(5052) 评论(2) 推荐(1)
摘要: 一、简介 1)jieba 中文叫做结巴,是一款中文分词工具,https://github.com/fxsjy/jieba 2)word2vec 单词向量化工具,https://radimrehurek.com/gensim/models/word2vec.html 3)LR LogisticRegr 阅读全文
posted @ 2018-12-29 11:21 河水青山1 阅读(14537) 评论(6) 推荐(3)
摘要: 二、第二课时 1)极限: 通俗语言:函数f在\(x_0\)处的极限是L 数学符号:\(\lim_{x\rightarrow x_0} f(x) = L\) 无穷如何比较大小呢?如x趋近0的时候,\(sin(x)\)和\(tan(x)\)同样都趋近0,哪个趋近0的速度更快呢?我们可以采用求商的极限来求 阅读全文
posted @ 2018-12-10 10:13 河水青山1 阅读(217) 评论(0) 推荐(0)