摘要: 一、利用wiki中文语料进行word2vec模型构建 1)数据获取 到wiki官网下载中文语料,下载完成后会得到命名为zhwiki-latest-pages-articles.xml.bz2的文件,里面是一个XML文件 下载地址如下:https://dumps.wikimedia.org/zhwik 阅读全文
posted @ 2019-03-25 15:19 1直在路上1 阅读(5221) 评论(0) 推荐(1) 编辑
摘要: 一、情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析、归纳。情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法 基于情感知识的方法通过一些已有的情感词典计算文本的情感极性(正向或负向),其方法是统计文本中出现的正、负向情感词数目或情感词的情感值来判断文本情感类 阅读全文
posted @ 2019-03-25 15:18 1直在路上1 阅读(7797) 评论(3) 推荐(1) 编辑
摘要: match开头~if group~忽略 search中间~if group~0 findall列表 +*? re.sub()替换 一、re模块 参考:https://www.ibm.com/developerworks/cn/opensource/os-cn-pythonre/index.html 阅读全文
posted @ 2019-03-25 11:37 1直在路上1 阅读(216) 评论(0) 推荐(0) 编辑