构建商品评价的分类器

这里写图片描述
这里写图片描述

接下来,开始构建分类器:

这里写图片描述

**生成的WordCount是一个字典.键值对的形式
这里的键是某一个单词,对应的值是该单词的个数**

图像化查看一下原始数据

这里写图片描述

,这里我们取出第一个商品的评价
抽取评价数量最多的商品,这里叫做Vulli Sophie

这里写图片描述

根据评分进行分组可视化

这里写图片描述

这里写图片描述

说明,我们要构建我们的情感分类器,我们可以从上图中看见,评分有1,2,3,4,5,但是3代表的是中立,即不喜欢不讨厌.这一部分我们可以把它去掉,因为我们的情感分类器只是需要判断某一评价是正面还是负面,

正面:4,5分的评价 负面:1,2分的评价 去掉3分的评价

这里写图片描述

这里写图片描述

过一会儿,我们的模型就训练好了

得到模型之后,就可以开始测试我们的模型

这里写图片描述

这里写图片描述

这里写图片描述

预测评估
这里写图片描述

根据概率列排序

这里写图片描述

查看最高评价的语句

这里写图片描述

查看最差评价;

这里写图片描述

有兴趣的小伙伴可以尝试翻译一下,看到底是不是好差评价呢

posted @ 2018-01-05 12:14  liuge36  阅读(69)  评论(0编辑  收藏  举报