会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
杰锅锅(Jackie)
宁肯像种子一样等待 也不愿像疲惫的陀螺 旋转得那样勉强
博客园
首页
新随笔
联系
订阅
管理
12 2016 档案
Java豆瓣电影爬虫——小爬虫成长记(附源码)
摘要:看看一只豆瓣影视小爬虫是如何诞生的,JewelCrawler可以爬影视详情和短评并基于Word2Vec做情感分析,代码已经发在Github上。
阅读全文
posted @
2016-12-11 12:26
JackieZheng
阅读(8568)
评论(2)
推荐(8)
Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据
摘要:抓了20000多条的短评数据,利用Word2Vec算法做了一回情感分析,透过这些几个字到几百个字不等的短评来一窥评论者的喜怒哀乐。看看如何使用中文分词器以及加载停用词库,Word2Vec又是如何构建语料库,训练数据集以及得到模型的。
阅读全文
posted @
2016-12-04 02:12
JackieZheng
阅读(8346)
评论(2)
推荐(4)
公告