会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
吴林鸿
博客园
首页
新随笔
联系
订阅
管理
2017年11月1日
一个完整的大作业
摘要: 1.选一个自己感兴趣的主题。 在爬取时遇到了最大的困难是有些大型网页内容不让爬取,以及大型网页的内容的类不一定会一样,难以批量爬取。 现在爬取的网页信息为http://news.17173.com/ 2.网络上爬取相关的数据。 该游戏新闻中心爬取结果 3.进行文本分析,生成词云。 文本分析 对爬取的
阅读全文
posted @ 2017-11-01 00:25 吴林鸿
阅读(125)
评论(0)
推荐(0)
编辑