摘要: 1.选一个自己感兴趣的主题。 在爬取时遇到了最大的困难是有些大型网页内容不让爬取,以及大型网页的内容的类不一定会一样,难以批量爬取。 现在爬取的网页信息为http://news.17173.com/ 2.网络上爬取相关的数据。 该游戏新闻中心爬取结果 3.进行文本分析,生成词云。 文本分析 对爬取的 阅读全文
posted @ 2017-11-01 00:25 吴林鸿 阅读(125) 评论(0) 推荐(0) 编辑