摘要: 目标总览 主要做了三件事: 抓取网页数据 清理数据 用词云进行展示 使用的python版本是3.6 一、抓取网页数据 第一步要对网页进行访问,python中使用的是urllib库。代码如下: 其中https://movie.douban.com/nowplaying/hangzhou/是豆瓣最新上映 阅读全文
posted @ 2018-06-17 15:12 黑色彩虹 阅读(4010) 评论(2) 推荐(0)