摘要: 本次统计的是二战相关的内容 首先找网站:https://bbs.tiexue.net/post2_6187648_1.html 其次设计爬虫:先爬取网页源代码 import urllib.requestb = str(input())a = urllib.request.urlopen(b)html 阅读全文
posted @ 2020-05-10 16:19 李拓 阅读(301) 评论(0) 推荐(0)
摘要: 其实吧,本来这次爬虫作业是想做其他网页的…… 为什么没做呢?直接上图吧…… ……这个网页不让扒!不让扒!不让扒!也可能是我没找对方法吧……无妨,换一个网页继续吧 于是我就把目光投向了现在唯一打开的网页:咱们的班级 那就把咱们班级第一页的标题都爬下来吧。 但最开始,我的代码选择了借鉴同学的码。结果,是 阅读全文
posted @ 2020-05-02 15:01 李拓 阅读(131) 评论(0) 推荐(0)
摘要: 文章来源:http://pan.baidu.com/share/link?shareid=2463351148&uk=1175435487 设计思路: import jieba import imageio import wordcloudmask=imageio.imread('badapple. 阅读全文
posted @ 2020-04-11 11:46 李拓 阅读(272) 评论(0) 推荐(0)