李拓 - 博客园

2020年5月10日

摘要：本次统计的是二战相关的内容首先找网站：https://bbs.tiexue.net/post2_6187648_1.html 其次设计爬虫：先爬取网页源代码 import urllib.requestb = str(input())a = urllib.request.urlopen(b)html 阅读全文

posted @ 2020-05-10 16:19 李拓阅读(316) 评论(0) 推荐(0)

2020年5月2日

初次尝试爬虫

摘要：其实吧，本来这次爬虫作业是想做其他网页的…… 为什么没做呢？直接上图吧…… ……这个网页不让扒！不让扒！不让扒！也可能是我没找对方法吧……无妨，换一个网页继续吧于是我就把目光投向了现在唯一打开的网页：咱们的班级那就把咱们班级第一页的标题都爬下来吧。但最开始，我的代码选择了借鉴同学的码。结果，是阅读全文

posted @ 2020-05-02 15:01 李拓阅读(131) 评论(0) 推荐(0)

2020年4月11日

东方求闻史纪词云来啦~

摘要：文章来源：http://pan.baidu.com/share/link?shareid=2463351148&uk=1175435487 设计思路： import jieba import imageio import wordcloudmask=imageio.imread('badapple. 阅读全文

posted @ 2020-04-11 11:46 李拓阅读(283) 评论(0) 推荐(0)

李拓

公告