会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
李拓
博客园
首页
新随笔
联系
订阅
管理
2020年5月10日
数据分析作业
摘要: 本次统计的是二战相关的内容 首先找网站:https://bbs.tiexue.net/post2_6187648_1.html 其次设计爬虫:先爬取网页源代码 import urllib.requestb = str(input())a = urllib.request.urlopen(b)html
阅读全文
posted @ 2020-05-10 16:19 李拓
阅读(301)
评论(0)
推荐(0)
2020年5月2日
初次尝试爬虫
摘要: 其实吧,本来这次爬虫作业是想做其他网页的…… 为什么没做呢?直接上图吧…… ……这个网页不让扒!不让扒!不让扒!也可能是我没找对方法吧……无妨,换一个网页继续吧 于是我就把目光投向了现在唯一打开的网页:咱们的班级 那就把咱们班级第一页的标题都爬下来吧。 但最开始,我的代码选择了借鉴同学的码。结果,是
阅读全文
posted @ 2020-05-02 15:01 李拓
阅读(131)
评论(0)
推荐(0)
2020年4月11日
东方求闻史纪词云来啦~
摘要: 文章来源:http://pan.baidu.com/share/link?shareid=2463351148&uk=1175435487 设计思路: import jieba import imageio import wordcloudmask=imageio.imread('badapple.
阅读全文
posted @ 2020-04-11 11:46 李拓
阅读(272)
评论(0)
推荐(0)
公告