会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
WSR6666
博客园
首页
新随笔
联系
订阅
管理
2020年5月10日
中国大学排名
摘要: 我爬取了中国大学排名 代码如下(代码过长一张图截不下) import requestsfrom bs4 import BeautifulSoupimport bs4import xlwtdef getHTMLText(url):####用request库爬取页面源代码,储存在 r.text里 try
阅读全文
posted @ 2020-05-10 22:04 WSR6666
阅读(201)
评论(0)
推荐(0)
2020年4月30日
爬取图片
摘要: 学习了爬虫后尝试爬取网页文字内容,掌握后开始爬取图片内容 我爬取的网页是所有人的童年:www.4399.com 我先爬取了文字内容,是成功的。之后我开始尝试爬取图片 import requestsimport os url="http://4399.com"root = "D://123456789
阅读全文
posted @ 2020-04-30 20:13 WSR6666
阅读(162)
评论(0)
推荐(0)
2020年4月11日
将进酒词云
摘要: 这几天刚刚在教员和同学的帮助下安装了所需的第三方库,一直比较喜欢李白的将进酒,所以自己本次词云就做了将进酒。 我运用了imageio库,jieba库,wordcloud。其他都还好,唯一遇到的困难就是我把图片命名为中文李白多次报错找不到文件,后我把李白改为libai就解决了 ps:其实最大的困难还是
阅读全文
posted @ 2020-04-11 13:11 WSR6666
阅读(264)
评论(0)
推荐(0)
公告