WSR6666

2020年5月10日

摘要：我爬取了中国大学排名代码如下（代码过长一张图截不下） import requestsfrom bs4 import BeautifulSoupimport bs4import xlwtdef getHTMLText(url):####用request库爬取页面源代码，储存在 r.text里 try 阅读全文

posted @ 2020-05-10 22:04 WSR6666 阅读(201) 评论(0) 推荐(0)

2020年4月30日

爬取图片

摘要：学习了爬虫后尝试爬取网页文字内容，掌握后开始爬取图片内容我爬取的网页是所有人的童年：www.4399.com 我先爬取了文字内容，是成功的。之后我开始尝试爬取图片 import requestsimport os url="http://4399.com"root = "D://123456789 阅读全文

posted @ 2020-04-30 20:13 WSR6666 阅读(162) 评论(0) 推荐(0)

2020年4月11日

将进酒词云

摘要：这几天刚刚在教员和同学的帮助下安装了所需的第三方库，一直比较喜欢李白的将进酒，所以自己本次词云就做了将进酒。我运用了imageio库，jieba库，wordcloud。其他都还好，唯一遇到的困难就是我把图片命名为中文李白多次报错找不到文件，后我把李白改为libai就解决了 ps:其实最大的困难还是阅读全文

posted @ 2020-04-11 13:11 WSR6666 阅读(266) 评论(0) 推荐(0)

公告