摘要: 我爬取了中国大学排名 代码如下(代码过长一张图截不下) import requestsfrom bs4 import BeautifulSoupimport bs4import xlwtdef getHTMLText(url):####用request库爬取页面源代码,储存在 r.text里 try 阅读全文
posted @ 2020-05-10 22:04 WSR6666 阅读(201) 评论(0) 推荐(0)
摘要: 学习了爬虫后尝试爬取网页文字内容,掌握后开始爬取图片内容 我爬取的网页是所有人的童年:www.4399.com 我先爬取了文字内容,是成功的。之后我开始尝试爬取图片 import requestsimport os url="http://4399.com"root = "D://123456789 阅读全文
posted @ 2020-04-30 20:13 WSR6666 阅读(162) 评论(0) 推荐(0)
摘要: 这几天刚刚在教员和同学的帮助下安装了所需的第三方库,一直比较喜欢李白的将进酒,所以自己本次词云就做了将进酒。 我运用了imageio库,jieba库,wordcloud。其他都还好,唯一遇到的困难就是我把图片命名为中文李白多次报错找不到文件,后我把李白改为libai就解决了 ps:其实最大的困难还是 阅读全文
posted @ 2020-04-11 13:11 WSR6666 阅读(264) 评论(0) 推荐(0)