python爬虫 - 随笔分类 - qsl_你猜

爬取自己的博客

摘要：一、背景之前的爬虫全忘了，所以要重新整理思路了。以爬取自己的博客作为练习： URL: https://www.cnblogs.com/qianslup/category/1482821.html 二、查看robots.txt 三、代码展示 import requests from bs4 im 阅读全文

posted @ 2025-03-10 11:02 qsl_你猜阅读(44) 评论(0) 推荐(0)

爬取微博

摘要：说明：大家可以看崔庆才老师的博客或者买他的书。基本框架来自崔庆才老师的书本。链接：https://github.com/Python3WebSpider/MaoYan/blob/master/spider.py 因为微博的接口可能发生变化，所以要根据实际情况来操作。本次代码可以更新的日期是：202 阅读全文

posted @ 2020-06-02 09:51 qsl_你猜阅读(216) 评论(0) 推荐(0)

爬取猫眼电影排行

摘要：说明：大家可以看崔庆才老师的博客或者买他的书。基本框架来自崔庆才老师的书本。链接：https://github.com/Python3WebSpider/MaoYan/blob/master/spider.py 基本思路：拿到网页，解析网页，保存结果，循环操作。方法：正则表达式、beatifu 阅读全文

posted @ 2020-06-02 09:49 qsl_你猜阅读(254) 评论(0) 推荐(1)

selenium爬虫后上传数据库。

摘要：一、准备工作 1.1安装软件安装python、安装谷歌浏览器、将chromedriver.exe放到指定位置。放到Scripts文件夹中。我这边的路径为：C:\Users\1\AppData\Local\Programs\Python\Python37\Scripts 1.2用到的python库。阅读全文

posted @ 2019-11-16 16:03 qsl_你猜阅读(352) 评论(0) 推荐(0)

qsl_你猜

随笔分类 - python爬虫

公告