随笔分类 -  爬虫

摘要:一、基于pymysql包操作数据库步骤 1.创建数据库连接以获取连接对象 2.使用连接对象获取操作对象(cursor) 3.使用操作对象执行sql语句 4.提交sql语句 二、示例代码 import pymysql #创建连接对象 conn = pymysql.connect(host='你的数据库 阅读全文
posted @ 2021-07-24 15:17 zddsl 阅读(263) 评论(0) 推荐(0)
摘要:一、 通过api爬取数据步骤 1.设置请求头 2.使用requests包爬取api地址 3.把返回的json保存到字典中(使用json包的loads方法) 二、示例代码 import requests import json #1.请求头 header = { "Accept": "text/htm 阅读全文
posted @ 2021-07-24 15:02 zddsl 阅读(895) 评论(0) 推荐(0)
摘要:1.在settings中开启Cookie COOKIES_ENABLED = True 2.重写 start_requests方法 初始化开始url(方便添加cookie) 列: from scrapy import Request class ASpider(CrawlSpider): name 阅读全文
posted @ 2021-06-24 21:52 zddsl 阅读(343) 评论(0) 推荐(0)