随笔分类 -  爬虫

摘要:bookstoscrape 1 import scrapy 2 from spider_01_books.items import BookItem 3 4 class BookstoscrapeSpider(scrapy.Spider): 5 """爬虫类,继承spider""" 6 #爬虫名称- 阅读全文
posted @ 2022-05-30 23:41 安好_世界 阅读(241) 评论(0) 推荐(0)
摘要:测试命令:scrapy shell http://books.toscrape.com/可以填写任何url 返回的这些对象我们可以直接去使用 例如验证自己的xpath编写是否正确。 阅读全文
posted @ 2022-05-30 00:03 安好_世界 阅读(37) 评论(0) 推荐(0)
摘要:实例: class Request(url, callback=None,method='GET',headers= None,body=None,cookies=None, meta=None,encodings='utf-8',priority=0,dont_filter=False,errba 阅读全文
posted @ 2022-05-05 17:27 安好_世界 阅读(449) 评论(0) 推荐(0)
摘要:安装:pip install scrapy -i https://pypi:tuna.tsinghua.edu.cn/simple 测试验证安装结果: 创建一个项目:在shell中使用scrapyard startproject name 使用pycharm工具打开 1.scrapy.cfg :sc 阅读全文
posted @ 2022-05-02 23:03 安好_世界 阅读(104) 评论(0) 推荐(0)