2021 年 8月 21 日随笔档案 - likl-

2021年8月21日

摘要： scrapy的基本使用我们已经掌握，但是各位心中一定会有些许的疑问，我们在编写scrapy工程的时候，我们只是在定义相关类中的属性或者方法，但是我们并没有手动的对类进行实例化或者手动调用过相关的方法，那么这些操作都是谁做的呢？接下来我们就来看看scrapy的五大核心组件的工作流程，然后大家就会上述的阅读全文

posted @ 2021-08-21 23:11 likl- 阅读(347) 评论(0) 推荐(0)

药监总局数据爬取-post请求

摘要： 1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 import requests 4 import json 5 6 if __name__ == "__main__": 7 headers = { 8 'User-Agent': 'Mozilla 阅读全文

posted @ 2021-08-21 22:58 likl- 阅读(152) 评论(0) 推荐(0)

线程池练习

摘要： 1 import requests 2 from lxml import etree 3 import re 4 from multiprocessing.dummy import Pool 5 #需求：爬取梨视频的视频数据 6 headers = { 7 'User-Agent':'Mozilla 阅读全文

posted @ 2021-08-21 22:28 likl- 阅读(80) 评论(0) 推荐(0)

爬取超级鹰当前用户的个人详情页数据-破解验证码模拟登录

摘要： 1 from Codeclass1 import Chaojiying_Client 2 from lxml import etree 3 import requests 4 5 # session = requests.Session() 6 7 # 将验证码图片下载到本地 8 headers = 阅读全文

posted @ 2021-08-21 22:23 likl- 阅读(172) 评论(0) 推荐(0)

爬取站长素材-bs4、xpath

摘要： 1 import requests 2 from lxml import etree 3 import os 4 if __name__ == "__main__": 5 url = "https://aspx.sc.chinaz.com/query.aspx" 6 headers = { 7 "U 阅读全文

posted @ 2021-08-21 22:21 likl- 阅读(150) 评论(0) 推荐(0)

网页采集器练习-requests

摘要： 1 import requests 2 if __name__ == "__main__": 3 header = { 4 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Geck 阅读全文

posted @ 2021-08-21 22:20 likl- 阅读(51) 评论(0) 推荐(0)

自动化登录12306-selenium

摘要： 1 from selenium import webdriver 2 import time 3 from PIL import Image 4 from Codeclass import Chaojiying_Client 5 from selenium.webdriver import Acti 阅读全文

posted @ 2021-08-21 18:07 likl- 阅读(143) 评论(0) 推荐(0)

公告