python - 随笔分类 - 一个大柚子

python爬虫一个security的RSA加密爬虫

摘要：目标网站 aHR0cDovL2Nhcy5zd3VzdC5lZHUuY24vYXV0aHNlcnZlci9sb2dpbg== 加密定位和分析第一个参数 execution 在页面直接存在第二个参数这个是直接写死的第三参数geolocation 直接为空第四个参数 username 是账号名，阅读全文

posted @ 2021-08-28 10:26 一个大柚子阅读(1019) 评论(0) 推荐(0)

python使用excejs执行时出现环境缺失的简单解决方法

摘要：使用jsdom 在js的头加上 const canvas = require('canvas'); const jsdom = require("jsdom"); const {JSDOM} = jsdom; const dom = new JSDOM(`<!DOCTYPE html><p>Hell 阅读全文

posted @ 2021-08-17 17:14 一个大柚子阅读(260) 评论(0) 推荐(0)

收藏的一些文章

摘要：1 . 使用python+selenium控制手工已打开的浏览器 https://www.cnblogs.com/HJkoma/p/9936434.html 2 . 协程（Coroutine） https://blog.csdn.net/qq_33567641/article/details/821 阅读全文

posted @ 2019-12-18 12:31 一个大柚子阅读(134) 评论(0) 推荐(0)

使用 mitmdump 进行 selenium webDriver绕过网站反爬服务的方法 pdd某宝可用

摘要：安装: pip install mitmproxy 新建一个脚本脚本代码： 1 from mitmproxy import ctx 2 3 injected_javascript = ''' 4 // overwrite the `languages` property to use a cust 阅读全文

posted @ 2019-12-18 11:48 一个大柚子阅读(2336) 评论(0) 推荐(0)

python 使用tesseract进行图片识别

摘要：我的python为3.7 1.需要安装二个模块， PIL 直接使用 pip install PIL 会报错使用 pip install Pillow 即可安装PIL 第二个直接 pip install pytesseract 2安装好了模块还需要下载 tesseract-ocr 下载网址：http 阅读全文

posted @ 2019-08-03 16:17 一个大柚子阅读(7908) 评论(0) 推荐(0)

scrapy-redis 分布式哔哩哔哩网站用户爬虫

摘要：scrapy里面，对每次请求的url都有一个指纹，这个指纹就是判断url是否被请求过的。默认是开启指纹即一个URL请求一次。如果我们使用分布式在多台机上面爬取数据，为了让爬虫的数据不重复，我们也需要一个指纹。但是scrapy默认的指纹是保持到本地的。所有我们可以使用redis来保持指纹，并且用red 阅读全文

posted @ 2019-05-19 16:49 一个大柚子阅读(633) 评论(0) 推荐(0)

今日头条加密参数的识别

摘要：今日头条有三个加密参数先找一个作者的主页，列如：https://www.toutiao.com/c/user/108888017311/#mid=1619989289127939 然后进去抓包找文章的地址发现：https://www.toutiao.com/c/user/article/?page 阅读全文

posted @ 2019-03-10 16:04 一个大柚子阅读(4117) 评论(0) 推荐(0)

python 遇到的一些问题和解决方法

摘要：安装crypto python3里面这个改成了pycryptodome 1. pip3 install pycryptodome 或者 pip3 install -i https://pypi.douban.com/simple pycryptodome 阅读全文

posted @ 2019-02-28 14:47 一个大柚子阅读(462) 评论(0) 推荐(0)

scrapy 一些设置和问题

摘要：scrapy设置ua池设置后在setting启用 scrapy设置ip池 scrapy 设置自定义cookie：class LaogouwangSpider(scrapy.Spider): scrapy提供五种日志级别。阅读全文

posted @ 2019-02-17 13:34 一个大柚子阅读(862) 评论(0) 推荐(0)

scrapy爬取美女图片

摘要：使用scrapy爬取整个网站的图片数据。并且使用 CrawlerProcess 启动。 1 # -*- coding: utf-8 -* 2 import scrapy 3 import requests 上面的是spider文件上面的是item文件这上面是管道文件这是在setting里面的，阅读全文

posted @ 2019-02-11 21:21 一个大柚子阅读(1163) 评论(1) 推荐(0)

python Windows和Linux路径表示问题

摘要：Windows下路径是用‘\\’表示也可以使用'/'，但是Linux下路径都是‘/’表示。因为python是跨平台的，有时候程序迁移会出现错误。解决办法1 可全部使用‘/’表示解决办法2 我们可以使用os.sep方法，他是一个变量，在Windows下，他等于‘\\’，在Linux下，他等于‘/ 阅读全文

posted @ 2019-01-02 11:47 一个大柚子阅读(8525) 评论(0) 推荐(1)

python对文件的压缩解压

摘要：python自带的zipfile的模块支持对文件的压缩和解压操作 zipfilp.ZipFile 表示创建一个zip对象 #file表示文件的路径 #mode表示文件的打开模式 r表示读，默认 w表示写入,没有则新建，有则覆盖 a表示追加写入 #compression表示存储的方式 zipfile. 阅读全文

posted @ 2018-11-28 10:26 一个大柚子阅读(3916) 评论(0) 推荐(0)

一个大柚子

随笔分类 - python

公告