上一页 1 2 3 4 5 6 7 8 9 10 ··· 46 下一页
摘要: 在index.html文件头加上 <meta name="referrer" content="never"> 阅读全文
posted @ 2021-10-11 17:25 淋哥 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 1. 前言 crawlab 是基于Golang的分布式爬虫管理平台,但是没有实现批量添加爬虫的功能。 作为党国的优秀青年,怎么可以容忍这件事情呢,那就实现一个脚本去批量添加爬虫吧。 2. 主要解决的问题是 需要抓取的网站有几百个,爬虫代码编写完毕,但是需要手动的去添加爬虫代码,一个一个的去添加,累死 阅读全文
posted @ 2021-08-22 11:35 淋哥 阅读(505) 评论(0) 推荐(0) 编辑
摘要: 在编写爬虫代码的过程中,程序员会使用redis 集合进行去重,今天就测试一下redis去重需要多少内存的问题 过程:我们对10w,100w,1000w 的数字进行 md5 加密,生成唯一的32位字符串,然后存入到redis集合中去,通过rdm 的 内存分析占用查看redis的大小。 1. 对10w 阅读全文
posted @ 2021-07-24 17:11 淋哥 阅读(615) 评论(0) 推荐(0) 编辑
摘要: 需要对一个数据进行精确的计算,比如 2.37% 需要得到 0.0237 首先看截图 得到的结果是 0.023700000000000002,这个肯定是不可以的, 解决办法: 代码: from decimal import Decimal def spider(): a = '2.37' res = 阅读全文
posted @ 2021-07-22 10:45 淋哥 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 在使用seleinum的时候,如果模拟谷歌或者火狐浏览器,出现一个界面的话太难受了所幸firefox和chrome都有了无头模式,也就是没有界面的浏览器,在内存中执行。 firefox设置: from selenium import webdriver options = webdriver.Fir 阅读全文
posted @ 2021-07-06 17:03 淋哥 阅读(811) 评论(0) 推荐(1) 编辑
摘要: Error: Uncaught [TypeError: Cannot read property 'userAgent' of undefined] at reportException (D:\cnipa\node_modules\jsdom\lib\jsdom\living\helpers\ru 阅读全文
posted @ 2021-06-30 16:50 淋哥 阅读(1474) 评论(0) 推荐(0) 编辑
摘要: 1. 打开fiddler 在rules >Customize Rules 中加入代码 2. 搜索 Utilities.LaunchHyperlink(sAction); 下其下面增加代码即可 代码: public static BindUIColumn("TimeTaken/ms", 120) fu 阅读全文
posted @ 2021-06-29 19:17 淋哥 阅读(386) 评论(0) 推荐(0) 编辑
摘要: function paramsToFormData(obj) { const formData = new FormData(); Object.keys(obj).forEach((key) => { if (obj[key] instanceof Array) { obj[key].forEac 阅读全文
posted @ 2021-06-29 11:37 淋哥 阅读(1460) 评论(0) 推荐(0) 编辑
摘要: 直接上代码 var url = "https://www.cnblogs.com/xuchunlin/p/14848864.html" var time = 10000; var timeout = false; var request = new XMLHttpRequest(); var tim 阅读全文
posted @ 2021-06-28 17:14 淋哥 阅读(2655) 评论(0) 推荐(0) 编辑
摘要: 直接上代码 function doSave(value, type, name) { var blob; if (typeof window.Blob == "function") { blob = new Blob([value], {type: type}); } else { var Blob 阅读全文
posted @ 2021-06-28 17:12 淋哥 阅读(310) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 46 下一页