2018年5月16日

Python爬虫4------图片爬虫

摘要: import urllib.request import re keyname="短裙" key=urllib.request.quote(keyname) headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64; rv:49.0) Gecko/20100101 Firefox/49.0") opener=urllib.request.... 阅读全文

posted @ 2018-05-16 14:27 吱吱了了 阅读(289) 评论(0) 推荐(0)

Python爬虫3-----浏览器伪装

摘要: 1、浏览器伪装技术原理 当爬取CSDN博客时,会发现返回403,因为对方服务器会对爬虫进行屏蔽,故需伪装成浏览器才能爬取。浏览器伪装一般通过报头进行。 2、获取网页的报头 3、代码: 阅读全文

posted @ 2018-05-16 13:30 吱吱了了 阅读(557) 评论(0) 推荐(0)

Python爬虫2------爬虫屏蔽手段之代理服务器实战

摘要: 1、代理服务器: 一个处于客户端与互联网中间的服务器,如果使用代理服务器,当我们浏览信息的时候,先向代理服务器发出请求,然后由代理服务器向互联网获取信息,再返回给我们。 2、代码: 阅读全文

posted @ 2018-05-16 13:12 吱吱了了 阅读(412) 评论(0) 推荐(0)

算法18-----判断是否存在符合条件的元素【list】

摘要: 1、题目: 给定一个整数数组,判断其中是否存在两个不同的下标i和j满足:| nums[i] - nums[j] | <= t 并且 | i - j | <= k 2、思路: 来自链接:http://bookshadow.com/weblog/2015/06/03/leetcode-contains- 阅读全文

posted @ 2018-05-16 10:34 吱吱了了 阅读(362) 评论(0) 推荐(0)

导航