renzz

2017年11月5日

大家好哈，上一节我们研究了一下爬虫的异常处理问题，那么接下来我们一起来看一下Cookie的使用。为什么要使用Cookie呢？ Cookie，指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据（通常经过加密）比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取 Read More

posted @ 2017-11-05 08:51 renzz Views(198) Comments(0) Diggs(0)

Python爬虫入门（5）：URLError异常处理

大家好，本节在这里主要说的是URLError还有HTTPError，以及对它们的一些处理。 1.URLError 首先解释下URLError可能产生的原因：网络无连接，即本机无法上网连接不到特定的服务器服务器不存在在代码中，我们需要用try-except语句来包围并捕获相应的异常。下面是一个 Read More

posted @ 2017-11-05 08:45 renzz Views(355) Comments(0) Diggs(0)

Python爬虫入门（4）：Urllib库的高级用法

1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问，如果识别有问题，那么站点根本不会响应，所以为了完全模拟浏览器的工作，我们需要设置一些Headers 的属性。首先，打开我们的浏览器，调试浏览器F12，我用的是Chrome，打开网络监听，示意如下，比如知乎，点登录之后，我们会发现 Read More

posted @ 2017-11-05 08:43 renzz Views(144) Comments(0) Diggs(0)

Python爬虫入门（3）：Urllib库的基本使用

那么接下来，小伙伴们就一起和我真正迈向我们的爬虫之路吧。 1.分分钟扒一个网页下来怎样扒网页呢？其实就是根据URL来获取它的网页信息，虽然我们在浏览器中看到的是一幅幅优美的画面，但是其实是由浏览器解释才呈现出来的，实质它是一段HTML代码，加 JS、CSS，如果把网页比作一个人，那么HTML便是 Read More

posted @ 2017-11-05 08:39 renzz Views(186) Comments(0) Diggs(0)

Python爬虫入门（2）：爬虫基础了解

1.什么是爬虫爬虫，即网络爬虫，大家可以理解为在网络上爬行的一直蜘蛛，互联网就比作一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛咯，如果它遇到资源，那么它就会抓取下来。想抓取什么？这个由你来控制它咯。比如它在抓取一个网页，在这个网中他发现了一条道路，其实就是指向网页的超链接，那么它就可以爬到另一张 Read More

posted @ 2017-11-05 08:37 renzz Views(143) Comments(0) Diggs(0)

Python爬虫入门（1）：综述

大家好哈，最近博主在学习Python，学习期间也遇到一些问题，获得了一些经验，在此将自己的学习系统地整理下来，如果大家有兴趣学习爬虫的话，可以将这些文章作为参考，也欢迎大家一共分享学习经验。 Python版本:2.7，Python 3请另寻其他博文。首先爬虫是什么？网络爬虫（又被称为网页蜘蛛，网 Read More

posted @ 2017-11-05 08:33 renzz Views(190) Comments(0) Diggs(0)

2017年11月3日

Selenium自动化测试----简介

一.Selenium是什么？ Selenium是ThroughtWorks公司一个强大的开源Web功能测试工具系列，本系列现在主要包括以下4款： 1.Selenium Core：支持DHTML的测试案例（效果类似数据驱动测试），它是Selenium IDE和Selenium RC的引擎。 2.Sel Read More

posted @ 2017-11-03 15:53 renzz Views(241) Comments(0) Diggs(0)

2017年10月31日

HTTP错误列表

HTTP 400 - 请求无效 HTTP 401.1 - 未授权：登录失败 HTTP 401.2 - 未授权：服务器配置问题导致登录失败 HTTP 401.3 - ACL 禁止访问资源 HTTP 401.4 - 未授权：授权被筛选器拒绝 HTTP 401.5 - 未授权：ISAPI 或 CGI 授权 Read More

posted @ 2017-10-31 09:36 renzz Views(234) Comments(0) Diggs(0)

公告