上一页 1 ··· 4 5 6 7 8 9 下一页
摘要: String 类 Attribute and methodanchor() 创建一个<a>标签的实例,将其name属性设置为被传递给此方法的字符串big() 将字符串转换为<big>标签的一个实例blink() 将字符串转换为<blink>标签的一个实例bold() 将字符串转换为<bold>标签的 阅读全文
posted @ 2017-04-28 11:09 pxuan 阅读(620) 评论(0) 推荐(0)
摘要: Hack是针对不同的浏览器去写不同的CSS样式,从而让各浏览器能达到一致的渲染效果,那么针对不同的浏览器写不同的CSS CODE的过程,就叫CSS HACK,同时也叫写CSS Hack。然后将Hack放在浏览器特定的CSS文件中,让其符合条件的浏览器解析这些代码,就如前面所说的条件样式,我们将CSS 阅读全文
posted @ 2017-03-29 16:23 pxuan 阅读(328) 评论(0) 推荐(0)
摘要: 输入任何整数都能求和 阅读全文
posted @ 2017-03-23 10:21 pxuan 阅读(531) 评论(0) 推荐(0)
摘要: 在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,正则表达式! 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规 阅读全文
posted @ 2017-02-27 13:54 pxuan 阅读(516) 评论(0) 推荐(0)
摘要: 大家好哈,上一节我们研究了一下爬虫的异常处理问题,那么接下来我们一起来看一下Cookie的使用。 为什么要使用Cookie呢? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取 阅读全文
posted @ 2017-02-27 13:51 pxuan 阅读(707) 评论(0) 推荐(0)
摘要: 大家好,本节在这里主要说的是URLError还有HTTPError,以及对它们的一些处理。 1.URLError 首先解释下URLError可能产生的原因: 网络无连接,即本机无法上网 连接不到特定的服务器 服务器不存在 在代码中,我们需要用try-except语句来包围并捕获相应的异常。下面是一个 阅读全文
posted @ 2017-02-27 13:47 pxuan 阅读(3987) 评论(0) 推荐(0)
摘要: 1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。 首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如知乎,点登录之后,我们会发现 阅读全文
posted @ 2017-02-27 13:46 pxuan 阅读(265) 评论(0) 推荐(0)
摘要: 1.什么是爬虫 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个由你来控制它咯。 比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张 阅读全文
posted @ 2017-02-27 13:44 pxuan 阅读(216) 评论(0) 推荐(0)
摘要: 那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他 阅读全文
posted @ 2017-02-27 13:44 pxuan 阅读(335) 评论(0) 推荐(0)
摘要: 大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。 Python版本:2.7,Python 3请另寻其他博文。 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网 阅读全文
posted @ 2017-02-27 13:43 pxuan 阅读(351) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 下一页