上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 29 下一页
摘要: 爬取百度贴吧的帖子。与上一篇不同的是,这次我们需要用到文件的相关操作。 本篇目标 1.URL格式的确定 首先,我们先观察一下百度贴吧的任意一个帖子。 比如:http://tieba.baidu.com/p/3138733512?see_lz=1&pn=1,这是一个关于NBA50大的盘点,分析一下这个 阅读全文
posted @ 2017-06-21 16:27 AlamZ 阅读(495) 评论(0) 推荐(0)
摘要: 本篇目标 1.URL的格式 在这里我们用到的URL是 http://mm.taobao.com/json/request_top_list.htm?page=1,问号前面是基地址,后面的参数page是代表第几页,可以随意更换地址。点击开之后,会发现有一些淘宝MM的简介,并附有超链接链接到个人详情页面 阅读全文
posted @ 2017-06-21 16:08 AlamZ 阅读(454) 评论(0) 推荐(0)
摘要: 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来。 本篇目标 糗事百科是不需要登录的,所以也没必要用到Cookie,另外糗事百科有的段子是附图的,我们把图抓下来图片不便于显示,那么我们就尝试过滤掉有图的段子吧。 好,现在我们尝试抓取一下糗事百科的热门 阅读全文
posted @ 2017-06-21 15:49 AlamZ 阅读(239) 评论(0) 推荐(0)
摘要: 1.创建 Beautiful Soup 对象 2.四大对象种类 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag NavigableString BeautifulSoup Comment 2.1 tag 2.2  阅读全文
posted @ 2017-06-21 15:20 AlamZ 阅读(237) 评论(0) 推荐(0)
摘要: Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库保存我们登录的Cookie,然后再抓取其他页面就达到目的了。 在此之前呢 阅读全文
posted @ 2017-06-21 14:14 AlamZ 阅读(225) 评论(0) 推荐(0)
摘要: 1.URLError 首先解释下URLError可能产生的原因: 网络无连接,即本机无法上网 连接不到特定的服务器 服务器不存在 在代码中,我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子,先感受下它的风骚 import urllib2 requset = urllib2.R 阅读全文
posted @ 2017-06-21 13:59 AlamZ 阅读(1497) 评论(0) 推荐(0)
摘要: 1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。 另外,我们还有对付”反盗链”的方式,对付防盗链,服务器会识别headers中的referer是不是它自己,如果不是,有的 阅读全文
posted @ 2017-06-21 13:51 AlamZ 阅读(327) 评论(0) 推荐(0)
摘要: 1.简单使用 2.运行结果是完全一样的,只不过中间多了一个request对象,推荐大家这么写,因为在构建请求时还需要加入好多内容,通过构建一个request,服务器响应请求得到应答,这样显得逻辑上清晰明确。 3.POST方式 4.GET方式 阅读全文
posted @ 2017-06-21 13:46 AlamZ 阅读(181) 评论(0) 推荐(0)
摘要: 单例模式就是防止每个请求到来,都需要在内存里创建一个实例,再通过该实例执行指定的方法。 如果并发量大的话,内存里就会存在非常多功能上一模一样的对象。存在这些对象肯定会消耗内存,对于这些功能相同的对象可以在内存中仅创建一个,需要时都去调用.单例模式用来保证内存中仅存在一个实例!!! 通过面向对象的特性 阅读全文
posted @ 2017-06-20 17:18 AlamZ 阅读(164) 评论(0) 推荐(0)
摘要: 1、异常基础 在编程过程中为了增加友好性,在程序出现bug时一般不会将错误信息显示给用户,而是现实一个提示的页面,通俗来说就是不让用户看见大黄页!!! 需求:将用户输入的两个数字相加 2、异常种类 python中的异常种类非常多,每个异常专门用于处理某一项异常!!! 在python的异常中,有一个万 阅读全文
posted @ 2017-06-20 15:55 AlamZ 阅读(144) 评论(0) 推荐(0)
上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 29 下一页