2017年3月20日
摘要: yield的英文单词意思是生产,刚接触Python的时候感到非常困惑,一直没弄明白yield的用法。 只是粗略的知道yield可以用来为一个函数返回值塞数据,比如下面的例子: 取出alist的每一项,然后把i + 1塞进去。然后通过调用取出每一项; 这的确是yield应用的一个例子 1. 包含yie 阅读全文
posted @ 2017-03-20 21:31 加油AlwaysWin 阅读(337) 评论(0) 推荐(0) 编辑
  2017年1月12日
摘要: 1 #!/usr/bin/env python3 2 # -*- coding: utf-8 -*- 3 4 from functools import reduce 5 6 CHAR_TO_INT = { 7 '0': 0, 8 '1': 1, 9 '2': 2, 10 '3': 3, 11 '4': 4, 12 '5': ... 阅读全文
posted @ 2017-01-12 15:06 加油AlwaysWin 阅读(2272) 评论(0) 推荐(0) 编辑
  2017年1月3日
摘要: 在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,正则表达式! 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规 阅读全文
posted @ 2017-01-03 15:25 加油AlwaysWin 阅读(507) 评论(0) 推荐(0) 编辑
  2016年12月30日
摘要: 本节我们一起来看一下Cookie的使用。 为什么要使用Cookie呢? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库 阅读全文
posted @ 2016-12-30 16:53 加油AlwaysWin 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。 首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如知乎,点登录之后,我们会发现 阅读全文
posted @ 2016-12-30 15:37 加油AlwaysWin 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他 阅读全文
posted @ 2016-12-30 14:17 加油AlwaysWin 阅读(271) 评论(0) 推荐(0) 编辑
摘要: Python字符串的相关操作 1.字符串格式判断 2.字符串大小写转换 阅读全文
posted @ 2016-12-30 13:26 加油AlwaysWin 阅读(234) 评论(0) 推荐(0) 编辑
  2016年12月29日
摘要: 大家好,本节在这里主要说的是URLError还有HTTPError,以及对它们的一些处理。 1.URLError 首先解释下URLError可能产生的原因: (1)网络无连接,即本机无法上网 (2)连接不到特定的服务器 (3)服务器不存在 在代码中,我们需要用try-except语句来包围并捕获相应 阅读全文
posted @ 2016-12-29 18:08 加油AlwaysWin 阅读(353) 评论(0) 推荐(0) 编辑
  2016年12月28日
摘要: 用Python中的Tkinter模块写的一个简单的记事本程序,Python2.x和Python3.x的许多内置函数有所改变,所以以下分为Python2.x和Python3.x版本。 一.效果展示: 二.Python3.x版本的记事本程序 三.Python2.x版本的记事本程序 阅读全文
posted @ 2016-12-28 09:30 加油AlwaysWin 阅读(7277) 评论(2) 推荐(1) 编辑
  2016年12月27日
摘要: Python2.X和Python3.X文件对话框、下拉列表的不同 今天初次使用Python Tkinter来做了个简单的记事本程序。发现Python2.x和Python3.x的Tkinter模块的好多内置函数都有所改变,这里简单整理一下以备日后查验。 一.导入方式: Python2.x: from 阅读全文
posted @ 2016-12-27 14:41 加油AlwaysWin 阅读(12484) 评论(0) 推荐(0) 编辑