摘要:迭代(Iteration) ​ 当我们使⽤⼀个循环来遍历某个东西时,这就叫⼀个迭代。 可迭代对象(Iterable) ​ ⼀个可迭代对象是Python中任意的对象,只要它定义了可以返回⼀个迭代器的 ⽅法,或者定义了可以⽀持下标索引的 ⽅法。简单说,⼀个可迭代对象,就是任意的对象,只要它能给我们提供⼀ 阅读全文
posted @ 2019-09-14 20:40 Sroxi 阅读 (3) 评论 (0) 编辑
摘要:递归函数 直接或间接地调用自身以进行循环的函数 函数间接调用 函数的属性 匿名函数lambda ​ lambda是一个表达式,而不是一个语句 。因为这一点,lambda能出现在不允许def出现的地方,例如,在一个列表常量中或函数调用的参数中。lambda返回了一个新的函数,可以 选择性地赋值给一个变 阅读全文
posted @ 2019-09-13 21:12 Sroxi 阅读 (2) 评论 (0) 编辑
摘要:一、背景 相关博文:https://www.jianshu.com/p/9fce799edf1e https://blog.csdn.net/h19910518/article/details/79348051 Cookie ​ HTTP协议它是无状态的,就是说这一次请求和上一次请求是没有任何关系的 阅读全文
posted @ 2019-09-11 10:57 Sroxi 阅读 (3) 评论 (0) 编辑
摘要:1.什么是代理? ​ 代理:将网络请求发送给代理服务器,通过代理服务器做中介,将请求转发给目标服务器并将响应返回,从而完成网络通信。 2.为什么使用代理? ​ 使用爬虫抓取批量资源时,在短时间内会对服务器发起高频请求,服务器会判定这些高频请求不是“普通访客”发起的,从而拒绝该IP的发起的请求,但是我 阅读全文
posted @ 2019-09-09 12:48 Sroxi 阅读 (6) 评论 (0) 编辑
摘要:1.先在浏览器中检查charset 例如``,'utf 8'比较常见,也有“gbk”, ​ 对get返回的对象的编码,进行相应的调整 2.尝试使用content属性代替text 3.对于局部乱码(多为中文),例如img标签中的“alt"属性可尝试使用‘’iso 8859 1"进行编码,然后使用‘’g 阅读全文
posted @ 2019-09-09 12:28 Sroxi 阅读 (4) 评论 (0) 编辑
摘要:1.位置参数:从左至右进行匹配 2.关键字参数:通过参数名进行匹配 3.默认参数:为没有传入值的参数定义参数值 4.可变参数(动态传参):收集任意多基于位置或关键字的参数 参数出现顺序 ​ 在函数中,参数出现顺序为:位置参数、关键字参数、默认参数(函数定义时)、任意长度的位置参数、任意长度的关键字参 阅读全文
posted @ 2019-09-07 11:47 Sroxi 阅读 (3) 评论 (0) 编辑
摘要:‘//’表示若干层(包括一层)嵌套下, ‘/’表示一层嵌套。 索引从1开始。 以标签结束,则返回元素为内存地址的一个列表。 取文本: 取属性:/@attr 例如: 多重限定条件 模糊匹配 匹配类名中含有‘xx'的div标签 匹配类名以‘xx'开始的div标签 "|"表示或 " “ 表示所有,例如: 阅读全文
posted @ 2019-09-06 07:45 Sroxi 阅读 (4) 评论 (0) 编辑
摘要:介绍:将一个html文档转换成BeautifulSoup对象,然后通过对象的方法或属性查找指定的节点内容 转换本地文件: ​ soup = BeautifulSoup(fp,'lxml') fp为文档对象 转换网络文件: soup = BeautifulSoup('str/bytes','lxml' 阅读全文
posted @ 2019-09-05 12:40 Sroxi 阅读 (6) 评论 (0) 编辑
摘要:函数1——作用域相关 为何使用函数? 减少代码冗余和增加代码的可读性 1.函数的一些概念 def 是可执行的代码。def是一个可执行的语句——函数并不存在,直到函数运行了def 后(函数被调用后)才存在。def语句在模块文件中编写,在模块文件第一次被导入的时候生成定义的函数。 def创建了一个对象并 阅读全文
posted @ 2019-09-04 17:48 Sroxi 阅读 (11) 评论 (0) 编辑
摘要:一、正则表达式 在线测试工具 http://tool.chinaz.com/regex/ 1.字符组 1. ​ 在 同一个位置 可能出现的各种字符组成一个字符组,在正则表达中用[ ]表示 2. ​ 一个正则就是一条匹配规则,可以规定一次匹配字符的长度,字符组每次匹配一个长度为1的字符,例如:待匹配字 阅读全文
posted @ 2019-09-01 16:45 Sroxi 阅读 (24) 评论 (0) 编辑