随笔分类 - Python学习
摘要:GitHub代码练习地址:用lxml解析HTML,文件读取,etree和XPath的配合使用:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac17_xpath%26lxml.py XML- XML(EXtensibleMa
阅读全文
摘要:GitHub代码练习地址:正则1:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac15_RE1.py 正则2:match、search、findall函数的使用案例:https://github.com/Neo-ML/Py
阅读全文
摘要:GitHub代码练习地址:1.两种简单get请求方法:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac13_requests1.py 2.带请求头与参数的get请求:https://github.com/Neo-ML/Py
阅读全文
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac12_ajax.py 了解ajax 是一种异步请求 一定会有url,请求方法,可能有数据 一般使用json格式 案例,爬取部分豆瓣电影排行榜, 代码
阅读全文
摘要:GitHub代码练习地址:1.手动利用cookie访问网页:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac10_cookie1.py 2.自动利用cookie访问人人主页:https://github.com/Neo-M
阅读全文
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac09_ProxyHandler.pyProxyHandler处理(代理服务器) 使用代理IP,是爬虫的常用手段提供代理服务器的地址有很多,例如: w
阅读全文
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac08_useragent.py
阅读全文
摘要:GitHub代码练习地址:URLError:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac06_URLError.py HTTPError:https://github.com/Neo-ML/PythonPractice
阅读全文
摘要:GitHub代码练习地址:①利用parse模拟post请求:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac04_parse-post.py ②parse功能简单应用:https://github.com/Neo-ML/P
阅读全文
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac02_chardet.py网页编码问题解决 chardet 可以自动检测页面文件的编码格式,但是,可能有误 需要安装, conda install
阅读全文
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac01_urlopen.py
阅读全文
摘要:抽象类- 抽象方法: 没有具体实现内容的方法成为抽象方法- 抽象方法的主要意义是规范了子类的行为和接口- 抽象类的使用需要借助abc模块 import abc - 抽象类:包含抽象方法的类叫抽象类,通常成为ABC类- 抽象类的使用 - 抽象类可以包含抽象方法,也可以包含具体方法 - 抽象类中可以有方
阅读全文
摘要:魔术方法就是不需要人为调用的方法,基本是在特定的时刻自动触发- 魔术方法的统一的特征,方法名被前后各两个下滑线包裹- 操作类 - `__init__`: 构造函数 - `__new__`: 对象实例化方法,此函数较特殊,一般不需要使用 - `__call__`: 对象当函数使用的时候触发 - `__
阅读全文
摘要:1 类相关函数- issubclass:检测一个类是否是另一个类的子类- isinstance:检测一个对象是否是一个类的实例- hasattr:检测一个对象是否由成员xxx- getattr: get attribute- setattr: set attribute- delattr: dele
阅读全文
摘要:面向对象的三大特性- 封装- 继承- 多态1 封装 - 封装就是对对象的成员进行访问限制- 封装的三个级别: - 公开,public - 受保护的,protected - 私有的,private - public,private,protected不是关键字- 判别对象的位置 - 对象内部 - 对象
阅读全文
摘要:# 3. 类和对象的成员分析- 类和对象都可以存储成员,成员可以归类所有,也可以归对象所有- 类存储成员时使用的是与类关联的一个对象- 独享存储成员是是存储在当前对象中- 对象访问一个成员时,如果对象中没有该成员,尝试访问类中的同名成员, 如果对象中有此成员,一定使用对象中的成员- 创建对象的时候,
阅读全文
摘要:del删除时候指定下标,remove必须指定具体的值
阅读全文
摘要:正则表达式(RegularExpression, re)- 是一个计算机科学的概念- 用于使用单个字符串来描述,匹配符合某个规则的字符串- 常常用来检索,替换某些模式的文本# 正则的写法- .(点号):表示任意一个字符,除了\n, 比如查找所有的一个字符 \.- []: 匹配中括号中列举的任意字符,
阅读全文
摘要:Python的面向对象- 面向对象编程 - 基础 - 公有私有 - 继承 - 组合,Mixin- 魔法函数 - 魔法函数概述 - 构造类魔法函数 - 运算类魔法函数 # 1. 面向对象概述(ObjectOriented,OO)- OOP思想 - 接触到任意一个任务,首先想到的是任务这个世界的构成,是
阅读全文

浙公网安备 33010602011771号