随笔分类 -  Python学习

摘要:GitHub代码练习地址:用lxml解析HTML,文件读取,etree和XPath的配合使用:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac17_xpath%26lxml.py XML- XML(EXtensibleMa 阅读全文
posted @ 2019-03-20 04:56 chalee3 阅读(444) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:正则1:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac15_RE1.py 正则2:match、search、findall函数的使用案例:https://github.com/Neo-ML/Py 阅读全文
posted @ 2019-03-19 05:21 chalee3 阅读(517) 评论(0) 推荐(1)
摘要:GitHub代码练习地址:1.两种简单get请求方法:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac13_requests1.py 2.带请求头与参数的get请求:https://github.com/Neo-ML/Py 阅读全文
posted @ 2019-03-18 07:33 chalee3 阅读(2467) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac12_ajax.py 了解ajax 是一种异步请求 一定会有url,请求方法,可能有数据 一般使用json格式 案例,爬取部分豆瓣电影排行榜, 代码 阅读全文
posted @ 2019-03-18 04:12 chalee3 阅读(358) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:1.手动利用cookie访问网页:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac10_cookie1.py 2.自动利用cookie访问人人主页:https://github.com/Neo-M 阅读全文
posted @ 2019-03-15 10:28 chalee3 阅读(347) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac09_ProxyHandler.pyProxyHandler处理(代理服务器) 使用代理IP,是爬虫的常用手段提供代理服务器的地址有很多,例如: w 阅读全文
posted @ 2019-03-15 04:33 chalee3 阅读(542) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac08_useragent.py 阅读全文
posted @ 2019-03-15 00:27 chalee3 阅读(609) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:URLError:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac06_URLError.py HTTPError:https://github.com/Neo-ML/PythonPractice 阅读全文
posted @ 2019-03-14 06:16 chalee3 阅读(1302) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:①利用parse模拟post请求:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac04_parse-post.py ②parse功能简单应用:https://github.com/Neo-ML/P 阅读全文
posted @ 2019-03-13 14:06 chalee3 阅读(602) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac02_chardet.py网页编码问题解决 chardet 可以自动检测页面文件的编码格式,但是,可能有误 需要安装, conda install 阅读全文
posted @ 2019-03-04 15:26 chalee3 阅读(350) 评论(0) 推荐(0)
摘要:GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac01_urlopen.py 阅读全文
posted @ 2019-03-03 20:46 chalee3 阅读(186) 评论(0) 推荐(0)
摘要:抽象类- 抽象方法: 没有具体实现内容的方法成为抽象方法- 抽象方法的主要意义是规范了子类的行为和接口- 抽象类的使用需要借助abc模块 import abc - 抽象类:包含抽象方法的类叫抽象类,通常成为ABC类- 抽象类的使用 - 抽象类可以包含抽象方法,也可以包含具体方法 - 抽象类中可以有方 阅读全文
posted @ 2019-03-03 16:07 chalee3 阅读(166) 评论(0) 推荐(0)
摘要:魔术方法就是不需要人为调用的方法,基本是在特定的时刻自动触发- 魔术方法的统一的特征,方法名被前后各两个下滑线包裹- 操作类 - `__init__`: 构造函数 - `__new__`: 对象实例化方法,此函数较特殊,一般不需要使用 - `__call__`: 对象当函数使用的时候触发 - `__ 阅读全文
posted @ 2019-02-21 00:34 chalee3 阅读(196) 评论(0) 推荐(0)
摘要:1 类相关函数- issubclass:检测一个类是否是另一个类的子类- isinstance:检测一个对象是否是一个类的实例- hasattr:检测一个对象是否由成员xxx- getattr: get attribute- setattr: set attribute- delattr: dele 阅读全文
posted @ 2019-02-19 19:21 chalee3 阅读(233) 评论(0) 推荐(0)
摘要:面向对象的三大特性- 封装- 继承- 多态1 封装 - 封装就是对对象的成员进行访问限制- 封装的三个级别: - 公开,public - 受保护的,protected - 私有的,private - public,private,protected不是关键字- 判别对象的位置 - 对象内部 - 对象 阅读全文
posted @ 2019-02-18 11:36 chalee3 阅读(217) 评论(0) 推荐(0)
摘要:# 3. 类和对象的成员分析- 类和对象都可以存储成员,成员可以归类所有,也可以归对象所有- 类存储成员时使用的是与类关联的一个对象- 独享存储成员是是存储在当前对象中- 对象访问一个成员时,如果对象中没有该成员,尝试访问类中的同名成员, 如果对象中有此成员,一定使用对象中的成员- 创建对象的时候, 阅读全文
posted @ 2019-02-18 00:58 chalee3 阅读(242) 评论(0) 推荐(0)
摘要:del删除时候指定下标,remove必须指定具体的值 阅读全文
posted @ 2019-01-20 01:18 chalee3 阅读(431) 评论(0) 推荐(0)
摘要:正则表达式(RegularExpression, re)- 是一个计算机科学的概念- 用于使用单个字符串来描述,匹配符合某个规则的字符串- 常常用来检索,替换某些模式的文本# 正则的写法- .(点号):表示任意一个字符,除了\n, 比如查找所有的一个字符 \.- []: 匹配中括号中列举的任意字符, 阅读全文
posted @ 2019-01-15 17:21 chalee3 阅读(208) 评论(0) 推荐(0)
摘要:Python的面向对象- 面向对象编程 - 基础 - 公有私有 - 继承 - 组合,Mixin- 魔法函数 - 魔法函数概述 - 构造类魔法函数 - 运算类魔法函数 # 1. 面向对象概述(ObjectOriented,OO)- OOP思想 - 接触到任意一个任务,首先想到的是任务这个世界的构成,是 阅读全文
posted @ 2019-01-08 06:09 chalee3 阅读(245) 评论(0) 推荐(0)