摘要:
lxml 用于获取非结构化数据 lxml模块可以利用XPath规则语法,来快速的定位HTML\XML 文档中特定元素以及获取节点信息(文本内容、属性值) XPath (XML Path Language) 是一门在 HTML\XML 文档中查找信息的语言,可用来在 HTML\XML 文档中对元素和属 阅读全文
posted @ 2019-09-08 09:24
π=3.1415926
阅读(128)
评论(0)
推荐(0)
摘要:
jsonpath 用于处理爬虫爬取的json结构化数据 阅读全文
posted @ 2019-09-08 09:24
π=3.1415926
阅读(149)
评论(0)
推荐(0)
摘要:
requests Request:浏览器发送信息给该网址所在的服务器,这个过程就叫做HTTP Request。 request中包含 请求方式:请求方式的主要类型是GET,POST两种,另外还有HEAD、PUT、DELETE等。GET 请求的请求参数会显示在URL链接的后面,比如我们打开百度,搜索“ 阅读全文
posted @ 2019-09-08 09:24
π=3.1415926
阅读(147)
评论(0)
推荐(0)
摘要:
selenium 利用浏览器原生的API,封装成一套更加面向对象的Selenium WebDriver API,直接操作浏览器页面里的元素,甚至操作浏览器本身(截屏,窗口大小,启动,关闭,安装插件,配置证书之类的) 提取数据 driver对象 driver管理了所有东西 其他方法 阅读全文
posted @ 2019-09-08 09:21
π=3.1415926
阅读(135)
评论(0)
推荐(0)
摘要:
bs4 一个方便的网页解析库,处理高效,支持多种解析器。 主流的是Python标准库html.parser,一个是lxml解析器 内置标准库执行速度一般,在低版本的Python中,中文的容错能力比较差 lxml解析器执行速度快,需要装C语言依赖库 soup.prettify() 进行自动补全,将缺失 阅读全文
posted @ 2019-09-08 09:21
π=3.1415926
阅读(123)
评论(0)
推荐(0)
摘要:
#hashlib 特点 1 只要传入的内容一样,得到的hash值必然一样 >要用明文传输密码文件完整性校验 2 不能由hash值返解成内容 》把密码做成hash值,不应该在网络传输明文密码(只能有内容返回hash值) 3 只要使用的hash算法不变,无论校验的内容有多大,得到的hash值长度是固定的 阅读全文
posted @ 2019-09-08 09:21
π=3.1415926
阅读(112)
评论(0)
推荐(0)
摘要:
js2py 阅读全文
posted @ 2019-09-08 09:20
π=3.1415926
阅读(159)
评论(0)
推荐(0)
摘要:
numpy 为什么numpy运算比纯Python要块 属性 数组维数,一维是1,二维是2... 数组中的元素 数量,总的数据量 二维矩阵5行8列数量为40 一个数组元素的 空间大小(字节) ndarray的类型 创建数组的时候指定类型 若不指定,整数默认int64,小数默认float64 字符串 n 阅读全文
posted @ 2019-09-08 09:20
π=3.1415926
阅读(584)
评论(0)
推荐(0)
摘要:
socket 阅读全文
posted @ 2019-09-08 09:20
π=3.1415926
阅读(118)
评论(0)
推荐(0)
摘要:
简练的写法,用 对字典进行查分 阅读全文
posted @ 2019-09-08 09:19
π=3.1415926
阅读(247)
评论(0)
推荐(0)

浙公网安备 33010602011771号