随笔分类 - 编程基础—python
摘要:先运行一个干净的argparse 由于没有添加任何参数,所以只能用自带的 -h(--help)参数 现在来加一个参数 所以echo为必填项 描述在-h时会出现 type=int指定参数只能是数字,否则会报错!! 在参数名前加-(--)会怎么样 成了可选项 但是万一缺省一个可选项就会报错 这不是我理解
阅读全文
摘要:数据去重 不同根目录下引用另一个库 json文件的读写 设置代理时,同一个代理使用次数太多可能会出现如下情况
阅读全文
摘要:import sys import time def view_bar(num,total): rate = num / total rate_num = int(rate * 100) r = '\r%d%%%s>' % (rate_num,'='*num) sys.stdout.write(r)
阅读全文
摘要:Requests 是使用 Apache2 Licensed 许可证的 HTTP 库。用 Python 编写,真正的为人类着想。 Python 标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能,但是它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚
阅读全文
摘要:信息提取 1.通过Tag对象的属性和方法 2.通过标签树对象的find_all()方法 3.通过标签树对象的find()方法 4.通过CSS选择器 遍历 1.下行遍历 \c \c 2.上行遍历 \c 3.水平遍历
阅读全文
摘要:正则在线测试 http://tool.oschina.net/regex https://www.regexpal.com/ http://tool.chinaz.com/regex exp1:筛选所有邮箱(非贪心的所有遍历) exp2:筛选:非贪婪,找出以a开头123结束的字符串
阅读全文
摘要:目录 1. Python3 使用urllib库请求网络 1.1 基于urllib库的GET请求 1.2 使用User-Agent伪装后请求网站 1.3 基于urllib库的POST请求,并用Cookie保持会话 1.4 基于urllib库使用代理请求 2. Python3 使用requsets库访问
阅读全文
摘要:0x01 URL的解析/反解析/连接 解析 urlparse()--分解URL # -*- coding: UTF-8 -*- from urlparse import urlparse url = 'http://user:pwd@NetLoc:80/p1;param/p2?query=arg#f
阅读全文
摘要:网络上寻找主机 使用gethostbyname()访问操作系统主机名解析API,将服务器名字转换为其数字地址。 使用gethostbyname_ex(),返回服务器的标准主机名/所有别名/以及所有ip地址。 如果得到一个服务器地址,通过gethostbyaddr()可以用来逆向查找得到主机名。(只有
阅读全文