摘要:
和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。 lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于
阅读全文
posted @ 2019-11-22 17:13
lshan
阅读(197)
推荐(0)
摘要:
模糊查询: def Sprider1(): pass url="http://juji123.net/tag/5_2.html" headers={ "User-Agent":"Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (
阅读全文
posted @ 2019-11-22 17:12
lshan
阅读(204)
推荐(0)
摘要:
新立得是Ubuntu的包管理工具 apt 的图形化前端。它结合了图形界面的简单操作和 apt-get 命令行工具的强大功能。您可以使用新立得安装、删除、配置、升级软件包,对软件包列表进行浏览、排序、搜索以及管理软件仓库或者升级整个系统。您可以进行一些系列操作形成操作队列,并一起执行它们。新立得会提示
阅读全文
posted @ 2019-11-21 18:44
lshan
阅读(1117)
推荐(0)
摘要:
Linux基本命令15:在终端中下载网络文件(wget) 2018-10-30 13:20:54 玉成226 阅读数 1895更多 分类专栏: 【linux常用命令】 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://
阅读全文
posted @ 2019-11-20 14:58
lshan
阅读(661)
推荐(0)
摘要:
网址:http://chromecj.com/list/
阅读全文
posted @ 2019-11-19 21:40
lshan
阅读(407)
推荐(0)
摘要:
参考:https://www.jb51.net/article/141830.htm 官网:https://docs.python.org/3/library/re.html re.compile() 函数 编译正则表达式模式,返回一个对象。可以把常用的正则表达式编译成正则表达式对象,方便后续调用及
阅读全文
posted @ 2019-11-19 16:30
lshan
阅读(588)
推荐(0)
摘要:
proxy代理 (通用代理) import requests url='http://docs.python-requests.org/en/master/' proxies={ 'http':'127.0.0.1:8080', 'https':'127.0.0.1:8080' } r = requ
阅读全文
posted @ 2019-11-17 22:06
lshan
阅读(36371)
推荐(0)
摘要:
装饰器,timer or log 打印日志以及方法运行时间 对于异步方法: from functools import wraps import traceback import time def async_time_fun(func): @wraps(func) async def log(*a
阅读全文
posted @ 2019-11-17 16:15
lshan
阅读(413)
推荐(0)
摘要:
目的: 将如下改写成 "key":"value" 形式 方案:使用正则: Find What : ^(.*)=(.*)$ replace With "\1" : "\2"
阅读全文
posted @ 2019-11-16 19:32
lshan
阅读(213)
推荐(0)
摘要:
def json_path_value(jsondict,path): try: num=1 pahts = path.split(".") mydict={} for p in pahts: if num==1: mydict = jsondict[p+""] num=num+1 else: my
阅读全文
posted @ 2019-11-15 12:00
lshan
阅读(1877)
推荐(0)