上一页 1 ··· 40 41 42 43 44 45 46 47 48 ··· 87 下一页
摘要: 和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。 lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于 阅读全文
posted @ 2019-11-22 17:13 lshan 阅读(197) 评论(0) 推荐(0)
摘要: 模糊查询: def Sprider1(): pass url="http://juji123.net/tag/5_2.html" headers={ "User-Agent":"Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 ( 阅读全文
posted @ 2019-11-22 17:12 lshan 阅读(204) 评论(0) 推荐(0)
摘要: 新立得是Ubuntu的包管理工具 apt 的图形化前端。它结合了图形界面的简单操作和 apt-get 命令行工具的强大功能。您可以使用新立得安装、删除、配置、升级软件包,对软件包列表进行浏览、排序、搜索以及管理软件仓库或者升级整个系统。您可以进行一些系列操作形成操作队列,并一起执行它们。新立得会提示 阅读全文
posted @ 2019-11-21 18:44 lshan 阅读(1117) 评论(0) 推荐(0)
摘要: Linux基本命令15:在终端中下载网络文件(wget) 2018-10-30 13:20:54 玉成226 阅读数 1895更多 分类专栏: 【linux常用命令】 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https:// 阅读全文
posted @ 2019-11-20 14:58 lshan 阅读(661) 评论(0) 推荐(0)
摘要: 网址:http://chromecj.com/list/ 阅读全文
posted @ 2019-11-19 21:40 lshan 阅读(407) 评论(0) 推荐(0)
摘要: 参考:https://www.jb51.net/article/141830.htm 官网:https://docs.python.org/3/library/re.html re.compile() 函数 编译正则表达式模式,返回一个对象。可以把常用的正则表达式编译成正则表达式对象,方便后续调用及 阅读全文
posted @ 2019-11-19 16:30 lshan 阅读(588) 评论(0) 推荐(0)
摘要: proxy代理 (通用代理) import requests url='http://docs.python-requests.org/en/master/' proxies={ 'http':'127.0.0.1:8080', 'https':'127.0.0.1:8080' } r = requ 阅读全文
posted @ 2019-11-17 22:06 lshan 阅读(36371) 评论(0) 推荐(0)
摘要: 装饰器,timer or log 打印日志以及方法运行时间 对于异步方法: from functools import wraps import traceback import time def async_time_fun(func): @wraps(func) async def log(*a 阅读全文
posted @ 2019-11-17 16:15 lshan 阅读(413) 评论(0) 推荐(0)
摘要: 目的: 将如下改写成 "key":"value" 形式 方案:使用正则: Find What : ^(.*)=(.*)$ replace With "\1" : "\2" 阅读全文
posted @ 2019-11-16 19:32 lshan 阅读(213) 评论(0) 推荐(0)
摘要: def json_path_value(jsondict,path): try: num=1 pahts = path.split(".") mydict={} for p in pahts: if num==1: mydict = jsondict[p+""] num=num+1 else: my 阅读全文
posted @ 2019-11-15 12:00 lshan 阅读(1877) 评论(0) 推荐(0)
上一页 1 ··· 40 41 42 43 44 45 46 47 48 ··· 87 下一页