bs4 - Beautiful Soup
摘要:转载自 https://www.cnblogs.com/gl1573/p/9480022.html 概述 bs4 全名 BeautifulSoup,是编写 python 爬虫常用库之一,主要用来解析 html 标签。 一、初始化 from bs4 import BeautifulSoup soup
阅读全文
posted @
2019-11-29 10:25
天马行宇
阅读(1467)
推荐(0)
Python3 日志(内置logging模块)
摘要:转载自: https://www.cnblogs.com/Nicholas0707/p/9021672.html 目录 (一)、日志相关概念 1、日志的作用 2、日志的等级 3、日志字段信息与日志格式 4、日志功能的实现 (二)logging模块 1、 logging模块的日志级别 2、loggin
阅读全文
posted @
2019-11-22 20:07
天马行宇
阅读(25166)
推荐(2)
linux下删除大量文件(rm 参数过长)
摘要:今天在服务器上清空一个文件夹的时候,提示我rm的参数过长: cd /home/yyq/htmls # 删除当前文件夹下的所有文件,只能是文件比较少的 rm -r ./* # 文件多的可以这么删除: ls | xargs -n 10 rm -fr ls 命令解释: ls 输出所有的文件名(用空格分割)
阅读全文
posted @
2019-11-21 11:10
天马行宇
阅读(1881)
推荐(0)
linux free 命令下free/available区别
摘要:转载于 https://www.jianshu.com/p/2ffeb3a3aa90 例子 [root@VM_16_17_centos bin]# free total used free shared buff/cache available Mem: 1882892 785272 280428
阅读全文
posted @
2019-11-20 16:20
天马行宇
阅读(4894)
推荐(1)
【elasticsearch】查询结果 高亮显示 ——【转载】
摘要:总的来说:三种高亮显示 一、plain highlight(默认) 二、posting highlight(性能) 对磁盘的消耗更少 将文本切割为句子,并且对句子进行高亮,效果更好 性能比plain highlight高,因为不需要重新对高亮文本进行分词 三、fast vector highligh
阅读全文
posted @
2019-11-19 19:11
天马行宇
阅读(3464)
推荐(0)
linux上安装 Elasticsearch及插件
摘要:一、 准备工作: 安装参考文档: ELK官网:https://www.elastic.co/ ELK官网文档:https://www.elastic.co/guide/index.html ELK中文手册:https://www.elastic.co/guide/cn/elasticsearch/g
阅读全文
posted @
2019-11-15 16:27
天马行宇
阅读(706)
推荐(0)
JAVA-多版本JDK的安装配置
摘要:安装包1.7和1.8两个版本的JDK安装包: 正常安装,先装1.7,再装1.8.(1.7安装的时候,有一个地方不让修改路径,所以最终2个版本的JDK都安装在了C盘) 安装完成后的路径: 网上都说安装完需要配置环境变量,但是我配置了,没有效果,CMD中执行“java -version”依旧是1.8.
阅读全文
posted @
2019-11-10 20:37
天马行宇
阅读(1619)
推荐(0)