摘要:
1、卸载老版本 yum remove docker \ docker-client \ docker-client-latest \ docker-common \ docker-latest \ docker-latest-logrotate \ docker-logrotate \ docker
阅读全文
posted @ 2022-04-06 10:40
雷子锅
阅读(29)
推荐(0)
摘要:
初始化集群环境 1.1、环境说明(centos7.6) IP 主机名 角色 内存 192.168.133.10 k8s-master master 4G 192.168.133.11 k8s-node1 node 2G 192.168.133.12 k8s-node2 node 2G 网络:NET
阅读全文
posted @ 2022-04-01 08:33
雷子锅
阅读(638)
推荐(0)
摘要:
链接1:https://www.runoob.com/python3/python3-os-file-methods.html 链接2:https://www.cnblogs.com/ltkekeli1229/p/15709442.html
阅读全文
posted @ 2022-03-31 10:35
雷子锅
阅读(43)
推荐(0)
摘要:
安装 pip3 install requests 常用请求方法 requests.get() 该方法用于GET请求,表示向网站发起请求,获取页面的响应对象,语法如下: requests.get(url,headers=headers,params,timeout) 参数说明: url:要抓取的url
阅读全文
posted @ 2022-03-31 10:33
雷子锅
阅读(378)
推荐(0)
摘要:
BS4解析库 Beautiful Soup简称BS4(4表示版本号),是一个python第三方库,它可以从HTML或XML文档中快速提取指定的数据。 BS4安装 pip3 install bs4 #BS4解析页面时,需要依赖文档解析器,所以还需要安装lxml作为解析库 pip3 install lx
阅读全文
posted @ 2022-03-29 19:53
雷子锅
阅读(255)
推荐(0)
摘要:
爬虫分类 爬虫可分为三类:通用网络爬虫、聚焦网络爬虫和增量式网络爬虫 通用网络爬虫 通用网络爬虫是搜索引擎的重要组成部分,通用网络爬虫需要遵守robots协议,网站通过此协议告诉搜索引擎那些页面可以抓取,哪些页面不允许抓取。 robots协议:是一种“约定俗成”的协议,并不具备法律效力,它体现了互联
阅读全文
posted @ 2022-03-29 10:31
雷子锅
阅读(216)
推荐(0)
摘要:
1、简介 awk、grep、sed是linux操作文本的三大利器,合称文本三剑客。三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂。grep更适合单纯地查找或匹配文本;sed更适合编辑匹配到的文本,awk更适合格式化文本,对文本进行较复杂格式处理。 2、grep 2.
阅读全文
posted @ 2022-03-25 16:16
雷子锅
阅读(1416)
推荐(0)
摘要:
maven命令package、install、deploy之间的区别 在用maven构建java项目时,最常用的打包命令有mvn package、mvn install、deploy,这三个命令都可以完成打jar包或war包的功能,但这三个命令还是有区别的。接下来分别执行这三个命令来分析所执行的
阅读全文
posted @ 2022-03-24 17:56
雷子锅
阅读(324)
推荐(0)
摘要:
Selenium是一个自动化测试工具,利用它可以驱动浏览器执行特定的动作,如点击、下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬。对于一些JavaScript动态渲染的页面来说,此种爬取方式非常有效。 1、基本用法 #!/usr/bin/python3 #coding=utf
阅读全文
posted @ 2022-03-24 17:28
雷子锅
阅读(523)
推荐(0)
摘要:
open函数语法 open(filename,mode=‘rt’):用于打开一个文件,返回用来操作此文件的文件流对象,如果打开失败,则会触发OSError错误通知。 mode模式字符含义 字符 含义 r 以只读方式打开(默认) w 以只写方式打开,删除原有文件内容(如果文件不存在,则创建该文件并
阅读全文
posted @ 2022-03-24 17:24
雷子锅
阅读(116)
推荐(0)