04 2019 档案

摘要:什么是网络爬虫: 通俗理解: 爬虫是一个模拟人类请求网站行为的程序,可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。 通用爬虫和聚焦爬虫: 1.通用爬虫:通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分,主要试讲互联网上的网页下载到本地,形成一个互联网内容的备份。 阅读全文
posted @ 2019-04-30 16:28 QQmini 阅读(193) 评论(0) 推荐(0)
摘要:恢复内容开始 1.请按照这样的日期格式(xxxx-xx-xx)每日生成一个文件,例如今天生成的文件为2019-04-26.log, 并且把磁盘的使用情况写到到这个文件中。 read 读取整个文件 readline 读取下一行 readlines 读取整个文件到一个迭代器以供我们遍历(读取到一个lis 阅读全文
posted @ 2019-04-26 18:46 QQmini 阅读(1830) 评论(0) 推荐(0)
摘要:1. abs() 函数 描述 abs() 函数返回数字的绝对值 2.iter() 函数 描述 iter() 函数用来生成迭代器。 3.dir() 函数 描述 dir() 函数不带参数时,返回当前范围内的变量、方法和定义的类型列表;带参数时,返回参数的属性、方法列表。如果参数包含方法__dir__() 阅读全文
posted @ 2019-04-26 14:01 QQmini 阅读(795) 评论(0) 推荐(0)
摘要:系统相关的信息模块: import sys 操作系统相关的调用和操作: import os 内置模块(不用import就可以直接使用)常用内置函数: 阅读全文
posted @ 2019-04-26 14:00 QQmini 阅读(383) 评论(0) 推荐(0)
摘要:1.常见bash你置命令及应用实践举例: 1.echo 变量名表: 将变量名表指定的变量显示到标准输出 set -- "I name" nihao a # set -- 设置变量 echo $# 查看参数的个数 echo $1 查看第一个变量 [root@localhost ~]# echo old 阅读全文
posted @ 2019-04-25 22:28 QQmini 阅读(146) 评论(0) 推荐(0)
摘要:1.安装Python3.6 依赖环境安装 # yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel lib 阅读全文
posted @ 2019-04-24 22:21 QQmini 阅读(204) 评论(0) 推荐(0)
摘要:1.常见的sys模块的应用: 1.在解释器启动后, argv 列表包含了传递给脚本的所有参数, 列表的第一个元素为脚本自身的名称 argv(命令行参数个数) 执行脚本: python3 sys_0.py ni hao a 结果: ['sys_0.py', 'ni', 'hao', 'a'] sys_ 阅读全文
posted @ 2019-04-23 22:36 QQmini 阅读(269) 评论(1) 推荐(0)
摘要:python 读写、创建 文件 第二个:目录操作-增删改查 第三个:判断 第四个:PATH 第四个:os.mknod 创建文件(不是目录) 第五个:代码展示 os.rename() 和os.renames() 下面在看下下面这个强大的方法吧,哈哈 In [10]: os.renames("/tmp/ 阅读全文
posted @ 2019-04-23 20:56 QQmini 阅读(179) 评论(0) 推荐(0)