摘要: 1.request 2.需求:爬取搜狗首页的页面源码数据 3.需求:简易的网页采集器 4.处理数据量级的问题: 5.需求:爬取豆瓣电影的详情数据 分析: 更多的电影数据是通过将滚轮滑动到底部后发起了ajax请求请求到的电影数据 对ajax请求的url进行捕获 对ajax请求的url进行请求发送 6. 阅读全文
posted @ 2020-04-07 16:16 Jerry! 阅读(317) 评论(0) 推荐(0) 编辑
摘要: 1.对爬虫的认识 2.爬虫工具jupyter 阅读全文
posted @ 2020-04-07 15:56 Jerry! 阅读(240) 评论(0) 推荐(0) 编辑
摘要: Linux应用 1.如何快速找出当前目录下最晚被修改过的文件? 2.已知某个进程的pid是6666,如何找到它当前打开了哪些文件? 3.发现端口8001被占用,如何找出是哪个进程占用了该端口? 4.假设有进程P持续向文件F写入数据,此时把文件F删除,进程P的写入会失败吗?磁盘占用是否会持续增加?为什 阅读全文
posted @ 2020-04-06 18:26 Jerry! 阅读(487) 评论(1) 推荐(0) 编辑
摘要: 集合的特点 1.集合相当于没有值的字典,无序且不支持索引。 2.天然去重 集合的特色。 集合的增删改查 1.增 2.删 3.改 4.查 5.集合的交集,并集等... 阅读全文
posted @ 2020-04-06 16:41 Jerry! 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 赋值 浅拷贝 简单理解就是以下规则 浅拷贝的时候只拷贝第一层元素. 浅拷贝在修改第一层元素(不可变数据类型)的时候,拷贝出来的新列表不进行改变. 浅拷贝在替换第一层元素(可变数据类型)的时候,拷贝出来的新列表不进行改变. 浅拷贝在修改第一层元素中的元素(第二层)的时候,拷贝出来的新列表进行改变. 下 阅读全文
posted @ 2020-04-06 16:31 Jerry! 阅读(171) 评论(0) 推荐(0) 编辑
摘要: id,is,== 的含义 id是内存地址,那就有人问了,什么是内存地址呢? 你只要创建一个数据(对象)那么都会在内存中开辟一个空间,将这个数据临时加在到内存中,那么这个空间是有一个唯一标识的,就好比是身份证号,标识这个空间的叫做内存地址,也就是这个数据(对象)的id,那么你可以利用id()去获取这个 阅读全文
posted @ 2020-04-06 16:20 Jerry! 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 解构 阅读全文
posted @ 2020-04-06 15:29 Jerry! 阅读(359) 评论(0) 推荐(0) 编辑
摘要: "百度网址" 阅读全文
posted @ 2019-11-22 18:19 Jerry! 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 字典 dict 1.字典是无序,可变的数据类型 2.字典:用于存储数据,存储大量数据,字典要比列表快,将数据和数据之间进行关联 定义一个字典: 字典的键: 可哈希的 不可变的数据类型 避免哈希冲突使用了 开放寻址法 要求唯一 如果有重复的后边值的将前面的值覆盖 字典的值: 可以任意 增: 删: 改: 阅读全文
posted @ 2019-07-19 22:35 Jerry! 阅读(8619) 评论(0) 推荐(0) 编辑
摘要: 元组 元组 tuple(只能查看,不可以进行增删改) 1. 有序,不可变,支持索引 2. 元组用于存储一些比较重要的信息 3. 元组在配置文件中会使用 元组就是不可变的列表 range coding:utf 8 range 范围 顾头不顾尾 print(list(range(0,10))) 顾头不顾 阅读全文
posted @ 2019-07-19 22:32 Jerry! 阅读(1963) 评论(0) 推荐(0) 编辑