摘要:
关于数据: 分为结构化数据和非结构化数据: XML 和 HTML 的区别: 前者是用来传输数据的,后者是用来展示数据的。 因为HTML中有单标签,所以不是结构化的数据,而XML则都是单标签,是结构化的数据。 json模块 的使用: 1 import json 2 3 # python 的字典 > j 阅读全文
posted @ 2019-12-25 13:59
Zcb0812
阅读(255)
评论(0)
推荐(0)
摘要:
1 import pandas as pd 2 3 def test(): 4 my_data = { 5 "ID":[1,2,3], 6 "Name":["tom","egon","alex"] 7 } 8 data_frame = pd.DataFrame(my_data) 9 my_excel 阅读全文
posted @ 2019-12-25 13:55
Zcb0812
阅读(1127)
评论(0)
推荐(0)
摘要:
多线程: 1 import requests 2 import random 3 import json 4 from lxml import etree 5 import time 6 7 #用户代理池 8 USER_AGENT_LISTS = [] 9 with open("zcb/USER_A 阅读全文
posted @ 2019-12-25 13:51
Zcb0812
阅读(610)
评论(0)
推荐(0)
摘要:
进程 进程的 两关系一特点 : ''' 1,关系 : a, 父进程 和 子进程: 父进程只是通知操作系统开启,子进程,然后继续执行自己的进程!(异步) b, 子进程 和 子进程: 子进程 与 子进程之间 是数据隔离的。 2,特点: 父进程 执行完自己的代码后,会等所有子进程执行完之后,才会结束父进程 阅读全文
posted @ 2019-12-25 13:49
Zcb0812
阅读(258)
评论(0)
推荐(0)
摘要:
互斥(acquire后 必须release )锁 和 递归锁: 为什么线程中还需要有锁: 我们知道cpython解释器 有一个GIL 锁,同一时刻,只会有一个线程可以被cpu调度。 主要还是因为取到数据 到 处理完之后 存回去 是花费的时间太长了。 线程中的数据不安全现象: 1 from threa 阅读全文
posted @ 2019-12-25 13:47
Zcb0812
阅读(228)
评论(0)
推荐(0)
摘要:
今日内容: js 解密,selenium 进行 iframe 切换 selenium 执行js代码给 selenium 添加 ua 添加代理ip selenium 处理 cookie selenium 案例 斗鱼 (用selenium 进行翻页 ) js2py 的简单使用: 1 import js2 阅读全文
posted @ 2019-12-25 13:46
Zcb0812
阅读(167)
评论(0)
推荐(0)