会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
坚强的小蚂蚁
每天都要有收获
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
17
18
19
20
21
22
23
24
25
···
39
下一页
2018年11月6日
ubuntu14中把openssh升级到7.5
摘要: 经验证可用 下载相关tar.gz包,没有下载到的,可以在这里下载。http://download.csdn.net/download/songanshu/10023663 apt install -y build-essential libssl-dev zlib1g-dev在系统home目录下创建
阅读全文
posted @ 2018-11-06 10:43 坚强的小蚂蚁
阅读(1585)
评论(0)
推荐(0)
2018年10月31日
多线程和多进程2
摘要: 一. 线程同步之信号量--semaphore 作用:控制进入数量的锁 举个例子: 写文件的时候,一般只用于一个线程写;读文件的时候可以用多个线程读,我们可以用信号量来控制多少个线程读文件 做爬虫的时候,也可以用信号量来控制并发数量,以免访问量过多而被反爬,如下面代码 import threading
阅读全文
posted @ 2018-10-31 09:43 坚强的小蚂蚁
阅读(182)
评论(0)
推荐(0)
多线程和多进程1
摘要: 一. GIL 1. 基本概念 GIL:global interpreter lock (cpython下) python中一个线程对应于c语言中的一个线程,GIL使得同一时刻只有一个线程在一个CPU上执行字节码,无法将多个线程映射到多个CPU上执行 2. GIL释放 1)GIL会根据执行的字节码行数
阅读全文
posted @ 2018-10-31 09:42 坚强的小蚂蚁
阅读(144)
评论(0)
推荐(0)
元类编程
摘要: 一. property动态属性 1. 首先来个例子,需求是根据出生年月日,得到某人的年龄 from datetime import date, datetime class User: def __init__(self, name, birthday): self.name = name self
阅读全文
posted @ 2018-10-31 09:40 坚强的小蚂蚁
阅读(221)
评论(0)
推荐(0)
collections模块
摘要: 一. tuple功能 特点:不可变,可迭代,可拆包,但tuple不可变性不是绝对的 其实只要类里包含__iter__或者__getitem__任一个魔法函数都是可迭代的 1. 拆包 1.1 基本用法 name = ("jack", "hong") # 按位置赋值给变量 name1, name2 =
阅读全文
posted @ 2018-10-31 09:39 坚强的小蚂蚁
阅读(199)
评论(0)
推荐(0)
深入set和dict
摘要: 一. 浅拷贝和深拷贝 浅拷贝:就是创建一个具有相同类型,相同值但不同id的新对象。 浅拷贝产生的新对象中可变对象的值在发生改变时,会对原对象的值也做出改变,因为这些值是同一个引用。 a = [1, 2] b = [3, 4, a] c = b.copy() a[0] = 0 print(b) pri
阅读全文
posted @ 2018-10-31 09:37 坚强的小蚂蚁
阅读(326)
评论(0)
推荐(0)
深入类和对象
摘要: 1. 鸭子类型 鸭子类型:多个类都有一个相同的方法,我们可以分别实例化一个对象,定义另外一个函数统一调用多个类中的相同方法 class Person: def walk(self): print("i walk use my foot") class Bird: def walk(self): pr
阅读全文
posted @ 2018-10-31 09:31 坚强的小蚂蚁
阅读(167)
评论(0)
推荐(0)
2018年9月28日
第八天,scrapy的几个小技巧
摘要: 一. 微博模拟登陆 1. 百度搜微博开放平台可满足爬取量不大的情况 2. 微博模拟登陆和下拉鼠标应对ajax加载 from selenium import webdriver import time browser = webdriver.Chrome() browser.get('https://
阅读全文
posted @ 2018-09-28 15:33 坚强的小蚂蚁
阅读(1051)
评论(0)
推荐(0)
第七天,反爬
摘要: DOWNLOAD_DELAY: 同一网站下个页面下载延迟时间 一. 爬虫和反爬虫的斗争 小技巧: 1. 在网页中右键查看源码和用F12查看是有区别的 如果网页中大量使用ajax来加载数据,那么右键查看源码的方式只能看到ajax加载前的信息,F12看到的是ajax加载后的信息,我们一般用爬虫爬取的都是
阅读全文
posted @ 2018-09-28 15:30 坚强的小蚂蚁
阅读(244)
评论(0)
推荐(0)
第六天,拉勾网整站爬取
摘要: 对应github地址:知乎和拉钩 小技巧 1. cmder:模拟linux终端 2. 添加windows路径到pycharm环境中 import sys import os sys.path.insert(0, "E:\python_workshop\Article"),其中的0表示路径查找顺序 另
阅读全文
posted @ 2018-09-28 15:27 坚强的小蚂蚁
阅读(685)
评论(0)
推荐(0)
上一页
1
···
17
18
19
20
21
22
23
24
25
···
39
下一页
公告