会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
抿嘴唇
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2018年9月27日
爬虫——线程进程
摘要: 进程 使用 导入类库 创建进程 Process参数:group=None,target=None, name=None, args=(), kwargs={}) 全局变量 进程间全局变量不共享,因为进程是复制出来的 线程 使用 导入类库 创建线程 Thread参数:group=None,target
阅读全文
posted @ 2018-09-27 20:31 BO00097
阅读(249)
评论(0)
推荐(0)
2018年9月26日
爬虫——综合案例流程版
摘要: 爬虫综合案例 开发步骤: 导入类库 创建爬虫通用类 初始化init方法 类中编写重试下载模块 类中编写真正下载模块 类外编写保存函数 类外编写获取robots.txt函数 类外编写抽取网址函数 类中编写网址正常化函数 创建下载限流类 爬虫通用类封装run方法 创建爬虫对象运行 导入类库 reques
阅读全文
posted @ 2018-09-26 20:13 BO00097
阅读(394)
评论(0)
推荐(0)
2018年9月25日
爬虫——实战完整版
摘要: mongodb操作 MongoCache 将数据以字典的特性存储缓存到mongodb数据库 导入类库 创建MongoCache类 初始化init 连接mongodb数据库 连接数据库cache实例(没有则创建) 连接集合webpage(没有则创建) 创建timestamp索引,设置超时时间为30天
阅读全文
posted @ 2018-09-25 19:48 BO00097
阅读(536)
评论(0)
推荐(0)
2018年9月22日
爬虫——选择器
摘要: BeautifulSoup 导入类库 创建soup对象 标签特性 查找标签 查找所有a标签 查找特定id的a标签及其href 查找所有特定id的标签 查找所有a标签 查找特定id的a标签及其href 查找所有特定id的标签 lxml / 从根标签开始 // 从当前标签开始 * 通配符,选择所有 //
阅读全文
posted @ 2018-09-22 09:40 BO00097
阅读(290)
评论(0)
推荐(0)
2018年9月21日
爬虫——三个小实战
摘要: 贴吧爬取 写代码前,构思需要的功能块;写代码时,把各个功能模块名提前写好 初始化 初始化必要参数,完成基础设置 爬取百度贴吧lol吧:爬取地址中的get参数须传递(可以指定不同主题的贴吧和页码) 主题名 初始网址 请求头 生成网址 生成每一页的路由地址 根据列表生成式生成多个页面的地址 下载 get
阅读全文
posted @ 2018-09-21 19:39 BO00097
阅读(496)
评论(0)
推荐(2)
2018年9月20日
爬虫——request
摘要: 命名规范 module_name,模块 package_name,包 ClassName,类 method_name,方法 ExceptionName,异常 function_name,函数 GLOBAL_VAR_NAME,全局变量 instance_var_name,实例 function_par
阅读全文
posted @ 2018-09-20 19:41 BO00097
阅读(238)
评论(0)
推荐(1)
2018年9月19日
Django——分页
摘要: 必要属性和方法 per_page: 每页显示条目数量 count: 数据总个数 num_pages:总页数 page_range:页面范围,从1开始,例如[1,2,3,4]。 page: page对象 上面的属性需要用 一页对象dian.整体对象dian.属性名 才能调用 has_next 是否有下
阅读全文
posted @ 2018-09-19 19:38 BO00097
阅读(140)
评论(0)
推荐(1)
2018年9月18日
Django——缓存
摘要: 设置缓存可采用CacheDemo中的中间件方法(https://www.cnblogs.com/siplips/p/9618034.html),对客户端浏览器缓存时间进行设定;也可采用下面的装饰器方法,可对单独的东西进行缓存,如:函数 开启缓存:在views中引入包 from django.view
阅读全文
posted @ 2018-09-18 19:39 BO00097
阅读(189)
评论(0)
推荐(0)
2018年9月17日
Django——photo
摘要: 要点: models 图片类型文件要使用models.ImageField(upload='文件夹名') 普通文件使用FileField 时间类型使用DatetimeField(auto_now_add=True) 自动添加增加时间 settings MEDIA_URL = '/media/' #别
阅读全文
posted @ 2018-09-17 20:02 BO00097
阅读(246)
评论(0)
推荐(1)
2018年9月15日
Django——权限
摘要: 在models中为user添加权限,permissions第二个参数可指定权限的别名 创建的各种用户user保存在auth_user表中 创建的各种用户user的对应权限permission_id保存在auth_user_user_permissions表中 所有权限的类型名字,别名保存在auth_
阅读全文
posted @ 2018-09-15 19:40 BO00097
阅读(127)
评论(0)
推荐(1)
上一页
1
2
3
4
下一页
公告