small_caier

2019年5月29日

摘要：一.爬虫数据解析的流程 1.指定url 2.基于requests模块发起请求 3.获取响应中的数据 4.数据解析 5.进行持久化存储二.解析方法 (1)正则解析 (2)bs4解析 (3)xpath解析 1. 正则解析常用正则表达式正则使用练习: 应用: 爬取糗事百科指定页面的糗图，并将其保存到阅读全文

posted @ 2019-05-29 17:32 small_caier 阅读(572) 评论(0) 推荐(0)

04 Python网络爬虫 <<爬取get/post请求的页面数据>>之requests模块

摘要：一. urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求。其常被用到的子模块在Python3中的为urllib.request和urllib.parse，在Python2中就是urllib和urllib2。二.requests库 - 安装阅读全文

posted @ 2019-05-29 16:47 small_caier 阅读(1530) 评论(0) 推荐(0)

2019年5月27日

03 爬虫~概念知识

摘要：爬虫的分类 1.通用爬虫：通用爬虫是搜索引擎（Baidu、Google、Yahoo等）“抓取系统”的重要组成部分。主要目的是将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。简单来讲就是尽可能的；把互联网上的所有的网页下载下来，放到本地服务器里形成备分，在对这些网页做相关处理(提取关键字、阅读全文

posted @ 2019-05-27 21:33 small_caier 阅读(154) 评论(0) 推荐(0)

01 Jupyter环境安装

摘要：一、什么是Jupyter Notebook？ 1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算：开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍简而言之，Jupyter Notebook是以网页的形式打开，可以在阅读全文

posted @ 2019-05-27 21:31 small_caier 阅读(123) 评论(0) 推荐(0)

02 python网络爬虫《Http和Https协议》

摘要：一.HTTP协议 1.概念: Http协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。之间形成的特殊行话（黑话：（土匪）天王盖地虎，（我）宝塔镇河妖）称为协议。 2.Http工作原理： Http协议工作于客户端-服务端架构上。浏览器作为Http客户阅读全文

posted @ 2019-05-27 21:26 small_caier 阅读(258) 评论(0) 推荐(0)

2019年3月9日

09 Django之orm中的锁和事务

摘要：恢复内容开始一锁行级锁 select_for_update(nowait=False,skip_locked=False) #注意必须用在事务里面,至于如何开启事务,往后看返回一个锁住行知道事务结束的查询集,如果数据库支持,它将生成一个select ... for update语句. 举个例阅读全文

posted @ 2019-03-09 13:11 small_caier 阅读(332) 评论(0) 推荐(0)

2019年3月7日

08 Django之自定义标签和过滤器

摘要：恢复内容开始第一步:确保setting中的INSTALL_APPS配置当前的app,要不然Django无法找到自定义的simple_tag. 第二步:在app中创建templatetags模块(模块名只能是templatetags) 第三步:创建任意的.py文件比如:my_tags.py 第四步阅读全文

posted @ 2019-03-07 20:39 small_caier 阅读(165) 评论(0) 推荐(0)

2019年3月5日

07 Django之配置静态文件以及渲染图片

摘要： js,css,img等都叫做静态文件,那么关于django中静态文件的配置,我们就需要在setting配置文件里面写上下面这些内容: 目录: 别名也是一种安全机制,浏览器上通过调试台你能够看到的是别名的名字,这样别人就不能知道你静态文件夹的名字了,不然别人就能通过这个文件夹路径进行攻击. 前端页面引阅读全文

posted @ 2019-03-05 16:10 small_caier 阅读(826) 评论(0) 推荐(0)

2019年3月4日

06 Django之模型层---多表操作

摘要：一创建模型表和表之间的关系一对一、多对一、多对多　，用book表和publish表自己来想想关系，想想里面的操作，加外键约束和不加外键约束的区别，一对一的外键约束是在一对多的约束上加上唯一约束。实例：我们来假定下面这些概念，字段和关系作者模型：一个作者有姓名和年龄。作者详细模型：把作者的阅读全文

posted @ 2019-03-04 20:38 small_caier 阅读(356) 评论(0) 推荐(0)

2019年2月27日

05 Django之模型层---单表操作

摘要：一 ORM简介 MVC或者MVC框架中包括一个重要的部分，就是ORM，它实现了数据模型与数据库的解耦，即数据模型的设计不需要依赖于特定的数据库，通过简单的配置就可以轻松更换数据库，这极大的减轻了开发人员的工作量，不需要面对因数据库变更而导致的无效劳动 ORM是“对象-关系-映射”的简称。（Objec 阅读全文

posted @ 2019-02-27 19:43 small_caier 阅读(145) 评论(0) 推荐(0)

公告