摘要: what's the 算法 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的 阅读全文
posted @ 2018-02-01 17:35 ''竹先森゜ 阅读(2564) 评论(0) 推荐(2)
摘要: Flask不同于Django,Django在创建程序时自动得到必要的目录文件,而Flask则只有一个空文件夹,所以关于Flask项目的目录我们需要自行配置。 首先利用pycharm创建一个项目,在根目录下创建一个app文件夹(app文件)、一个utils文件夹(用于放数据库连接池)、一个manage 阅读全文
posted @ 2018-01-30 19:52 ''竹先森゜ 阅读(8731) 评论(0) 推荐(1)
摘要: 以后在合作开发的过程中,难免会用到别人开发到一半或者将自己开发的项目交给别人,在转交项目的时候需要让别人知道本项目中用到了哪些模块,这时可以用到一条命令来帮助我们。 生成的文件: alembic==0.9.6 blinker==1.4 certifi==2017.11.5 chardet==3.0. 阅读全文
posted @ 2018-01-30 19:51 ''竹先森゜ 阅读(2480) 评论(0) 推荐(0)
摘要: Flask Script扩展提供向Flask插入外部脚本的功能,包括运行一个开发用的服务器,一个定制的Python shell,设置数据库的脚本,cronjobs,及其他运行在web应用之外的命令行任务;使得脚本和系统分开; Flask Script和Flask本身的工作方式类似,只需定义和添加从命 阅读全文
posted @ 2018-01-30 19:50 ''竹先森゜ 阅读(2328) 评论(0) 推荐(0)
摘要: what's the SQLAlchemy SQLAlchemy 是一个基于 Python 实现的 ORM 框架。该框架建立在 DB API 之上,使用关系对象映射进行数据库操作,简言之便是:将类和对象转换成 SQL,然后使用数据 API 执行 SQL 并获取执行结果。 安装 pip3 instal 阅读全文
posted @ 2018-01-30 19:49 ''竹先森゜ 阅读(2509) 评论(0) 推荐(0)
摘要: what's the WTForms WTForms是一个支持多个web框架的form组件,主要用于对用户请求数据进行验证。其作用是可以为轻量级的框架提供类似Django的form的功能。 安装: 源码流程分析 实例化流程分析 # 源码流程 1. 执行type的 __call__ 方法,读取字段到静 阅读全文
posted @ 2018-01-30 19:48 ''竹先森゜ 阅读(2364) 评论(0) 推荐(0)
摘要: Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架,对于Werkzeug本质是Socket服务端,其用于接收http请求并对请求进行预处理,然后触发Flask框架,开发人员基于Flask框架提供的功能对请求进行相应的处理,并返回给用户,如果要返 阅读全文
posted @ 2018-01-30 19:46 ''竹先森゜ 阅读(3706) 评论(0) 推荐(1)
摘要: Django目录 Django 基本配置与 URLconf DjangoMTV 模型之视图层 views 及模板层 template DjangoMTV 模型之 model 层——ORM 操作数据库(基本增删改查) Django 进阶之 QuerySet 和中介模型 Django 进阶之查询优化、e 阅读全文
posted @ 2018-01-30 19:43 ''竹先森゜ 阅读(5701) 评论(0) 推荐(2)
摘要: Bootstrap 在众多插件中,Bootstrap是用得最多、功能最强大的。Bootstrap是目前很受欢迎的前端框架。Bootstrap 是基于 HTML、CSS、JavaScript 的,它简洁灵活,使得 Web 开发更加快捷。Bootstrap是基于HTML5和CSS3开发的,它在jQuer 阅读全文
posted @ 2018-01-23 20:30 ''竹先森゜ 阅读(2557) 评论(1) 推荐(3)
摘要: Scrapy框架 Scrapy 是一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测试等领域,也可以应用在获取API所返回的数据(例如 Ama 阅读全文
posted @ 2018-01-23 17:17 ''竹先森゜ 阅读(3111) 评论(0) 推荐(2)
摘要: 如何提升爬虫性能相关的知识点 爬虫的本质是伪造socket客户端与服务端的通信过程,如果我们有多个url待爬取,只用一个线程且采用串行的方式执行,那只能等待爬取一个url结束后才能继续下一个,这样我们就会发现效率非常低。 原因:爬虫是一项IO密集型任务,遇到IO问题就会阻塞,CPU运行就会停滞,直到 阅读全文
posted @ 2018-01-23 17:05 ''竹先森゜ 阅读(2687) 评论(0) 推荐(1)
摘要: MongoDB增删改查操作 本文包含对数据库、集合以及文档的基本增删改查操作 数据库操作 #1、增 use config #如果数据库不存在,则创建并切换到该数据库,存在则直接切换到指定数据库。 #2、查 show dbs #查看所有数据库,相当于Mysql的show databases #空数据库 阅读全文
posted @ 2018-01-22 18:10 ''竹先森゜ 阅读(27848) 评论(0) 推荐(8)
摘要: what's the MongoDB MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。Mongo 最大的特点是他支持的查询语言非常强大,其语法 阅读全文
posted @ 2018-01-21 19:02 ''竹先森゜ 阅读(2749) 评论(0) 推荐(3)
摘要: 解析库就是在爬虫时自己制定一个规则,帮助我们抓取想要的内容时用的。常用的解析库有re模块的正则、beautifulsoup、pyquery等等。正则完全可以帮我们匹配到我们想要住区的内容,但正则比较麻烦,所以这里我们会用beautifulsoup。 beautifulsoup Beautiful S 阅读全文
posted @ 2018-01-19 19:17 ''竹先森゜ 阅读(3023) 评论(0) 推荐(3)
摘要: selenium模块 selenium 最初是一个自动化测试工具,而爬虫中使用它主要是为了解决 requests 无法直接执行 JavaScript 代码的问题。selenium 的缺点是效率会变得很慢。 selenium 本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来 阅读全文
posted @ 2018-01-19 17:37 ''竹先森゜ 阅读(3104) 评论(0) 推荐(3)
摘要: 请求库,即可以模仿浏览器对网站发起请求的模块(库)。 requests模块 使用requests可以模拟浏览器的请求,requests模块的本质是封装了urllib3模块的功能,比起之前用到的urllib,requests模块的api更加便捷 requests库发送请求将网页内容下载下来以后,并不会 阅读全文
posted @ 2018-01-19 17:34 ''竹先森゜ 阅读(5090) 评论(0) 推荐(3)
摘要: what's the 爬虫? 了解爬虫之前,我们首先要知道什么是互联网 1、什么是互联网? 互联网是由网络设备(网线,路由器,交换机,防火墙等等)和一台台计算机连接而成,总体上像一张网一样。 2、互联网建立的目的? 互联网的核心价值在于数据的共享和传递:数据是存放于一台台计算机上的,而将计算机互联到 阅读全文
posted @ 2018-01-19 17:32 ''竹先森゜ 阅读(2799) 评论(0) 推荐(2)
摘要: 分页器 Django内置分页器(paginator) 分页器函数为paginator,里面有几个重要的参数需要我们了解 在views中: from django.shortcuts import render,HttpResponse from app01.models import * from 阅读全文
posted @ 2017-10-27 20:39 ''竹先森゜ 阅读(2337) 评论(0) 推荐(0)
摘要: Django查询优化 Django的查询优化用到两个函数——select_related()和prefetch_related()。 select_related()用的是连表join的方式,主要处理一对一和一对多情况下的优化查询 prefetch_related()用的方式是分别查询每张表,然后用 阅读全文
posted @ 2017-10-25 19:40 ''竹先森゜ 阅读(2683) 评论(0) 推荐(0)
摘要: QuerySet QuerySet是查询集,就是传到服务器上的url里面的查询内容。其形态类似于Python的列表,列表中的元素是QuerySet对象。支持大部分列表的内置方法。 可切片 QuerySet可以使用Python 的切片语法来限制查询集记录的数目 ,它等同于SQL 的limit和offs 阅读全文
posted @ 2017-10-24 16:25 ''竹先森゜ 阅读(2367) 评论(0) 推荐(0)