04 2019 档案
摘要:1 什么是redis 2 Redis与Memcached的区别与比较 1 、Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,zset,hash等数据结构的存储。 memcache支持简单的数据类型,String。 2 、Redis支持数据的备份,即master-slave模式
阅读全文
摘要:1.为什么要使用消息队列 解耦、异步、削峰 (1)解耦 传统模式的缺点: 系统间耦合性太强,如下图所示,系统A在代码中直接调用系统B和系统C的代码,如果将来D系统接入,系统A还需要修改代码,过于麻烦! 中间件模式(消息队列)优点: 将消息写入消息队列,需要消息的系统自己从消息队列中订阅,从而系统A不
阅读全文
摘要:1.什么是MongoDB 2.MongoDB的优势有哪些 面向文档的存储:以 JSON 格式的文档保存数据。 任何属性都可以建立索引。 复制以及高可扩展性。 自动分片。 丰富的查询功能。 快速的即时更新。 3 什么是数据库 4.什么是集合(表) 5 什么是文档(记录) 6 MongoDB和关系型数据
阅读全文
摘要:一 代码 二 参数详解 custom_settings 1 settings 文件中默认请求头 DEFAULT_REQUEST_HEADERS 2 spider文件中请求头参数 custom_settings 必须以类变量形式存在 优先级别高与全局 必须以类变量形式存在 优先级别高与全局 访问知乎不
阅读全文
摘要:一 配置文件scrapy.cfg 1 全局配置文件路径 盘符: ... \scrapy\scrapy 2 项目配置文件 配置文件的优先级别: 用户定义的配置文件优先级别高于系统范围的默认值. 二 创建醒目的基本命令 三 命令分类 全局命令 startproject #创建项目 genspider #
阅读全文
摘要:一 安装 二 实验要求 目标网站: http://quotes.toscrape.com/tag/humor/ 任务:保存网页信息到本地 二 创建爬虫项目 生成项目的结构 三 创建爬虫文件 使用pycharm打开项目,修改QuotesSpider .py 文件改为 其中 name: 爬虫名字,项目中
阅读全文
摘要:一 海洋距离与温度实例 1 导包 2 数据导入 ferrara1 = pd.read_csv('./ferrara_150715.csv') ferrara2 = pd.read_csv('./ferrara_250715.csv') ferrara3 = pd.read_csv('./ferrar
阅读全文
摘要:路飞业务 广告引流 >获取客服信息 >免费课 >直播课 >鸡汤 >报名 主站: 后台管理: 各模块分析 课程模块 支付模块 购物车模块 报名模块 惩罚体系(定时任务) 题库模块 个人中心模块 消息模块 视频模块 sentry.io :错误跟踪软件 技术栈 项目中遇到什么难点 表结构设计,数据结构,接
阅读全文
摘要:Mysql 数据库的主从复制方案,是其自带的功能,并且主从复制并不是复制磁盘上的数据文件,而是通过binlog日志复制到需要同步的服务器上. 一 主从复制的原理实现 原理图解说: 二 mysql 权限基本操作 注意:分配权限,必须是root,且主机不能是''%'' 三 master主库配置 配置关键
阅读全文
摘要:pyquery 是python仿照jQuery的严格实现,语法与jQuery几乎完全相同,所以对于学过前端的朋友们可以立马上手,没学过的小朋友也别灰心,我们马上就能了解到pyquery的强大. 1 安装 2 官方文档 http://pyquery.readthedocs.io/ 3 学习代码html
阅读全文
摘要:无序列表:输入-之后输入空格有序列表:输入数字+“.”之后输入空格任务列表:-[空格]空格 文字标题:ctrl+数字表格:ctrl+t生成目录:[TOC]按回车选中一整行:ctrl+l选中单词:ctrl+d选中相同格式的文字:ctrl+e跳转到文章开头:ctrl+home跳转到文章结尾:ctrl+e
阅读全文
摘要:一 代码区结构 def on_start(self)是脚本的入口点。单击run仪表板上的按钮时将调用它。 self.crawl(url, callback=self.index_page)*是这里最重要的API。它将添加一个要爬网的新任务。大多数选项将通过self.crawl参数进行spicifie
阅读全文
摘要:需求: 爬取:https://v.taobao.com/v/content/video 所有主播详情页信息 首页分析 分析可以得知数据是通过ajax请求获取的. 分析请求头 详情页分析 详情页和详情页数据url对比分析 经过测试,发现我们只需要更改'''userid'''的值就可以获取到不同的数据.
阅读全文
摘要:一 安装 请安装PhantomJS:http://phantomjs.org/build.html 二 检验是否启动成功 安装问题解决 pyspider Web预览界面太小的解决方法 完美css代码: 替换/pyspider/webui/static/debug.min.css文件中所有内容 三 入
阅读全文
摘要:综合案例:学生成绩管理项目搭建 一 新建项目目录students,并创建虚拟环境 二 安装开发中使用的依赖模块 三 启动项目 在pycharm中打开项目目录编写manage.py启动项目的文件 创建 manage.py 文件 mange.py终不能存放大量的开发代码, 在开发中应该体现的是一种分工精
阅读全文
摘要:一 请求勾子 在客户端和服务器交互的过程中,有些准备工作或扫尾工作需要处理,比如: 在请求开始时,建立数据库连接; 在请求开始时,根据需求进行权限校验; 在请求结束时,指定数据的交互格式; 在请求开始时,建立数据库连接; 在请求开始时,根据需求进行权限校验; 在请求结束时,指定数据的交互格式; 为了
阅读全文

浙公网安备 33010602011771号