摘要: 阅读全文
posted @ 2019-01-31 04:55 忙碌的虫子 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 工程目录结构 spiders下的first源码 Items文件 pipeline文件 Setting文件 阅读全文
posted @ 2019-01-27 22:32 忙碌的虫子 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 一:安装wheel wheel介绍 二:安装twisted twisted是由python编写的一款基于事件驱动的网络引擎,使用twisted模块将python的异步请求(异步模型介绍)成为可能且简单易用。Twisted介绍 三:创建scrapy文件 使用命令窗口进入目标目录后 使用命令 工程目录结 阅读全文
posted @ 2019-01-27 22:25 忙碌的虫子 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 在编写案例之前首先理解几个问题,1:什么是爬虫2:为什么说python是门友好的爬虫语言?3:选用哪种框架编写爬虫程序 一:什么是爬虫? 爬虫 webSpider 也称之为网络蜘蛛,是使用一段编写好的代码所生成的应用程序使其游弋于互联网这个庞大的体系中,帮助我们将想要的内容从目标服务器中搬到我们本地 阅读全文
posted @ 2019-01-26 23:14 忙碌的虫子 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 使用 阅读全文
posted @ 2019-01-11 15:29 忙碌的虫子 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 背景知识,需要有一定量的HTTP基础知识 在客户端游览器通过URL向服务端发送请求时,经历了两次过程。一次是URL向服务端发起请求,一次是服务端向客户端回发响应。 由图可知,客户端一共传递两个信息,一个默认空的get请求和一个图标请求(忽略)。此时的请求都是byte类型,通过转码可以获得两组有规律的 阅读全文
posted @ 2018-11-19 22:00 忙碌的虫子 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 背景:向数据库添加相同名字的用户 上节可知,在查询某个用户信息时,只能查看到行数但不能查看结构性信息。 fetchone()函数可以但仅可逐个查看结构性信息。查不到信息将以None替补。 fetchAll()可以将所有结果以一个元祖显示,如图 使用元祖查看结果不是特别的方便,python提供以字典的 阅读全文
posted @ 2018-11-19 15:51 忙碌的虫子 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 上节介绍了如何使用命令行操作mysql增删改查,现在介绍如何使用python管理mysql 使用pip 下载完mysql后,mysql会以pymysql模块的形式存储在pycharm的包文件里。我们通过操作pymysql包的对象来管理我们的mysql. 首先导入pymysql包并通过connet对象 阅读全文
posted @ 2018-11-19 15:29 忙碌的虫子 阅读(419) 评论(0) 推荐(0) 编辑
摘要: 使用pip 安装mysql 使用命令行打开数据库且选择使用已有的数据库 选择已有数据库 显示s23数据库都有哪些表 在命令下创建新表 可以通过show tables发现,user新表已被添加进来了。 向mysql 插入一条数据 查看已插入的数据 阅读全文
posted @ 2018-11-19 11:08 忙碌的虫子 阅读(152) 评论(0) 推荐(0) 编辑
摘要: URL是因特网资源的标准化名称,该字符串指向一条电子信息片段,定义服务端应用程序在什么位置以及客户端要如何与其交互 一条完整的URL由多个片段组成。 通用URL组件 相对URL URL有两种,一种是刚才见到的绝对URL(包含访问资源所需的全部信息),另外一种是相对URL。 相对URL对绝对URL来讲 阅读全文
posted @ 2018-11-10 21:23 忙碌的虫子 阅读(270) 评论(0) 推荐(0) 编辑