返回顶部
扩大
缩小

Zhang_derek

2018年3月6日

11.Django2.0文档

摘要: 第四章 模板 1.标签 (1)if/else {% if %} 标签检查(evaluate)一个变量,如果这个变量为真(即,变量存在,非空,不是布尔值假),系统会显示在 {% if %} 和 {% endif %} 之间的任何内容,例如: {% else %} 标签是可选的: {% if %} 标签 阅读全文

posted @ 2018-03-06 23:36 zhang_derek 阅读(2949) 评论(0) 推荐(2)

2018年2月25日

python爬虫人门(10)Scrapy框架之Downloader Middlewares

摘要: 设置下载中间件(Downloader Middlewares) 下载中间件是处于引擎(crawler.engine)和下载器(crawler.engine.download())之间的一层组件,可以有多个下载中间件被加载运行。 当引擎传递请求给下载器的过程中,下载中间件可以对请求进行处理 (例如增加 阅读全文

posted @ 2018-02-25 20:41 zhang_derek 阅读(1785) 评论(0) 推荐(0)

python爬虫入门(七)Scrapy框架之Spider类

摘要: Spider类 Spider类定义了如何爬取某个(或某些)网站。包括了爬取的动作(例如:是否跟进链接)以及如何从网页的内容中提取结构化数据(爬取item)。 换句话说,Spider就是您定义爬取的动作及分析某个网页(或者是有些网页)的地方。 class scrapy.Spider是最基本的类,所有编 阅读全文

posted @ 2018-02-25 20:40 zhang_derek 阅读(20075) 评论(0) 推荐(5)

python爬虫入门(八)Scrapy框架之CrawlSpider类

摘要: CrawlSpider类 通过下面的命令可以快速创建 CrawlSpider模板 的代码: scrapy genspider -t crawl tencent tencent.com CrawSpider是Spider的派生类,Spider类的设计原则是只爬取start_url列表中的网页,而Cra 阅读全文

posted @ 2018-02-25 20:40 zhang_derek 阅读(1777) 评论(1) 推荐(0)

python爬虫入门(九)Scrapy框架之数据库保存

摘要: 豆瓣电影TOP 250爬取-->>>数据保存到MongoDB 豆瓣电影TOP 250网址 要求: 1.爬取豆瓣top 250电影名字、演员列表、评分和简介 2.设置随机UserAgent和Proxy 3.爬取到的数据保存到MongoDB数据库 1.爬取豆瓣top 250电影名字、演员列表、评分和简介 阅读全文

posted @ 2018-02-25 20:40 zhang_derek 阅读(1121) 评论(0) 推荐(1)

15.linux基础

摘要: 1.目录 /:根目录,一般根目录下只存放目录,在Linux下有且只有一个根目录。所有的东西都是从这里开始。当你在终端里输入“/home”,你其实是在告诉电脑,先从/(根目录)开始,再进入到home目录。 /bin、/usr/bin: 可执行二进制文件的目录,如常用的命令ls、tar、mv、cat等。 阅读全文

posted @ 2018-02-25 16:24 zhang_derek 阅读(867) 评论(0) 推荐(1)

python爬虫入门(六) Scrapy框架之原理介绍

摘要: Scrapy框架 Scrapy简介 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。 框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。 Scrapy 使用了 Twisted['twɪstɪ 阅读全文

posted @ 2018-02-25 16:19 zhang_derek 阅读(3018) 评论(3) 推荐(3)

2018年2月24日

PYTHON面试

摘要: 大部分的面试问题,有最近要找事的老铁吗? python语法以及其他基础部分可变与不可变类型; 浅拷贝与深拷贝的实现方式、区别;deepcopy如果你来设计,如何实现; __new__() 与 __init__()的区别; 你知道几种设计模式; 编码和解码你了解过么; 列表推导list compreh 阅读全文

posted @ 2018-02-24 10:23 zhang_derek 阅读(1072) 评论(0) 推荐(0)

2018年2月19日

14.Ubuntu基本命令

摘要: vi编辑器 { :上一段diamante } :下一段代码 dw: 删除一个单词 权限 前面的分三组 第一: 文件拥有者的权限 第二:同组者拥有的权限 第三:其他人拥有的权限 前面“-”表示是文件 前面是“d” 表示的文件夹 rwx 可读可写可执行 改变权限 u 拥有者 g 同组者 o 其它人 子母 阅读全文

posted @ 2018-02-19 13:02 zhang_derek 阅读(997) 评论(0) 推荐(0)

2018年2月16日

python爬虫入门(五)Selenium模拟用户操作

摘要: 爬虫(Spider),反爬虫(Anti-Spider),反反爬虫(Anti-Anti-Spider) 之间恢宏壮阔的斗争... 小莫想要某站上所有的电影,写了标准的爬虫(基于HttpClient库),不断地遍历某站的电影列表页面,根据 Html 分析电影名字存进自己的数据库。 这个站点的运维小黎发现 阅读全文

posted @ 2018-02-16 13:06 zhang_derek 阅读(26323) 评论(0) 推荐(8)

导航