摘要: Sql优化: 1.SELECT语句中避免使用 *, 尽量根据业务需求按字段进行查询 举例:如果表中有个字段用的是clob或者是blob这种大数据字段的话, 他们的查询应该根据业务需要来进行指定字段的查询,切记勿直接用* 2.删除重复记录(oracle): 最高效的删除重复记录方法 ( 因为使用了RO 阅读全文
posted @ 2018-09-09 00:19 [流苏] 阅读(210) 评论(0) 推荐(0)
摘要: 1、reset 与 rebase, pull 与 fetch 的区别 git reset 不修改commit相关的东西,只会去修改.git目录下的东西。 git rebase 会试图修改你已经commit的东西,比如覆盖commit的历史等,但是不能使用rebase来修改已经push过的内容,容易出 阅读全文
posted @ 2018-09-09 00:09 [流苏] 阅读(248) 评论(0) 推荐(0)
摘要: 1、什么是Redis Redis是一个基于内存的高性能key-value 数据库。 2、Redis支持的数据类型和数据结构 Redis通过Key-Value的单值不同类型来区分, 以下是支持的类型: Strings Lists Sets 求交集、并集 Sorted Set hashes Redis五 阅读全文
posted @ 2018-09-09 00:00 [流苏] 阅读(157) 评论(0) 推荐(0)
摘要: 1、什么是Nginx Ngin是一个高性能的HTTP和反向代理服务器,及电子邮件(IMAP/POP3)代理服务器,同事也是一个非常高效的反向代理、负载均衡。 2、为什么要用Nginx 优点: 跨平台、配置简单 非阻塞、高并发连接:处理2-3万并发连接数,官方检测能支持5万并发 内存消耗小:开启10个 阅读全文
posted @ 2018-09-08 20:25 [流苏] 阅读(204) 评论(0) 推荐(0)
摘要: 数据是创造和决策的原材料,高质量的数据都价值不菲。而利用爬虫,我们可以获取大量的价值数据,经分析可以发挥巨大的价值,比如: 豆瓣、知乎:爬取优质答案,筛选出各话题下热门内容,探索用户的舆论导向。 淘宝、京东:抓取商品、评论及销量数据,对各种商品及用户的消费场景进行分析。 搜房、链家:抓取房产买卖及租 阅读全文
posted @ 2018-08-29 08:38 [流苏] 阅读(2397) 评论(0) 推荐(1)
摘要: 注意拉钩网有反爬措施, 我们在Formreqest提交POST请求消息必须携带kd等键值对,在setting中也许设置 接下来就是在items中设置爬取信息的字段 在Pipeline.py文件中设置保存爬取文件的格式等 注意一定要把setting中的ITEM_PIPELINES解注释,接下来就是跑起 阅读全文
posted @ 2018-07-30 15:05 [流苏] 阅读(2464) 评论(1) 推荐(1)
摘要: awk、grep、sed是linux操作文本的三大利器,也是必须掌握的linux命令之一。三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂。grep更适合单纯的查找或匹配文本,sed更适合编辑匹配到的文本,awk更适合格式化文本,对文本进行较复杂格式处理。 以下所有实验输 阅读全文
posted @ 2018-07-28 17:13 [流苏] 阅读(958) 评论(0) 推荐(1)
摘要: $ echo '#!/bin/sh' > my-script.sh $ echo 'echo Hello World' >> my-script.sh $ chmod 755 my-script.sh $ ./my-script.sh Hello World $ 上面这段代码中,echo是打印的意思 阅读全文
posted @ 2018-07-28 16:08 [流苏] 阅读(232) 评论(0) 推荐(0)
摘要: 1, 序列化 Serialization 创建一个新环境 在做其他事之前,我们会用virtualenv创建一个新的虚拟环境。这将确保我们的包配置与我们正在工作的其他项目完全隔离。 既然我们已经在虚拟环境中,那么我们就可以安装我们依赖的包了。 开始 首先,我们来创建一个新项目。 输完以上命令,我们就可 阅读全文
posted @ 2018-07-27 14:23 [流苏] 阅读(4270) 评论(0) 推荐(2)
摘要: 一、基础知识篇: Http Header之User-Agent User Agent中文名为用户代理,是Http协议中的一部分,属于头域的组成部分,User Agent也简称UA。它是一个特殊字符串头,是一种向访问网站提供你所使用的浏览器类型及版本、操作系统及版本、浏览器内核、等信息的标识。通过这个 阅读全文
posted @ 2018-07-27 11:34 [流苏] 阅读(340) 评论(0) 推荐(0)