随笔分类 -  Python

摘要:这是一篇比较无聊的博文。只是给博客除草的。 我从我的移动硬盘里翻出来了一堆电子书,从哪拿到的我忘了,但是都打在rar的压缩包里,这让我查找起来非常不方便。前几天找某本书看,就没有查到,又百度到的下载地址,之后发现躲在这堆rar的某个角落。书很多,rar命名又不规范,查找起来简直头疼。我截取了一些还算 阅读全文
posted @ 2016-12-07 10:37 _小苹果 阅读(2773) 评论(0) 推荐(0) 编辑
摘要:书友群里经常有人闹书荒,求推荐,于是我想了想,把豆瓣里面的小说们都爬了下来。 还是用的老方法,urllib+正则提取,没有用到scrapy这么高科技的东西(其实是因为windows下太难装了)。不过这一次我用的是python3。其实我只是在网上找了一下http头应该怎么写,那个网页用的是python 阅读全文
posted @ 2016-11-14 18:15 _小苹果 阅读(645) 评论(0) 推荐(0) 编辑
摘要:在群里经常听到这样的争执,有人是虚心请教问题,有人就大放厥词因为这个说python辣鸡。而争论的核心无非就是,python的多线程在同一时刻只会有一条线程跑在CPU里面,其他线程都在睡觉。这是真的吗? 是真的。这个就是因为传说中的GIL(全局解释锁)的存在。不明白这个词的可以去百度一下,我解释不好( 阅读全文
posted @ 2016-10-30 23:53 _小苹果 阅读(22485) 评论(3) 推荐(3) 编辑
摘要:关于virtualenv是什么我想我不用介绍的吧。用python做开发的人要是不会用virtualenv,总有一天会被各种环境恶心死。那么我今天就来讲一讲使用virtualenv的正确姿势。 virtualenv可以到 https://pypi.python.org/pypi/virtualenv 阅读全文
posted @ 2016-09-25 22:55 _小苹果 阅读(9770) 评论(2) 推荐(0) 编辑
摘要:datetime是个很常用的模块,这个连python初学者都应该知道,datetime中有两个函数:strftime和strptime,里面都有个参数format,可以将输出的时间格式化。例如 print datetime.datetime.now().strftime("%Y.%m.%d") 就会 阅读全文
posted @ 2016-09-06 16:55 _小苹果 阅读(2805) 评论(0) 推荐(0) 编辑
摘要:前段日子一直在做公司的DNS调度程序,不过由于性能比较差,方案最终废弃掉了。两个半月心血,不想白白浪费掉,于是改了改,把商业秘密相关的部分去掉,变成了一个公共的DNS服务器。其实说的简单点,就是一个可以做DNS解析和应答的程序(废话,DNS服务器不就是干这个的)。功能比较简单,只做了A地址和CNAM 阅读全文
posted @ 2016-07-12 18:25 _小苹果 阅读(12589) 评论(6) 推荐(1) 编辑
摘要:在做python开发的人,应该或多或少的听说过一点pypy吧。我猜。所以就不做背景介绍了,有不懂的同学可以看看这里: 1、什么是pypy: http://www.360doc.com/content/15/0625/08/13232598_480502243.shtml (简单总结一下就是:pypy 阅读全文
posted @ 2016-06-15 10:53 _小苹果 阅读(61567) 评论(2) 推荐(5) 编辑
摘要:这篇写的略为纠结,算法原理、库都是现成的,我就调用了几个函数而已,这有啥好写的?不过想了想,还是可以介绍一下LRU算法的原理及简单的用法。 LRU(Least Recently Used,最近最少使用)是一种内存页面置换算法。什么叫内存页面置换?我们知道,相对于内存的速度来讲,磁盘的速度是很慢的。我 阅读全文
posted @ 2016-06-06 23:11 _小苹果 阅读(2958) 评论(4) 推荐(0) 编辑
摘要:前几天群里有同学提出了一个问题:手头现在有个列表,列表里面两个元素,比如[1, 2],之后不断的添加新的列表,往原来相应位置添加。例如添加[3, 4]使原列表扩充为[[1, 3], [2, 4]],再添加[5, 6]扩充为[[1, 3, 5], [2, 4, 6]]等等。 其实不动脑筋的话,用个二重 阅读全文
posted @ 2016-04-24 16:34 _小苹果 阅读(49154) 评论(0) 推荐(0) 编辑
摘要:刚刚看到一个好玩的程序,拉过来。原文地址:https://www.ttlsa.com/python/determine-file-type-by-the-file-header/ 侵权删。 分隔线 对于提供上传的服务器,需要对上传的文件进行过滤,否则各种webshell,暴库。 常见文件格式的文件头 阅读全文
posted @ 2016-04-13 10:47 _小苹果 阅读(2505) 评论(0) 推荐(0) 编辑
摘要:一周以来,一直在做 IP地址库的解析。从调研到编码到优化,大概花了有七八天的时间。感觉很好玩。总结一下整个做的过程。 1、关于IP 地址库的解析方式 目前主要的解析方式有两种:通过API,或通过IP数据库。 API方式很简单,目前国内大厂不少提供API接口,只要发送请求的IP,就能获得相应的地理位置 阅读全文
posted @ 2016-04-12 23:07 _小苹果 阅读(24613) 评论(5) 推荐(0) 编辑
摘要:上文书说到,ssh库pexpect的使用,简直就是个“月亮公主”——满眼全是坑。勉强把程序写好了,跑起来的时候发现了一个新坑,让我不可抗拒的把它弃掉了——经常莫名其妙的连不上服务器!开线程连接14台服务器,总有1到3台连不上,还查不到原因。这还了得!一怒之下把写好的pexpect封装库删掉了,用pa 阅读全文
posted @ 2016-03-20 21:48 _小苹果 阅读(7249) 评论(0) 推荐(0) 编辑
摘要:通过一个很坑的任务,最近认识了一个新坑: pexpect 。其实基本的用法并不难,不过,我还是跟以前一样,把几个基本函数的坑蹚了个遍。有感而发,记录一下。 首先简单的介绍一下这个坑,哦不对,这个库。这是一个 linux 下做SSH 远程登录和操作的库。我们平时用 windows 连接linux 的话 阅读全文
posted @ 2016-03-09 22:46 _小苹果 阅读(1458) 评论(0) 推荐(0) 编辑
摘要:算是前几周落下的博客补一篇。介绍一下python中如何解析配置文件。配置文件常用的几种格式:xml,json,还有ini。其中ini算是最简单的一种格式,因为小,解析的速度也要比xml和json快(并没有科学的数据支撑,只是我个人想法)。当然,我并不是说xml和json不好,只是有时候只想在文件里写 阅读全文
posted @ 2016-01-02 19:44 _小苹果 阅读(7106) 评论(0) 推荐(1) 编辑
摘要:从python公众号里面看到了几道python的练习题,就拿来练练手,结果上手了发现自己还是特别水,不是很难的8道题,我只做出来5道,其中还3道题卡住了,边查边做的。原题链接在这里:http://python.jobbole.com/83641/ 1. 编写代码, 打印1-1亿之内的偶数 看完题目想 阅读全文
posted @ 2015-12-23 20:43 _小苹果 阅读(3812) 评论(0) 推荐(0) 编辑
摘要:本篇日志来自:http://www.cnblogs.com/rhcad/archive/2011/12/21/2295507.html 纯转,只字未改。只是为了学习一下装饰器。其实现在也是没有太看明白,对于装饰器我就是用的时候找例子,能蒙对,但是用过之后一段时间就忘了。还是用的少。有空应该好好看一看... 阅读全文
posted @ 2015-12-23 00:03 _小苹果 阅读(544) 评论(0) 推荐(0) 编辑
摘要:【问题】目前有一字符串s ="['a', 'b'],['c', 'd']",想把它分开成为两个列表:list1 = ['a', 'b']list2 = ['c', 'd']之后使用itertools.product()求笛卡尔积,应该写成:1 for i in itertools.product(l... 阅读全文
posted @ 2015-12-16 14:10 _小苹果 阅读(10882) 评论(0) 推荐(1) 编辑
摘要:最近的任务经常涉及到日志的记录,特意去又学了一遍logging的记录方法。跟java一样,python的日志记录也是比较繁琐的一件事,在写一条记录之前,要写好多东西。典型的日志记录的步骤是这样的:创建logger创建handler定义formatter给handler添加formatter给logg... 阅读全文
posted @ 2015-12-15 14:00 _小苹果 阅读(31670) 评论(0) 推荐(10) 编辑