04 2017 档案

摘要:文本处理 sed 酷壳 sed 简明教程 http://coolshell.cn/articles/9104.html awk 酷壳 AWK 简明教程 http://coolshell.cn/articles/9070.html 阅读全文
posted @ 2017-04-13 17:30 gooey 阅读(139) 评论(0) 推荐(0)
摘要:17.4.9 mysqldump 因为租用的阿里云服务器ECS到期了,着手将博客搬到更便宜的共享虚拟主机上。之前安装的环境是MySQL5.5.54,PHP5.5.9,Apache2;共享虚拟主机提供的环境是MySQL5.1以下,PHP5.5以下。因此MySQL使用 导出的时候,需要加上一个 的参数。 阅读全文
posted @ 2017-04-09 14:26 gooey 阅读(698) 评论(0) 推荐(0)
摘要:本篇持续更新中 用户问答列表 Python官方文档中的FAQ Frequent Asked Questions 部分。https://docs.python.org/2.7/faq/ 目前Programming FAQ有60问 General Questions 5 Core Language 17 阅读全文
posted @ 2017-04-08 16:57 gooey 阅读(348) 评论(0) 推荐(0)
摘要:上图是一个经典的数据分析/数据挖掘步骤链(pipeline)。在将数据送到(load)你选择的model之前,数据必须经过提取(select/extract)、预处理(preprocess)包括转化(transform)才能形成一个单纯的算法model可以理解的结构化形式。 提到这个长长的数据处理的 阅读全文
posted @ 2017-04-07 21:58 gooey 阅读(477) 评论(0) 推荐(0)
摘要:背景知识 文件描述符(file descriptor) 『它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符』https://zh.wikipedia.org/wiki/%E6%96%87%E4%BB%B6%E 阅读全文
posted @ 2017-04-06 21:10 gooey 阅读(3965) 评论(0) 推荐(0)
摘要:有一个常见的场景:有一段代码的运行时间比较长,另对应的有一个输入集合。因此通常采用循环的方式将参数从输入集合中取出来让代码运行。 最简单的写法是这样的: 通常情况下这种方式会遇到一些问题。举两个我经常遇到的例子: 1. 是爬虫代码, 是页面地址。进行到 的时候,ip/账号被对方网站限制访问了。 2. 阅读全文
posted @ 2017-04-06 15:40 gooey 阅读(3611) 评论(0) 推荐(0)
摘要:key value格式的存储的应用场景很多,通用的描述是『输入一个唯一标识的input,返回(查找)一个对应的output』。Python中字典(dictionary)就是一个内置的解决方案 Python的字典本质上是一个哈希表,功能可对应Java的HashMap,但据说被尽可能地优化过(没有研究过 阅读全文
posted @ 2017-04-02 22:07 gooey 阅读(16435) 评论(0) 推荐(0)