兵马逐浪去,将象入海流。炮声震心动,惊起卧龙游。
我的博客园主页 --------- 我的知乎主页 --------- 我的github主页 --------- 我的csdn主页 --------- 我的新浪微博
摘要: 转载:http://blog.chinaunix.net/u/22677/showart_1076318.html1.简介sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。sed编辑器逐行处理文件(或输入),并将结果发送到屏幕。具... 阅读全文
posted @ 2014-11-12 14:01 leoking01 阅读(195) 评论(0) 推荐(0)
摘要: 原文:http://www.yakergong.net/blog/archives/500使用scrapy有大概半年了,算是有些经验吧,在这里跟大家讨论一下使用scrapy作为爬虫进行大规模抓取可能遇到的问题。我们抓取的目标是教育网上的网站(目前主要针对.edu.cn和.ca... 阅读全文
posted @ 2014-11-12 11:50 leoking01 阅读(398) 评论(0) 推荐(0)
摘要: [10gen]name=10gen Repositorybaseurl=http://downloads-distro.mongodb.org/repo/redhat/os/i686gpgcheck=0# CentOS-Base.repo## The mirror syste... 阅读全文
posted @ 2014-11-12 10:52 leoking01 阅读(441) 评论(0) 推荐(0)
摘要: 转载:http://blog.chinaunix.net/u/22677/showart_1076318.html1.简介sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。sed编辑器逐行处理文件(或输入)... 阅读全文
posted @ 2014-11-12 10:35 leoking01 阅读(157) 评论(0) 推荐(0)
摘要: 一、SQL Relay是什么?SQL Relay是一个开源的数据库池连接代理服务器二、SQL Relay支持哪些数据库?* Oracle* MySQL* mSQL* PostgreSQL* Sybase* MS SQL Server* IBM DB2* Interbase* ... 阅读全文
posted @ 2014-11-12 10:32 leoking01 阅读(204) 评论(0) 推荐(0)
摘要: 最近有幸,在学校的图书馆借到了子柳先生的《淘宝技术这十年》,拜读一番,感慨万分。一、淘宝的核心技术(国内乃至国际的Top,这还是2011年的数据)拥有全国最大的分布式Hadoop集群(云梯,2000左右节点,24000核CPU,48000GB内存,40PB存储容量)全国分布8... 阅读全文
posted @ 2014-11-12 10:10 leoking01 阅读(264) 评论(0) 推荐(0)
摘要: 英文原文:Build a Website Crawler based upon Scrapy标签:ScrapyPython209人收藏此文章,我要收藏renwofei423推荐于 11个月前 (共 9 段, 翻译完成于 12-30) (14评)参与翻译(3人):LeoXu,B... 阅读全文
posted @ 2014-11-12 09:42 leoking01 阅读(317) 评论(0) 推荐(0)
#back-to-top { background-color: #00CD00; bottom: 0; box-shadow: 0 0 6px #00CD00; color: #444444; padding: 10px 10px; position: fixed; right: 50px; cursor: pointer; }