摘要:        
转载:http://blog.chinaunix.net/u/22677/showart_1076318.html1.简介sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。sed编辑器逐行处理文件(或输入),并将结果发送到屏幕。具...    阅读全文
posted @ 2014-11-12 14:01
leoking01
阅读(195)
评论(0)
推荐(0)
        
            
        
        
摘要:        
原文:http://www.yakergong.net/blog/archives/500使用scrapy有大概半年了,算是有些经验吧,在这里跟大家讨论一下使用scrapy作为爬虫进行大规模抓取可能遇到的问题。我们抓取的目标是教育网上的网站(目前主要针对.edu.cn和.ca...    阅读全文
posted @ 2014-11-12 11:50
leoking01
阅读(398)
评论(0)
推荐(0)
        
            
        
        
摘要:        
[10gen]name=10gen Repositorybaseurl=http://downloads-distro.mongodb.org/repo/redhat/os/i686gpgcheck=0# CentOS-Base.repo## The mirror syste...    阅读全文
posted @ 2014-11-12 10:52
leoking01
阅读(441)
评论(0)
推荐(0)
        
            
        
        
摘要:        
转载:http://blog.chinaunix.net/u/22677/showart_1076318.html1.简介sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。sed编辑器逐行处理文件(或输入)...    阅读全文
posted @ 2014-11-12 10:35
leoking01
阅读(157)
评论(0)
推荐(0)
        
            
        
        
摘要:        
一、SQL Relay是什么?SQL Relay是一个开源的数据库池连接代理服务器二、SQL Relay支持哪些数据库?* Oracle* MySQL* mSQL* PostgreSQL* Sybase* MS SQL Server* IBM DB2* Interbase* ...    阅读全文
posted @ 2014-11-12 10:32
leoking01
阅读(204)
评论(0)
推荐(0)
        
            
        
        
摘要:        
最近有幸,在学校的图书馆借到了子柳先生的《淘宝技术这十年》,拜读一番,感慨万分。一、淘宝的核心技术(国内乃至国际的Top,这还是2011年的数据)拥有全国最大的分布式Hadoop集群(云梯,2000左右节点,24000核CPU,48000GB内存,40PB存储容量)全国分布8...    阅读全文
posted @ 2014-11-12 10:10
leoking01
阅读(264)
评论(0)
推荐(0)
        
            
        
        
摘要:        
英文原文:Build a Website Crawler based upon Scrapy标签:ScrapyPython209人收藏此文章,我要收藏renwofei423推荐于 11个月前 (共 9 段, 翻译完成于 12-30) (14评)参与翻译(3人):LeoXu,B...    阅读全文
posted @ 2014-11-12 09:42
leoking01
阅读(317)
评论(0)
推荐(0)
        

浙公网安备 33010602011771号