摘要:spider-web 是爬虫的网页版,使用xml配置,支持大部分页面的爬取,支持爬取内容的保存、下载等。其中配置文件格式为:?123456789101112131415161718192021222324252627282930313233343536373839404142434445http:/...
阅读全文
随笔分类 - python
摘要:HttpComponents 也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议。不过现在的 HttpComponents 包含多个子项目,有:HttpComponents CoreH...
阅读全文
摘要:Spiderman - 又一个Java网络蜘蛛/爬虫Spiderman 是一个基于微内核+插件式架构的网络蜘蛛,它的目标是通过简单的方法就能将复杂的目标网页信息抓取并解析为自己所需要的业务数据。主要特点* 灵活、可扩展性强,微内核+插件式架构,Spiderman提供了多达 10 个扩展点。横跨蜘蛛线...
阅读全文
摘要:JSpider是一个用Java实现的WebSpider,JSpider的执行格式如下:jspider [URL] [ConfigName]URL一定要加上协议名称,如:http://,否则会报错。如果省掉ConfigName,则采用默认配置。JSpider 的行为是由配置文件具体配置的,比如采用什么...
阅读全文
摘要:Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开...
阅读全文
摘要:methanol模块化的可定制的网页爬虫软件,主要的优点是速度快。下载:http://sourceforge.net/projects/methabot/?source=typ_redirectREADME安装SpiderMonkeyhttps://developer.mozilla.org/en-...
阅读全文
摘要:Tornado就是我们在 FriendFeed 的 Web 服务器及其常用工具的开源版本。Tornado 和现在的主流 Web 服务器框架(包括大多数 Python 的框架)有着明显的区别:它是非阻塞式服务器,而且速度相当快。得利于其 非阻塞的方式和对epoll的 运用,Tornado 每秒可以处理...
阅读全文
摘要:Python 技术专题Python 是由 Guido van Rossum 开发的,可免费获得的。是一种非常高级的解释型语言。其语法简单易懂,而且面向对象的语义功能强大又灵活,Python 可以广泛使用并具有高度的可移植性。本专题内容包括可爱的 Python 系列、Python 探索系列、Pytho...
阅读全文
摘要:1icedx 241 天前 via Android ♥ 1考虑到Windows 下的类Alfred 软件都太傻逼 自己用PyQT 写了一个 2 crazyxin1988 2...
阅读全文
摘要:2013年Python社区诞生了很多实用的开发工具,这些工具 在一定程度上 可以帮助你节省更多的时间。本文为你汇总了这些工具,它们大部分都是开源的,你还可以通过源码来学习更多的Python开发知识。 1. Radon Radon是一个用于 ...
阅读全文
摘要:以正确的方式开源 Python 项目大多数Python开发者至少都写过一个像工具、脚本、库或框架等对其他人也有用的工具。我写这篇文章的目的是让现有Python代码的开源过程尽可能清 晰和无痛。我不是简单的指——“创建一个GitHub库,提交,在Reddit上发布,每天调用它”。在本文的结尾,你可以把...
阅读全文
摘要:如果你喜欢Python 那么你不得不知的几个开源项目1.Trac Trac拥有强大的bug管理功能,并集成了Wiki用于文档管理。它还支持代码管理工具Subversion,这样可以在 bug管理和Wiki中方便地参考程序源代码。Trac有着比较强大的插件系统,可以通过插件来实现各种各样的功能,比如支...
阅读全文
摘要:http://wenku.baidu.com/view/5108f974192e45361066f583.html
阅读全文
摘要:Python是一门美丽的语言。它简单易学,跨平台,而且运转良好。达成了许多Java一直求索的技术目标。一言以蔽之就是:其他的语言是与时代同 步,而Python则是未雨绸缪,而且计划得颇为出色。当然,这句话出自一位大师之言。为什么要学习Python呢?Python果真就有这么大的魅力 吗?51CTO推...
阅读全文
摘要:Python作为程序员的宠儿,越来越得到人们的关注,使用Python进行应用程序开发的越来也多。那么,在2013年有哪些流行的Python项目呢?下面,我们一起来看下。一、测试和调试 python_koans:Python Koans 算 “Ruby Koans” 的一部分,作为交互式教程,可以学习...
阅读全文
摘要:用 Python 测试框架简化测试摘要:本文将向您介绍了三种流行 Python 测试框架(zope.testing,py.test,nose)的基本特性,并讨论新一代的测试风格。最近出现了行业级的 Python 测试框架,这意味着 Python 测试可以编写得更简洁、更统一,能够产生更好的结果报告。...
阅读全文
摘要:以下是伯乐在线从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。Django: Python Web应用开发框架Django 应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响。Django是...
阅读全文
摘要:最流行的有unittest和nose其他的请看http://wiki.python.org/moin/PythonTes... 中Unit Testing Tools部分py.test unittest nose doctest,还有很多,今年也新兴了几个。不 过我的建议是,最近的方向是nose ,...
阅读全文
摘要:最近再浏览Python自动化测试框架,之前接触过unittest,看了篇文章,发现nose貌似更牛逼一些,于是安装试了试,分享一下心得。 nose 项目是于 2005 年发布的,也就是 py.test 改名后的一年。它是由 Jason Pellerin 编写的,支持与 py.test 相同的测试...
阅读全文
摘要:#!/usr/bin/env python #coding:utf-8import urllib2,re,sys,os,types #from bs4 import BeautifulSoup reload(sys);sys.setdefaultencoding('gbk'); province=...
阅读全文
浙公网安备 33010602011771号