随笔分类 - Python练习
摘要:修改点:1. decode('gbk')修改为decode('gbk','replace'),在遇到不能识别的字符时直接用?替换2. 将原来的单线程变为多线程,现在处理速度快了好多 1 #! /bin/python 2 # -*- coding:utf-8 -*- 3 4 # -------------------------------------------- 5 # 程序:【23hh小说网】爬虫 6 # 版本:0.2.2 7 # 作者:Silence 8 # 日期:2014-04-08 9 # 功能:1. 提供一个目录页,把这个...
阅读全文
摘要:这个是初版,就是把这个小说网上正在看的页面给抓下来。 1 #! /bin/python 2 # -*- coding:utf-8 -*- 3 4 # -------------------------------------------- 5 # 程序:【看小说】爬虫 6 # 版本:0.1 7 # 作者:Silence 8 # 日期:2014-03-30 9 # 操作:输入quit退出10 # 功能:自动把指定网站上的指定小说内容给抓下来,并显示出来11 # 修改:0.2 提供一个目录页,把目录页中所有的目录章节都抓出来,并存储为txt文...
阅读全文
摘要:1 #! /bin/python 2 # -*- coding:utf-8 -*- 3 4 # -------------------------------------------- 5 # 程序:【23hh小说网】爬虫 6 # 版本:0.2 7 # 作者:Silence 8 # 日期:2014-04-01 9 # 操作:输入quit 10 # 功能:提供一个目录页,把这个小说的全部章节都抓取下来 11 # --------------------------------------------- 12 import ur...
阅读全文
摘要:1 # -*- coding:utf-8 -*- 2 # ************************************* 3 # 程序:学习蜘蛛协议的第一个例子 4 # 版本:1.0 5 # 作者:Silence 6 # 语言:Python 2.7 7 # 日期:2014-03-15 8 # 操作:就是下载贴吧里面某个贴吧的所有网页,并且存储为html文件 9 # *************************************10 11 import string,urllib2,re12 from urllib2 im...
阅读全文
摘要:这个是学爬虫时的练习。例子上面的用起来不太爽,就自己稍微改了下,练手用 1 # -*- coding:utf-8 -*- 2 # -------------------------------------------- 3 # 程序:【糗百最热】爬虫 4 # 版本:0.1 5 # 作者:Silence 6 # 日期:2014-03-25 7 # 操作:输入quit退出 8 # 功能:运行后按Enter键可以浏览今天的糗百热点 9 # --------------------------------------------- 10...
阅读全文

浙公网安备 33010602011771号