随笔分类 -  python爬虫初级阶段

近段比较忙,这门语言的学习得先放一段落。
python 高级语法
摘要:1 #coding:utf-8 2 3 #定义一个装饰器函数 4 def doc_func(func): 5 6 #包裹函数(闭包) 7 def warpfunc(): 8 #做一些额外的事情 9 print "%s called" %(func.__name__) 10 func() 1... 阅读全文

posted @ 2016-11-19 20:01 路之遥_其漫漫 阅读(462) 评论(0) 推荐(0)

python 脚本(获取指定文件夹、指定文件格式、的代码行数、注释行数)
摘要:1.代码的运行结果: 获取 指定文件夹下、指定文件格式 文件的: 总代码行数、总注释行数(需指定注释格式)、总空行数; 阅读全文

posted @ 2016-11-19 19:51 路之遥_其漫漫 阅读(689) 评论(0) 推荐(0)

python代码 构建验证码
摘要:1.python代码编写 (随机验证码): 阅读全文

posted @ 2016-11-19 19:45 路之遥_其漫漫 阅读(319) 评论(0) 推荐(0)

post请求方式的翻页爬取内容及思考
摘要:1 #coding=utf-8 2 3 import urllib2 4 import urllib 5 import json 6 9 output = open('huizho.json', 'w') 11 for page in range(1,30): //爬取的页数,从1至29页 12 r 阅读全文

posted @ 2016-06-29 13:01 路之遥_其漫漫 阅读(1693) 评论(0) 推荐(0)

爬虫1:get请求的翻页及思考
摘要:刚开始接触爬虫,理解还不透彻,说一些初始阶段的想法{1.因为get请求的方式(请求体无数据,不能通过Request.add_data()函数来添加数据,实现对网址翻页;需要直接对网址进行操作来实现翻页功能)2.post请求方式存在数据请求数据(可以通过Request.add_data()函数来添加数 阅读全文

posted @ 2016-06-29 12:03 路之遥_其漫漫 阅读(965) 评论(0) 推荐(0)

导航