随笔分类 -  python

python——urlparse:解析url
摘要:urlparse模块主要是把url拆分为6部分,并返回元组。并且可以把拆分后的部分再组成一个url。主要有函数有urljoin、urlsplit、urlunsplit、urlparse、parse_qs等。 urlparse.urlparse(urlstring[, scheme[,allow_fr 阅读全文

posted @ 2017-07-11 11:04 月未央 阅读(27494) 评论(0) 推荐(0)

linux下安装protobuf
摘要:在root权限下执行: 1、网上下载protobuf-2.5.0.tar.gz 2、解压缩 tar zxvf protobuf-2.5.0.tar.gz 3、cd protobuf-2.5.0 4、./configure --prefix=/usr/local/protobuf 5、make 6、m 阅读全文

posted @ 2016-09-30 10:22 月未央 阅读(2806) 评论(0) 推荐(0)

[转载]python encode和decode函数说明
摘要:转自:http://www.cnblogs.com/evening/archive/2012/04/19/2457440.html字符串编码常用类型:utf-8,gb2312,cp936,gbk等。python中,我们使用decode()和encode()来进行解码和编码在python中,使用uni... 阅读全文

posted @ 2015-09-29 15:30 月未央 阅读(1076) 评论(0) 推荐(0)

[转载]Python2.7 urlparse学习
摘要:转自:http://my.oschina.net/guol/blog/95699urlparse模块主要是把url拆分为6部分,并返回元组。并且可以把拆分后的部分再组成一个url。主要有函数有urljoin、urlsplit、urlunsplit、urlparse等。urlparse.urlpars... 阅读全文

posted @ 2015-09-29 15:24 月未央 阅读(3007) 评论(0) 推荐(0)

python——string
摘要:#!/usr/bin/python#-*-coding:utf-8-*-_str="Hello,World"#1.获取字符串的第一个字母print"1.获取字符串的第一个字母:"+_str[0]#2.获取字符串的第二和第三个字母print"2.获取字符串的第二和第三个字母:"+_str[1:3]#3... 阅读全文

posted @ 2015-09-29 15:18 月未央 阅读(319) 评论(0) 推荐(0)

[转载]用python解析html--SGMLParser
摘要:转自:http://pako.iteye.com/blog/592009sgmllib.py 包含一个重要的类: SGMLParser。SGMLParser 将 HTML 分解成有用的片段, 比如开始标记和结束标记。一旦它成功地分解出某个数据为一个有用的片段,它会根据 所发现的数据,调用一个自身内部... 阅读全文

posted @ 2015-09-29 15:06 月未央 阅读(596) 评论(0) 推荐(0)

[转载]python模块学习---HTMLParser(解析HTML文档元素)
摘要:转自:http://blog.csdn.net/hxsstar/article/details/17241709HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法.使用时需要定义一个从类HTMLParser继承的类... 阅读全文

posted @ 2015-09-29 15:05 月未央 阅读(23806) 评论(0) 推荐(1)

[转载]Python爬虫入门八之Beautiful Soup的用法
摘要:转自http://cuiqingcai.com/1319.html上一节我们介绍了正则表达式,它的内容其实还是蛮多的,如果一个正则匹配稍有差池,那可能程序就处在永久的循环之中,而且有的小伙伴们也对写正则表达式的写法用得不熟练,没关系,我们还有一个更强大的工具,叫Beautiful Soup,有了它我... 阅读全文

posted @ 2015-09-29 13:00 月未央 阅读(1959) 评论(0) 推荐(0)

[转载]Python爬虫入门七之正则表达式
摘要:转自:http://cuiqingcai.com/977.html在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,正则表达式!1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特... 阅读全文

posted @ 2015-09-29 10:58 月未央 阅读(278) 评论(0) 推荐(0)

[转载]Python爬虫入门四之Urllib库的高级用法
摘要:转自:http://cuiqingcai.com/954.html1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。首先,打开我们的浏览器,调试浏览器F12,我用的是Chro... 阅读全文

posted @ 2015-09-29 10:42 月未央 阅读(224) 评论(0) 推荐(0)

[转载]Python爬虫入门三之Urllib库的基本使用
摘要:python爬虫系列教程http://cuiqingcai.com/1052.html1.分分钟扒一个网页下来怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作... 阅读全文

posted @ 2015-09-29 10:33 月未央 阅读(183) 评论(0) 推荐(0)

[python]-urllib和urllib2模块
摘要:转自:http://zeping.blog.51cto.com/6140112/1143722urllib和urllib2都是接受URL请求的相关模块,但是提供了不同的功能。urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有。urllib:网页基础:importu... 阅读全文

posted @ 2015-09-29 10:19 月未央 阅读(678) 评论(0) 推荐(0)

python字符串方法split的一道坑
摘要:转自http://www.cnblogs.com/librasz/p/3232611.html初看这个方法还挺好用的,用来切割字符串真是的是非常方便,返回的字符串数组也非常容易处理。于是乎看了一眼就应用到我的程序当中去了。用来切割如下形式的字符串s = 'Jul 24 21:38:25 luozw ... 阅读全文

posted @ 2015-09-25 10:04 月未央 阅读(2915) 评论(0) 推荐(0)

python —— strip,split,join
摘要:strip函数原型声明:s为字符串,rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处,位于rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处,位于rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处,位于rm删除序列的字符注意:1. 当rm为空时,默... 阅读全文

posted @ 2015-09-25 09:59 月未央 阅读(707) 评论(0) 推荐(0)

导航