python 爬虫系列教程方法总结及推荐
摘要:爬虫,是我学习的比较多的,也是比较了解的。打算写一个系列教程,网上搜罗一下,感觉别人写的已经很好了,我没必要重复造轮子了。爬虫不过就是访问一个页面然后用一些匹配方式把自己需要的东西摘出来。而访问页面经常用到的几个库,一是urllib和urllib2结合使用,二是requests的使用。第一种方法可以...
阅读全文
posted @
2015-09-19 22:19
slower
阅读(1284)
推荐(0)
python 文件读写时用open还是codecs.open
摘要:当我面有数据需要保存时,第一时间一般会想到写到一个txt文件中,当然,数据量比较大的时候还是写到数据库比较方便管理,需要进行网络传输时要序列化,json化。下面主要整理一下平时用的最多的写入到文件中,一般以txt结尾,linux里不会以后缀来区分文件类型,后缀可以随便,也可以没有。 python读...
阅读全文
posted @
2015-09-13 23:20
slower
阅读(69367)
推荐(12)
python 列表构造时的引用问题
摘要:以前老是不注意python对象引用,平时也没遇到这样的问题,昨天在这个小问题纠结了半天时间。真是TMD啊先说明一下我的目的,我有一个包含16个元素的列表,每个元素也是一个小列表。我想每四个子列表为一个单位,改变每个子列表的第一个元素为我想要的值。代码如下>>>a = range(1,5)>>>b =...
阅读全文
posted @
2015-09-08 23:08
slower
阅读(563)
推荐(0)