随笔分类 -  python

摘要:FROM: http://segmentfault.com/a/1190000000382873Python的并发处理能力臭名昭著。先撇开线程以及GIL方面的问题不说,我觉得多线程问题的根源不在技术上而在于理念。大部分关于Pyhon线程和多进程的资料虽然都很不错,但却过于细节。这些资料讲的都是虎头蛇尾,到了真正实际使用的部分却草草结束了。传统例子在DDGhttps://duckduckgo.com/搜索“Python threading tutorial”关键字,结果基本上却都是相同的类+队列的示例。标准线程多进程,生产者/消费者示例:这里是代码截图,如果用其他模式贴出大段代码会很不美观。文. 阅读全文
posted @ 2014-01-11 22:56 wmx3ng 阅读(346) 评论(0) 推荐(0)
摘要:FROM:http://my.oschina.net/012345678/blog/122355相信用python的人一定在抓取网页时,被编码问题弄晕过一阵前几天写了一个测试网页的小脚本,并查找是否包含指定的信息。在html = urllib2.open(url).read() 时,打印到控制台始终出现乱码。一般的解决办法就是html.decode('utf-8').encode('gb2312'),不过这个即使用了,也没能解决我的问题这里有两个问题,第一个你要知道网页的编码格式是utf-8 第二你得确定你的系统是gb2312的,能不能主动获取网页的编码格式,并 阅读全文
posted @ 2013-12-30 09:22 wmx3ng 阅读(233) 评论(0) 推荐(0)
摘要:FROM:http://www.jb51.net/article/16104.htm在Python中,可以对String调用decode和encode方法来实现转码。比如,若要将某个String对象s从gbk内码转换为UTF-8,可以如下操作s.decode('gbk').encode('utf-8′)可是,在实际开发中,我发现,这种办法经常会出现异常:UnicodeDecodeError: ‘gbk' codec can't decode bytes in position 30664-30665: illegal multibyte sequence 阅读全文
posted @ 2013-12-29 23:20 wmx3ng 阅读(892) 评论(0) 推荐(0)