随笔分类 -  python

摘要:# -*- coding: utf-8-*-import re##过滤HTML中的标签#将HTML中标签等信息去掉#@param htmlstr HTML字符串.def filter_tags(htmlstr):#先过滤CDATA re_cdata=re.compile('//<!\[CDATA\[ 阅读全文
posted @ 2017-09-13 09:37 子非鱼° 阅读(2605) 评论(0) 推荐(0)
摘要:原文链接:https://www.zhihu.com/question/24590883/answer/92420471 原文链接:Python 资源大全 这又是一个 Awesome XXX 系列的资源整理,由 vinta 发起和维护。内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、 阅读全文
posted @ 2017-09-12 10:08 子非鱼° 阅读(2492) 评论(0) 推荐(0)
摘要:python中if __name__ == '__main__': 的解析 当你打开一个.py文件时,经常会在代码的最下面看到if __name__ == '__main__':,现在就来介 绍一下它的作用. 模块是对象,并且所有的模块都有一个内置属性 __name__。一个模块的 __name__ 阅读全文
posted @ 2017-07-26 09:41 子非鱼° 阅读(1076) 评论(0) 推荐(0)
摘要:当用多线程爬取某个网站的数据的时候,爬取一段时间后,总出现urlopen error [errno 10060]的错误,结果线程无端的被挂掉,一开始的解决思路是每次连接的时候换用不同的useragent,结果还是出现这种问题,在网上查了下,看到网上别人的经验,原来是 如果用多个线程爬去某个网站的数据 阅读全文
posted @ 2017-07-21 11:15 子非鱼° 阅读(5195) 评论(0) 推荐(0)
摘要:本篇主要总结Python中绑定方法对象(Bound method object)和未绑定方法对象(Unboud method object)的区别和联系。主要目的是分清楚这两个极容易混淆的概念,顺便将Python的静态方法,类方法及实例方法加以说明 OK,下面开始 1. 一个方法引发的“血案” 类中 阅读全文
posted @ 2017-07-20 18:19 子非鱼° 阅读(1075) 评论(0) 推荐(0)
摘要:有时候我们需要模糊查找我们需要的字符串等值,这个时候需要用到正则表达式。 正则表达式的使用,在python中需要引入re包 import re 1、首先了解下正则表达式的常用语法 import re 1、首先了解下正则表达式的常用语法 ——单个字符 . . . . . . . . 任意的一个字符 任 阅读全文
posted @ 2017-07-15 18:03 子非鱼° 阅读(367) 评论(0) 推荐(0)