摘要: 网页下载器 网页下载器是将URL对应的网页下载到本地的工具 Python网页下载器: urllib2 : Python官方基础模块 requests : 第三方插件,功能更强大 三种下载网页的方法 最简洁最传统: 需向服务器提供data,http header等信息: request = urlli 阅读全文
posted @ 2016-05-12 12:07 早上好王木木 阅读(510) 评论(0) 推荐(0)
摘要: 网页解析器 从网页中提取有价值数据的工具 网页解析器种类 正则表达式 (模糊匹配) html.parser (结构化解析) BeautifulSoup第三方插件 (结构化解析,相对比较强大) lxml第三方插件 (结构化解析) 【结构化解析 DOM(Document Object Model)树】 阅读全文
posted @ 2016-05-12 12:04 早上好王木木 阅读(240) 评论(1) 推荐(0)