文章分类 -  Python

Python开发简单的爬虫
安装运行Python
摘要:第一 : 安装Python 有两个版本 2.7 和 3x ,她们不兼容,许多第三方不能用到 3x ① 在官方下载适合自己的(我电脑是64位,系统是Windows), 地址 : https://www.python.org/ ② 安装好 ③ 用 Nodepad++ 工具写,后缀名为 .py ,不要用W 阅读全文
posted @ 2016-07-19 11:11 zengyanlove 阅读(108) 评论(0) 推荐(0)
爬虫运行流程
摘要:爬虫含义: 一段自动抓取网页数据的程序 爬虫价值: 获取网页数据,为我所用 爬虫架构: 爬虫动态运行流行: url管理器: 看该网页是否爬过.....(防止重复和循环) url管理器实现方式: ①内存(Python自带的set(),有防止重复的url),,,,,适合小型网站 ②关系数据库(mysql 阅读全文
posted @ 2016-07-18 14:36 zengyanlove 阅读(235) 评论(0) 推荐(0)