摘要: urllib库是python内置的一个http请求库 其实urllib库不好用,没有requests库好用,下一篇文章再写requests库,requests库是基于urllib库实现的 作为最最基本的请求库,了解一下原理和用法还是很有必要的 包含的四个模块: urllib.request 请求模块 阅读全文
posted @ 2018-06-08 22:42 RongHe 阅读(2489) 评论(0) 推荐(0) 编辑
摘要: 爬虫定义 请求网站并提取数据的自动化程序 爬虫的基本流程 1、发起请求:通过http库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等待服务器响应 2、获取响应内容:如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取的页面内容 阅读全文
posted @ 2018-06-08 13:48 RongHe 阅读(297) 评论(0) 推荐(0) 编辑