2018 年 6月 8 日随笔档案 - RongHe

2018年6月8日

摘要： urllib库是python内置的一个http请求库其实urllib库不好用，没有requests库好用，下一篇文章再写requests库，requests库是基于urllib库实现的作为最最基本的请求库，了解一下原理和用法还是很有必要的包含的四个模块： urllib.request 请求模块阅读全文

posted @ 2018-06-08 22:42 RongHe 阅读(2681) 评论(0) 推荐(0)

爬虫基本原理

摘要：爬虫定义请求网站并提取数据的自动化程序爬虫的基本流程 1、发起请求：通过http库向目标站点发起请求，即发送一个Request，请求可以包含额外的headers等信息，等待服务器响应 2、获取响应内容：如果服务器能正常响应，会得到一个Response,Response的内容便是所要获取的页面内容阅读全文

posted @ 2018-06-08 13:48 RongHe 阅读(341) 评论(0) 推荐(0)

PyLab

公告