随笔分类 -  Python爬虫

摘要:本文以爬取百度首页为示例来学习,python版本为python3.6.7,完整代码会在文章末附上 本次学习所用到的python框架:urllib.request本次学习所用到的函数: urllib.request.urlopen():发送http的get请求 .read():读取抓到的内容 .dec 阅读全文
posted @ 2019-04-01 21:44 刘晨[lcxhk_cn] 阅读(1316) 评论(0) 推荐(0)
摘要:1.首先了解一下http请求的过程以及请求的方法,这些是我们在学习爬虫之前需要明白的。2.Request Headers(请求头信息)在爬虫中也是非常重要的需要提前对其有所了解,对应request header 的是responce header(返回头信息)。3.终于到爬虫了,这里简单了解一下爬虫的分类,爬虫的工作原理,爬虫的工作流程等,都是一些理论知识,后期学习中会越来越清楚。 阅读全文
posted @ 2019-03-30 10:15 刘晨[lcxhk_cn] 阅读(653) 评论(0) 推荐(0)
摘要:前言 话说不会开发的运维不是一个好的DBA,所以我要开始学习python了,写博客记录一下我的学习过程。 不说了,时间宝贵,开整。 1.首先来看一下系统版本 [root@python3 ~]# cat /etc/redhat-release CentOS Linux release 7.6.1810 阅读全文
posted @ 2019-03-15 18:17 刘晨[lcxhk_cn] 阅读(4344) 评论(3) 推荐(1)