欢迎来到Felix的博客

Do the right things! And talk is cheap,show me your code!

随笔分类 -  爬虫

摘要:一:beautifulsoup简介 beautifulsoup是一个非常强大的工具,爬虫利器。 beautifulSoup “美味的汤,绿色的浓汤” 一个灵活又方便的网页解析库,处理高效,支持多种解析器。利用它就不用编写正则表达式也能方便的实现网页信息的抓取。 二:常用解析库 Beautiful S 阅读全文
posted @ 2018-04-06 14:58 寂静的天空 阅读(2083) 评论(1) 推荐(0)
摘要:一:什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的 阅读全文
posted @ 2018-04-03 22:46 寂静的天空 阅读(578) 评论(0) 推荐(0)
摘要:一:什么是爬虫 请求网站并提取数据的自动化程序。 二:爬虫基本流程 a.发起请求 通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等服务器响应。 b.获取响应内容 如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取 阅读全文
posted @ 2018-04-03 15:22 寂静的天空 阅读(408) 评论(0) 推荐(0)
摘要:什么是Urllib: python内置的HTTP请求库 urllib.request : 请求模块 urllib.error : 异常处理模块 urllib.parse: url解析模块 urllib.robotparser : robots.txt解析模块 GET请求方式 POST请求方式 超时t 阅读全文
posted @ 2018-04-03 15:17 寂静的天空 阅读(440) 评论(0) 推荐(0)

个人感悟: 一个人最好的镜子就是自己,你眼中的你和别人眼中的你,不是一回事。有人夸你,别信;有人骂你,别听。一根稻草,扔街上就是垃圾;捆上白菜就是白菜价;捆上大闸蟹就是大闸蟹的价。 一个人,不狂是没有出息的,但一直狂,肯定是没有出息的。雨打残花风卷流云,剑影刀光闪过后,你满脸冷酷的站在珠峰顶端,傲视苍生无比英武,此时我问你:你怎么下去? 改变自己就是改变自己的心态,该沉的时候沉下去,该浮的时候浮上来;不争名夺利,不投机取巧,不尔虞我诈;少说、多听、多行动。人每所谓穷通寿夭为命所系,岂不知造物之报施,全视人之自取。 座佑铭:每一个不曾起舞的日子,都是对生命的辜负。