摘要: 一.正则解析 常用正则表达式回顾: 回顾练习: 项目需求:爬取糗事百科指定页面的糗图,并将其保存到指定文件夹中 二.Xpath解析 测试页面数据 常用xpath表达式回顾 代码中使用xpath表达式进行数据解析 安装xpath插件在浏览器中对xpath表达式进行验证:可以在插件中直接执行xpath表 阅读全文
posted @ 2019-02-26 22:03 小白° 阅读(2157) 评论(0) 推荐(0)
摘要: - 基于如下5点展开requests模块的学习 什么是requests模块 requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求。功能强大,用法简洁高效。在爬虫领域中占据着半壁江山的地位。 为什么要使用requests模块 因为在使用urllib模块的时候 阅读全文
posted @ 2019-02-26 21:44 小白° 阅读(419) 评论(0) 推荐(0)
摘要: 什么是爬虫? 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程. 那些语言可以实现爬虫? 1.php:可以实现爬虫.php被号称全世界最美的语言,但是php在实现爬虫中支持多线程和多进程方面做得不好. 2.java:可以实现爬虫.Java可以非常好的处理和实现爬虫,是唯一可以与p 阅读全文
posted @ 2019-02-26 21:22 小白° 阅读(229) 评论(0) 推荐(0)