清风软件测试开发

Python爬虫从入门到放弃（十四）之 Scrapy框架中选择器的用法

2019-01-27 00:16 by 清风软件测试开发, 461 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/7189860.html Scrapy提取数据有自己的一套机制，被称作选择器（selectors）,通过特定的Xpath或者CSS表达式来选择HTML文件的某个部分Xpath是专门在XML文件中选择节点的语言，也可以用在HTML 阅读全文

0 Comment

Python爬虫从入门到放弃（十三）之 Scrapy框架的命令行详解

2019-01-27 00:11 by 清风软件测试开发, 465 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/7183220.html 这篇文章主要是对的scrapy命令行使用的一个介绍创建爬虫项目 scrapy startproject 项目名例子如下：这个时候爬虫的目录结构就已经创建完成了,目录结构如下：接着我们按照提示可以生阅读全文

0 Comment

Python爬虫从入门到放弃（十二）之 Scrapy框架的架构和原理

2019-01-27 00:03 by 清风软件测试开发, 456 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/7173397.html 这一篇文章主要是为了对scrapy框架的工作流程以及各个组件功能的介绍 Scrapy目前已经可以很好的在python3上运行Scrapy使用了Twisted作为框架，Twisted有些特殊的地方是它是事阅读全文

0 Comment

Python爬虫从入门到放弃（十一）之 Scrapy框架整体的一个了解

2019-01-26 23:59 by 清风软件测试开发, 416 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/7173094.html 这里是通过爬取伯乐在线的全部文章为例子，让自己先对scrapy进行一个整理的理解该例子中的详细代码会放到我的github地址：https://github.com/pythonsite/spider/ 阅读全文

0 Comment

Python爬虫从入门到放弃（十）之关于深度优先和广度优先

2019-01-26 23:48 by 清风软件测试开发, 736 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/7092400.html 网站的树结构深度优先算法和实现广度优先算法和实现网站的树结构通过伯乐在线网站为例子：并且我们通过访问伯乐在线也是可以发现，我们从任何一个子页面其实都是可以返回到首页，所以当我们爬取页面的数据的阅读全文

0 Comment

python爬虫从入门到放弃（九）之实例爬取上海高级人民法院网开庭公告数据

2019-01-26 23:44 by 清风软件测试开发, 601 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/6959012.html 通过前面的文章已经学习了基本的爬虫知识，通过这个例子进行一下练习，毕竟前面文章的知识点只是一个一个单独的散知识点，需要通过实际的例子进行融合分析网站其实爬虫最重要的是前面的分析网站，只有对要爬取的阅读全文

0 Comment

python爬虫从入门到放弃（八）之 Selenium库的使用

2019-01-26 23:42 by 清风软件测试开发, 557 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/6953241.html 一、什么是Selenium selenium 是一套完整的web应用程序测试系统，包含了测试的录制（selenium IDE）,编写及运行（Selenium Remote Control）和测试的并行处阅读全文

0 Comment

python爬虫从入门到放弃（七）之 PyQuery库的使用

2019-01-26 23:36 by 清风软件测试开发, 590 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/6935473.html PyQuery库也是一个非常强大又灵活的网页解析库，如果你有前端开发经验的，都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择，PyQuery 是 Python 仿照 jQuery 的严格阅读全文

0 Comment

python爬虫从入门到放弃（六）之 BeautifulSoup库的使用

2019-01-26 23:30 by 清风软件测试开发, 412 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/6930955.html 上一篇文章的正则，其实对很多人来说用起来是不方便的，加上需要记很多规则，所以用起来不是特别熟练，而这节我们提到的beautifulsoup就是一个非常强大的工具，爬虫利器。 beautifulSoup 阅读全文

0 Comment

python爬虫从入门到放弃（五）之正则的基本使用

2019-01-26 23:19 by 清风软件测试开发, 456 阅读, 0 推荐, 收藏,

摘要：原文地址https://www.cnblogs.com/zhaof/p/6925674.html 什么是正则表达式正则表达式是对字符串操作的一种逻辑公式，就是事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符”，这个“规则字符” 来表达对字符的一种过滤逻辑。正则并不是pytho 阅读全文

0 Comment

清风软件测试开发测试开发_性能测试_自动化测试_平台开发_AIOT___高并发性能调优