方少0410 - 博客园

2018年1月23日

该文被密码保护。阅读全文

posted @ 2018-01-23 21:19 方少0410 阅读(7) 评论(0) 推荐(0)

2018年1月16日

摘要：一介绍 Scrapy一个开源和协作的框架，其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛，可用于如数据挖掘、监测和自动化测试等领域，也可以应用在获取API所返回的数据(例如 Amazon As 阅读全文

posted @ 2018-01-16 21:11 方少0410 阅读(166) 评论(0) 推荐(0)

2018年1月15日

爬虫之mongodb数据库

摘要：一 mongodb的介绍 1、易用性：mongodb是一款强大。灵活并且易扩展的数据库。他面向于文档的数据库，而不是关系性数据库。不采用关系型主要是为了获得更好的扩展性。还有一个好处就是面向文档的数据库不在需要行（row）的概念。通过在文档中嵌入文档和数组，面向文档的方法能够仅使用一条记录来表现复杂阅读全文

posted @ 2018-01-15 17:19 方少0410 阅读(350) 评论(0) 推荐(0)

2018年1月12日

爬虫模块之解决IO

摘要：一 asyncio模块 asyncio模块：主要是帮我们检测IO（只能是网路IO）。 @asyncio.coroutine：装饰器 tasks：任务列表 get_event_loop：起任务 run_until_complete：提交的方式，检测任务的执行 asgncio.gather（任务列表）：阅读全文

posted @ 2018-01-12 19:21 方少0410 阅读(178) 评论(0) 推荐(0)

爬虫模块之解析模块

摘要：一 BeautifulSoup4模块下载解释器：lxml，处理速度快，以下也是安装lxml解释器的。另一个可供选择的解析器是纯Python实现的 html5lib , html5lib的解析方式与浏览器相同,可以选择下列方法来安装html5lib: 安装BeautifulSoup：pip ins 阅读全文

posted @ 2018-01-12 17:24 方少0410 阅读(167) 评论(0) 推荐(0)

2018年1月11日

selenium模块之破解滑动验证

该文被密码保护。阅读全文

posted @ 2018-01-11 16:44 方少0410 阅读(3) 评论(0) 推荐(0)

2018年1月10日

第一次的大作业

该文被密码保护。阅读全文

posted @ 2018-01-10 16:58 方少0410 阅读(2) 评论(0) 推荐(0)

爬虫模块之selenium模块

摘要：一模块的介绍 selenium模块最开始是一个自动化测试的工具，驱动浏览器完全模拟浏览器自动测试。二下载安装 #安装：selenium+chromedriver pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可，注阅读全文

posted @ 2018-01-10 16:57 方少0410 阅读(216) 评论(0) 推荐(0)

2018年1月9日

爬虫模块之requests模块

摘要：一模块的下载安装 pip install requests 二爬虫的介绍什么是爬虫：就是模拟浏览器发送请求；保存到本地；提取有用的数据；保存到数据库爬虫的价值：获取有用的数据，保存到数据库爬虫的基本流程： 1.发起请求使用http库向目标站点发起请求，即发送一个Request Reque 阅读全文

posted @ 2018-01-09 20:08 方少0410 阅读(667) 评论(0) 推荐(0)

2018年1月1日

django之中间件

摘要：中间件：主要用于安全验证。 class MiddleWare2(MiddlewareMixin): def process_request(self,request): print("MW2 request...........") # return HttpResponse("666!") def 阅读全文

posted @ 2018-01-01 18:07 方少0410 阅读(130) 评论(0) 推荐(0)