01 2018 档案
摘要:笔者最近遇到一个需求: 现在需要当在数据表中的某个模型中新增一条记录后,需要将这条记录的生成信息添加到logging模块中,即每生成一条数据记录,就打印出相应的日志。笔者首先的需求是考虑使用装饰器,例如对每个执行新增记录的视图函数加上装饰器,每当执行这个视图函数时候,就先执行这个装饰器。但是这样有个
阅读全文
摘要:一.介绍: Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Soup3 的文档,Beautif
阅读全文
摘要:实际生产环境下,我们一般使用lxml的xpath来解析出我们想要的数据,本篇博客将重点整理Selenium和Xpath表达式,关于CSS选择器,将另外再整理一篇! 一.介绍: 可以参考Selenium的官方地址:http://selenium-python.readthedocs.io 二 安装 #
阅读全文
摘要:本篇博客将带领大家梳理爬虫中的requests模块,并结合Github的自动登入验证具体讲解requests模块的参数。 一.引入: 我们先来看如下的例子,初步体验下requests模块的使用: 打印结果如下: <class 'requests.models.Response'>200UTF-8<R
阅读全文
摘要:AJAX(Asynchronous Javascript And XML)翻译成中文就是“异步Javascript和XML”。即使用Javascript语言与服务器进行异步交互,传输的数据为XML(当然,传输的数据不只是XML)。 同步交互:客户端发出一个请求后,需要等待服务器响应结束后,才能发出第
阅读全文
摘要:在上一篇中,笔者跟大家提到了如何使用location.search来获取URL地址?后面的内容,本篇博客将聚焦于如何使用jquery获取当前页面的URL地址信息。 一.设置或获取对象指定的文件名或路径:就是获取端口和?之间的文件名或者路径,看下图就明白了: 二. 设置或获取整个 URL 为字符串。
阅读全文
浙公网安备 33010602011771号