会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Python不秋
人生苦短,我用Python。
博客园
首页
联系
订阅
管理
随笔 - 52
文章 - 0
评论 - 10
阅读 -
82857
上一页
1
2
3
4
下一页
2019年1月16日
Spider-scrapy日志处理
摘要: Scrapy生成的调试信息非常有用,但是通常太啰嗦,你可以在Scrapy项目中的setting.py中设置日志显示等级: LOG_LEVEL = 'ERROR' 日志级别 Scrapy日志有五种等级,按照范围递增顺序排列如下:(注意《Python网络数据采集》书中这里有错) CRITICAL - 严
阅读全文
posted @ 2019-01-16 19:06 Python不秋
阅读(1104)
评论(0)
推荐(0)
2019年1月14日
Spider-scrapy断点续爬
摘要: scrapy的每一个爬虫,暂停时可以记录暂停状态以及爬取了哪些url,重启时可以从暂停状态开始爬取过的URL不在爬取 实现暂停与重启记录状态 方法一: 1、首先cd进入到scrapy项目里(当然你也可以通过编写脚本Python文件直接在pycharm中运行) 2、在scrapy项目里创建保存记录信息
阅读全文
posted @ 2019-01-14 19:13 Python不秋
阅读(2834)
评论(0)
推荐(0)
2019年1月11日
SQL-Redis使用详细教程
摘要: 一、Redis基础部分: 1、redis介绍与安装比mysql快10倍以上 *****************redis适用场合**************** 1.取最新N个数据的操作 2.排行榜应用,取TOP N 操作 3.需要精确设定过期时间的应用 4.计数器应用 5.Uniq操作,获取某段时
阅读全文
posted @ 2019-01-11 20:14 Python不秋
阅读(4376)
评论(0)
推荐(0)
2019年1月10日
SQL-如何使用 MongoDB和PyMongo。
摘要: 先决条件 在开始之前,请确保已经安装了 PyMongo 发行版。 在 Python shell 中,下面的代码应该在不引发异常的情况下运行: 假设 MongoDB 实例在默认主机和端口上运行。 假设你已经下载并安装了 MongoDB,你可以这样启动它: 与 MongoClient 建立连接 使用 P
阅读全文
posted @ 2019-01-10 20:17 Python不秋
阅读(681)
评论(0)
推荐(0)
2019年1月9日
Spider-Scrapy css选择器提取数据
摘要: 首先我们来说说css选择器;其实在上面的概述:和scrapy相关的函数就这么三个而已:response.css("css表达式")、extract()、extract_first()。有变化的就是:css表达式的写法,这里我们就列举一些常见的表达式,虽然不能囊括100%的爬取任务,但可以很负责的说,
阅读全文
posted @ 2019-01-09 20:00 Python不秋
阅读(3920)
评论(1)
推荐(2)
2019年1月8日
Spider-Python爬虫之使用Selenium模拟浏览器行为
摘要: 分析 他的代码比较简单,主要有以下的步骤:使用BeautifulSoup库,打开百度贴吧的首页地址,再解析得到id为new_list标签底下的img标签,最后将img标签的图片保存下来。 前面提到过,有部分图片是动态加载的,那么首先我们得弄清楚,这部分图片是怎么动态加载的。在浏览器中打开百度贴吧的首
阅读全文
posted @ 2019-01-08 20:15 Python不秋
阅读(997)
评论(0)
推荐(0)
2019年1月7日
Spider-Python爬虫之XPath 教程
摘要: 原文链接:https://www.runoob.com/xpath/xpath-syntax.html XPath 术语 XPath 节点 七种类型:在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML 文档是被作为节点树来对待的。树的根被称为文
阅读全文
posted @ 2019-01-07 19:12 Python不秋
阅读(747)
评论(0)
推荐(0)
2019年1月4日
Spider-Python爬虫之PyQuery基本用法
摘要: 1.安装方法 pip install pyquery 2.引用方法 from pyquery import PyQuery as pq 3.简介 pyquery 是类型jquery 的一个专供python使用的html解析的库,使用方法类似bs4。 4.使用方法 4.1 初始化方法: from py
阅读全文
posted @ 2019-01-04 19:46 Python不秋
阅读(357)
评论(0)
推荐(0)
Spider-Python爬虫之聚焦爬虫与通用爬虫的区别
摘要: 为什么要学习爬虫? 学习爬虫,可以私人订制一个搜索引擎。 大数据时代,要进行数据分析,首先要有数据源。 对于很多SEO从业者来说,从而可以更好地进行搜索引擎优化。 什么是网络爬虫? 模拟客户端发送网络请求,接收请求对应的数据,按照一定的规则,自动抓取互联网信息的程序。 只要是客户端(浏览器)能做的的事情,原则上,爬虫都能做。意思就是,只要人类能够访问的网页,爬虫在具备铜等资源的情况下就一定可...
阅读全文
posted @ 2019-01-04 19:38 Python不秋
阅读(1409)
评论(0)
推荐(0)
2019年1月3日
Django之跨域请求
摘要: JSONP 什么是JSONP 首先提一下JSON这个概念,JSON是一种轻量级的数据传输格式,被广泛应用于当前Web应用中。JSON格式数据的编码和解析基本在所有主流语言中都被实现,所以现在大部分前后端分离的架构都以JSON格式进行数据的传输。 那么JSONP是什么呢? 首先抛出浏览器同源策略这个概
阅读全文
posted @ 2019-01-03 20:23 Python不秋
阅读(185)
评论(0)
推荐(0)
2019年1月2日
Django-rest_framework中利用jwt登录验证时,自定义返回凭证和登录校验支持手机号
摘要: 安装 在Django.settings中配置 调用jwt登录验证视图 在对应的Django应用的urls中添加如下路径 由于jwt返回的信息中只包括凭证token,要想在返回的结果中添加用户信息,需要通过如下配置 同时在settings中添加配置 由于jwt的登录验证默认只支持使用username,
阅读全文
posted @ 2019-01-02 18:28 Python不秋
阅读(499)
评论(0)
推荐(0)
Python基础-获取当前目录,上级目录,上上级目录
摘要: import os print '***获取当前目录***' print os.getcwd() print os.path.abspath(os.path.dirname(__file__)) print '***获取上级目录***' print os.path.abspath(os.path.dirname(os.path.dirname(__file__))) print os.p...
阅读全文
posted @ 2019-01-02 09:14 Python不秋
阅读(284)
评论(0)
推荐(1)
2018年12月27日
Django-前后台的数据交互
摘要: Django 从后台往前台传递数据时有多种方法可以实现。 最简单的后台是这样的: 这个就是返回index.html的内容,但是如果要带一些数据一起传给前台的话,该怎么办呢? view >> HTML 这里是这样:后台传递一些数据给html,直接渲染在网页上,不会有什么复杂的数据处理(如果前台要处理数
阅读全文
posted @ 2018-12-27 20:09 Python不秋
阅读(726)
评论(0)
推荐(0)
Django-Rest framework中文翻译-generic-views
摘要: 通用视图 Django的通用视图......被开发为常见用法模式的快捷方式......它们采用视图开发中的某些常见习语和模式并对其进行抽象,以便您可以快速编写数据的常用视图,而无需重复自己。 - Django文档 基于类的视图的一个主要好处是它们允许您组合可重用行为的方式。REST框架通过提供许多预
阅读全文
posted @ 2018-12-27 09:22 Python不秋
阅读(291)
评论(0)
推荐(0)
2018年12月25日
Turtle-可视化界面画圣诞树
摘要: 圣诞节(Christmas)又称耶诞节、耶稣诞辰,译名为“基督弥撒”,是西方传统节日,起源于基督教,在每年公历12月25日。弥撒是教会的一种礼拜仪式。圣诞节是一个宗教节,因为把它当作耶稣的诞辰来庆祝,故名“耶诞节”。 大部分的天主教教堂都会先在12月24日的平安夜,亦即12月25日凌晨举行子夜弥撒,
阅读全文
posted @ 2018-12-25 19:59 Python不秋
阅读(782)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告
昵称:
Python不秋
园龄:
7年4个月
粉丝:
14
关注:
3
+加关注
<
2025年6月
>
日
一
二
三
四
五
六
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
最新随笔
1.来了来了,FastAPI部署到宝塔中的技巧总结
2.不用写代码的Python自动化工具
3.[转载]Python爬虫之xpath使用技巧
4.Linux系列 - 镜像源更新为HW镜像源,解决404问题
5.Python爬虫 - UserAgent列表
6.Python知识点 - Xpath提取某个标签,需要转换为HTML。
7.Python知识点 - 获取当前系统主机名、用户名、用户目录。
8.Python基础-生物信息:找出基因,生物学家使用字母A、C、T和G构成的字符串建模一个基因组。
9.Python基础-求两个字符串最长公共前轴
10.Python基础-检测密码,一些网站会给密码强加一些规则。
我的标签
Python
(11)
Python知识点
(7)
Spider
(4)
uvicorn
(1)
pip
(1)
pandas
(1)
Linux
(1)
FastAPI
(1)
自动化测试
(1)
依赖环境
(1)
更多
积分与排名
积分 - 68204
排名 - 24684
随笔分类
(48)
Django (13)
Python基础(15)
Python进阶(3)
Spider(12)
SQL(2)
Turtle(1)
Web(1)
自动化测试(1)
随笔档案
(52)
2022年3月(1)
2022年2月(1)
2021年3月(1)
2020年4月(1)
2020年3月(1)
2019年11月(2)
2019年10月(4)
2019年6月(1)
2019年3月(1)
2019年1月(14)
2018年12月(16)
2018年10月(2)
2018年9月(2)
2018年3月(4)
2018年2月(1)
推荐排行榜
1. Spider-天眼查字体反爬(4)
2. Spider-Scrapy css选择器提取数据(2)
3. Python基础-奇偶判断调用函数(2)
4. Python基础-获取当前目录,上级目录,上上级目录(1)
点击右上角即可分享