会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Master跑跑
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
下一页
2019年3月6日
扎实基础深入篇(七):函数和类没那么复杂
摘要: 一.函数(def) 函数,对于函数这个概念,大家都想必很熟悉,函数广泛应用于数学,科技,医疗等等众多行业。 那么,在Python中,函数就是带名字的代码块。 函数最显现的作用就是将一个代码块封装起来,你要调用它的时候就输入函数名,无需输入重复的代码。 现在来一个快速的例子展现一下函数: def gr
阅读全文
posted @ 2019-03-06 11:49 Master跑跑
阅读(136)
评论(0)
推荐(0)
2019年1月28日
扎实基础深入篇(六):while循环带动生产力
摘要: 在本篇博客中,你将学习如何让程序不断地运行,让用户能够根据需要输入信息,并在程序中使用这些信息。 为此,你需要使用wile循环让程序不断地运行,直到指定的条件不满足为止。 注意:在学习循环的路上,一定要学会刹车! 在进入本篇博客学习之前,我们需要解决一下上篇博客留下来的作业: 创建一个名为citie
阅读全文
posted @ 2019-01-28 22:15 Master跑跑
阅读(357)
评论(0)
推荐(0)
2019年1月26日
扎实基础深入篇(五):字典也就是个弟弟
摘要: 在本篇博客中,你将能学习到能够将相关信息关联起来的Python字典,以及一些对字典的操作。 在讲正事之前,不能忘了上一篇博客布置下来的作业: 答案如下: 输出结果: mack 你好,你注册的名字可用。tom 你好,你注册的名字可用。Mary 你好,你注册的名字已被占用,请重新注册。alice 你好,
阅读全文
posted @ 2019-01-26 19:00 Master跑跑
阅读(360)
评论(0)
推荐(0)
2019年1月24日
扎实基础深入篇(四):听说if语句很叼?
摘要: 编程时经常需要检查一系列条件,并根据此决定采取什么措施。 在python中,if语句让你能够检查程序的当前状态,并根据此采取相应的措施。 一个快速简单的示例 # 目标结果:打印出歌手GAI,猫和老鼠的Tom和外国美女rose。 persons=["jack","tom","jerry","gai",
阅读全文
posted @ 2019-01-24 01:19 Master跑跑
阅读(306)
评论(0)
推荐(0)
2019年1月18日
lxml类库的xpath的使用
摘要: 为什么要学习lxml类库和xpath呢? -lxml类库是一款高性能的Python HTML/XML解析器,我们可以利用XPath, 来快速地定位特定元素以及获取节点信息。 -XPath是一门在HTML/XML文档中查找信息的语言,可用来在HTML/XML文档中对元素和属性进行遍历。 XML和HTM
阅读全文
posted @ 2019-01-18 16:02 Master跑跑
阅读(709)
评论(0)
推荐(0)
2019年1月16日
json与re的再次复习
摘要: 在浏览本文之前,建议先温习一下以下博客的链接: https://www.cnblogs.com/Masterpaopao/p/10061575.html 一.json json,在爬虫中毫无疑问扮演着极为重要的角色: JSON是一种轻量级的数据交换格式,适用于进行数据交互的场景。 在python中,
阅读全文
posted @ 2019-01-16 23:41 Master跑跑
阅读(494)
评论(0)
推荐(0)
2019年1月12日
更多Requests的小技巧以及总结
摘要: 对于requests的爬虫库,我们已经学到了尾声。 我们在这儿可以挖掘出更多的requests的使用小技巧。 一.cookie对象与字典的转换 在爬取目标cookie的时候,我们可以将cookie信息进行简化处理。 现在做一个简单的代码验证看看,使用百度的cookies: import reques
阅读全文
posted @ 2019-01-12 23:54 Master跑跑
阅读(861)
评论(0)
推荐(0)
更全面的寻找post地址
摘要: 我们在今后的爬虫学习过程中,要爬许许多多的网站。 唯有掌握如何对不同网站寻找到正确的post地址,才是任务之重。 比如,我访问了一个别的网站,这儿用人人网做例子。 在人人网登陆界面,使用F12进入开发者模式,找到整个登陆界面的源码: 所以,我们可以看到关键的登录模块源码有一个关键的参数,这个参数是a
阅读全文
posted @ 2019-01-12 17:50 Master跑跑
阅读(1291)
评论(0)
推荐(0)
2019年1月10日
学会使用ip池和cookie池伪装
摘要: 在进入正题之前,我们先复习一个关于requests模块的相关知识点: requests中解决编码的三种方法: ①response.content 类型:bytes 解码类型:没有指定 如何修改编码方式:response.content.decode() ②response.content.decod
阅读全文
posted @ 2019-01-10 19:20 Master跑跑
阅读(2683)
评论(1)
推荐(0)
2019年1月9日
贴吧小爬虫之爬取源码
摘要: 在做爬虫工作之前,永远先做好笔记: 确定要爬取的url,爬取的具体内容是什么,用什么形式展现爬取到的内容。 博客的标题大家也看到了,爬取的是贴吧的源码,也就是说任何贴吧的源码都能爬。 不光第一页还要爬,第二页第三页……都要爬。 确定了上面的内容,那就可以开始代码的编写了。 我最近在玩穿越火线,那就爬
阅读全文
posted @ 2019-01-09 19:05 Master跑跑
阅读(734)
评论(0)
推荐(0)
1
2
3
4
下一页
公告