会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
AlamZ
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
11
12
13
14
15
16
17
18
19
···
29
下一页
2017年9月19日
js 滚动页面
摘要: $(‘html, body’).animate({ scrollTop: 0}, ‘slow’);
阅读全文
posted @ 2017-09-19 16:15 AlamZ
阅读(169)
评论(0)
推荐(0)
2017年8月25日
python 2个版本如何共存
摘要: 我们在安装Python3(>=3.3)时,Python的安装包实际上在系统中安装了一个启动器py.exe,默认放置在文件夹C:\Windows\下面。这个启动器允许我们指定使用Python2还是Python3来运行代码(当然前提是你已经成功安装了Python2和Python3)。 我们在安装Pyth
阅读全文
posted @ 2017-08-25 10:17 AlamZ
阅读(528)
评论(0)
推荐(1)
2017年8月22日
python 糗事百科实例
摘要: 爬取糗事百科段子,假设页面的URL是 http://www.qiushibaike.com/8hr/page/1 要求: 使用requests获取页面信息,用XPath / re 做数据提取 获取每个帖子里的用户头像链接、用户姓名、段子内容、点赞次数和评论次数 保存到 json 文件内 参考代码
阅读全文
posted @ 2017-08-22 22:24 AlamZ
阅读(182)
评论(0)
推荐(0)
python 多线程糗事百科案例
摘要: 案例要求参考上一个糗事百科单进程案例 Queue(队列对象) Queue是python中的标准库,可以直接import Queue引用;队列是线程间最常用的交换数据的形式 python下多线程的思考 对于资源,加锁是个重要的环节。因为python原生的list,dict等,都是not thread
阅读全文
posted @ 2017-08-22 22:24 AlamZ
阅读(386)
评论(0)
推荐(0)
python 数据提取之JSON与JsonPATH
摘要: JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不相上下。 Python 2.7中自带了JSON模块
阅读全文
posted @ 2017-08-22 22:13 AlamZ
阅读(12420)
评论(0)
推荐(0)
python 案例:使用BeautifuSoup4的爬虫
摘要: 我们以腾讯社招页面来做演示:http://hr.tencent.com/position.php?&start=10#a 使用BeautifuSoup4解析器,将招聘网页上的职位名称、职位类别、招聘人数、工作地点、发布时间,以及每个职位详情的点击链接存储出来。
阅读全文
posted @ 2017-08-22 22:06 AlamZ
阅读(394)
评论(0)
推荐(0)
python XML实例
摘要: 案例:使用XPath的爬虫 现在我们用XPath来做一个简单的爬虫,我们尝试爬取某个贴吧里的所有帖子,并且将该这个帖子里每个楼层发布的图片下载到本地。
阅读全文
posted @ 2017-08-22 08:42 AlamZ
阅读(251)
评论(0)
推荐(0)
python XML基础
摘要: 什么是XML XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似 HTML XML 的设计宗旨是传输数据,而非显示数据 XML 的标签需要我们自行定义。 XML 被设计为具有自我描述性。 XML 是 W3C 的推荐标准 W3School官
阅读全文
posted @ 2017-08-22 08:41 AlamZ
阅读(600)
评论(0)
推荐(0)
python 使用正则表达式的爬虫
摘要: 下面我们一起尝试一下爬取内涵段子网站: http://www.neihan8.com/article/list_5_1.html 打开之后,不难看到里面一个一个灰常有内涵的段子,当你进行翻页的时候,注意url地址的变化: 第一页url: http: //www.neihan8.com/article
阅读全文
posted @ 2017-08-22 08:40 AlamZ
阅读(337)
评论(0)
推荐(0)
2017年8月21日
python cookies 爬虫处理
摘要: Cookie Cookie 是指某些网站服务器为了辨别用户身份和进行Session跟踪,而储存在用户浏览器上的文本文件,Cookie可以保持登录信息到用户下次与服务器的会话。 Cookie原理 HTTP是无状态的面向连接的协议, 为了保持连接状态, 引入了Cookie机制 Cookie是http消息
阅读全文
posted @ 2017-08-21 22:20 AlamZ
阅读(948)
评论(0)
推荐(0)
上一页
1
···
11
12
13
14
15
16
17
18
19
···
29
下一页
公告