2017年3月22日
摘要: 在爬取糗事百科的段子后,我又在知乎上找了一个爬取百度贴吧帖子的实例,为了巩固提升已掌握的爬虫知识,于是我打算自己也做一个。 实现目标:1,爬取楼主所发的帖子 2,显示所爬去的楼层以及帖子题目 3,将爬取的内容写入到文件里,并实现动态显示爬取进度 实现工具:python的requests库和正则表达式 阅读全文
posted @ 2017-03-22 23:02 sea_123 阅读(6138) 评论(0) 推荐(1) 编辑
  2017年3月19日
摘要: 初次学习爬虫技术,在知乎上看了如何爬去糗事百科的段子,于是打算自己也做一个。 实现目标:1,爬取到糗事百科的段子 2,实现每次爬去一个段子,每按一次回车爬取到下一页 技术实现:基于python的实现,利用Requests库,re库,bs4库的BeautifulSoup方法来实现的 主要内容:首先我们 阅读全文
posted @ 2017-03-19 23:45 sea_123 阅读(366) 评论(0) 推荐(0) 编辑