• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






大大黄小菜鸟

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2018年3月7日

python爬取糗事百科段子
摘要: 今天尝试了一下用python3加正则表达式爬取糗事百科的内容,让我们一起来看一下: 我们的目标是爬取用户名和所对应的段子内容 首先来观察网站,进入糗事百科首页。 (1)鼠标放在用户名上右键点“检查”: 通过观察可以得到用户名的正则表达式:userpart为'target="_blank" oncli 阅读全文
posted @ 2018-03-07 17:15 大大黄小菜鸟 阅读(190) 评论(0) 推荐(0)
 
python爬取京东手机图片
摘要: 关于爬取京东手机图片:之前一直使用python2加xpath来完成这个任务。本篇介绍如何使用python3加正则表达式来完成。使用的书籍《精通Python网络爬虫》中的案例代码不太适用了,在这里稍作改进。 首先来观察网站,进入京东首页,点击“手机/运营商/数码”中的手机,再点击“热门分类”中的“全部 阅读全文
posted @ 2018-03-07 11:22 大大黄小菜鸟 阅读(289) 评论(0) 推荐(0)