• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
唯允
博客园    首页    新随笔    联系   管理    订阅  订阅
2017年8月18日
scrapy---反爬虫
摘要: 3)在settings中设置延迟 阅读全文
posted @ 2017-08-18 22:42 唯允 阅读(650) 评论(0) 推荐(0)
python---scrapy之MySQL同步存储
摘要: 假设我们已经能获取到item里定义的字段的数据,接下来就需要保存item的数据到mysql数据库. pipeline用来存储item中的数据,将爬取到的数据进行二次处理 首先,要做的准备的工作,安装MySQLdb,我安装的是Python-MySQL1.2.5模块. 自定义一个pipeline用mys 阅读全文
posted @ 2017-08-18 21:34 唯允 阅读(296) 评论(0) 推荐(0)
python连接数据库异步存储
摘要: 当同步写入数据库时,可能会发生下载速度很快,但是写入速度很慢的情况,因此我们采用异步存储写入数据库. 实现异步写入mysql数据库的思路: 1,将数据库的连接数据写入到settings文件中,供后面自定义的pipeline使用 2,自定义pipeline,使用Twisted框架实现异步 3,在set 阅读全文
posted @ 2017-08-18 20:50 唯允 阅读(2757) 评论(0) 推荐(1)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3