• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
蓝冰蝶
博客园    首页    新随笔    联系   管理    订阅  订阅
2019年2月26日
爬虫(五)requests模块2
摘要: 引入 有些时候,我们在使用爬虫程序去爬取一些用户相关信息的数据(爬取张三“人人网”个人主页数据)时,如果使用之前requests模块常规操作时,往往达不到我们想要的目的,例如: #!/usr/bin/env python # -*- coding:utf-8 -*- import requests 阅读全文
posted @ 2019-02-26 19:41 蓝冰蝶 阅读(547) 评论(0) 推荐(0)
爬虫(四)requests模块1
摘要: 引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。 今日概要 基于requests的get请求 基于requests模块的p 阅读全文
posted @ 2019-02-26 19:34 蓝冰蝶 阅读(173) 评论(0) 推荐(0)
爬虫(三)http和https协议
摘要: 一.HTTP协议 1.官方概念: HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方 阅读全文
posted @ 2019-02-26 19:26 蓝冰蝶 阅读(502) 评论(0) 推荐(0)
爬虫(二)Python网络爬虫相关基础概念、爬取get请求的页面数据
摘要: 什么是爬虫 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程。 哪些语言可以实现爬虫 1.php:可以实现爬虫。php被号称是全世界最优美的语言(当然是其自己号称的,就是王婆卖瓜的意思),但是php在实现爬虫中支持多线程和多进程方面做的不好。 2.java:可以实现爬虫。java 阅读全文
posted @ 2019-02-26 19:24 蓝冰蝶 阅读(371) 评论(0) 推荐(0)
爬虫(一)jupyter环境安装
摘要: 一、什么是Jupyter Notebook? 1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍 简而言之,Jupyter Notebook是以网页的形式打开,可以在 阅读全文
posted @ 2019-02-26 17:46 蓝冰蝶 阅读(193) 评论(0) 推荐(0)
vue(二)
摘要: 空 阅读全文
posted @ 2019-02-26 17:36 蓝冰蝶 阅读(144) 评论(0) 推荐(0)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3