摘要: 爬虫的分类 1.通用爬虫:通用爬虫是搜索引擎(Baidu、Google、Yahoo等)“抓取系统”的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 简单来讲就是尽可能的;把互联网上的所有的网页下载下来,放到本地服务器里形成备分,在对这些网页做相关处理(提取关键字、 阅读全文
posted @ 2019-05-27 21:33 small_caier 阅读(154) 评论(0) 推荐(0)
摘要: 一、什么是Jupyter Notebook? 1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍 简而言之,Jupyter Notebook是以网页的形式打开,可以在 阅读全文
posted @ 2019-05-27 21:31 small_caier 阅读(123) 评论(0) 推荐(0)
摘要: 一.HTTP协议 1.概念: Http协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。 之间形成的特殊行话(黑话:(土匪)天王盖地虎,(我)宝塔镇河妖)称为协议。 2.Http工作原理: Http协议工作于客户端-服务端架构上。浏览器作为Http客户 阅读全文
posted @ 2019-05-27 21:26 small_caier 阅读(258) 评论(0) 推荐(0)