03 2016 档案

摘要:一、导读 最近开始学习大数据分析,说到大数据分析,就必须提到Hadoop与Spark。要研究大数据分析,就必须安装这两个软件,特此记录一下安装过程。Hadoop使用V2版本,Hadoop有单机、伪分布式、分布式三种部署方案,这里使用分布式部署方案。而Spark有三种部署方案:Standalone, 阅读全文
posted @ 2016-03-29 15:41 苍穹2018 阅读(9116) 评论(1) 推荐(0)
摘要:一、HttpClient简介 HttpClient是一个客户端的HTTP通信实现库,它不是一个浏览器。关于HTTP协议,可以搜索相关的资料。它设计的目的是发送与接收HTTP报文。它不会执行嵌入在页面中JavaScript代码,所以当需要抓取通过AJAX技术获取实际内容的页面时需要使用WebClien 阅读全文
posted @ 2016-03-25 16:03 苍穹2018 阅读(8967) 评论(0) 推荐(1)
摘要:装饰者模式,顾名思义,即为原有的对象添加新的职责。装饰者模式在不修改底层代码给原有对象添加了新的功能,相比继承更加具有弹性。 装饰者模式特点: 装饰者模式如下图所示,Component类为共同的超类,ConcreteComponent为被装饰类,Decorator为抽象装饰类,ConcreteDec 阅读全文
posted @ 2016-03-18 17:05 苍穹2018 阅读(348) 评论(5) 推荐(0)
摘要:在开始将字符编码之前,必须了解几个概念。字符集(Character set))和编码(Encoding)就是理解字符编码的最重要的两个概念。字符集,顾名思义就是字符的集合。而字符编码就是将字符映射成一个数字,实质是用数字代表字符,从而让计算机能够理解。如下我们可以自己进行对字符集编码。另外的重要概念 阅读全文
posted @ 2016-03-18 10:14 苍穹2018 阅读(1969) 评论(0) 推荐(0)
摘要:HTTP是超文本传输协议(Hyper Text Transfer Protocol)的简称,设计之初是为了将HTML(超文本标记语言)文档从Web服务器传送到客户端的浏览器,但现在HTTP已经不局限与HTML的传输。HTTP是万维网(World Wide Web,www,也简称Web)的基础。同时H 阅读全文
posted @ 2016-03-13 23:29 苍穹2018 阅读(795) 评论(0) 推荐(0)