0

java中讲讲PrintWriter的用法,举例?

[学习笔记] 1.2 PrintWriter的用法 PrintWriter和PrintStream类似,只不过PrintStream是针对字节流的,而PrintWriter是针对字符流的。 例:1.2.1import java.io.*;public class TestMark_to_win { ...

海中一神兽 发布于 2019-08-21 17:21 评论(0)阅读(5)
0

Streaming-大数据的未来

分享一篇关于实时流式计算的经典文章,这篇文章名为Streaming 101: The world beyond batch 那么流计算如何超越批处理呢? 从这几个方面说明:实时流计算系统,数据处理模式,还有大数据的未来。 一、实时流式计算系统 实时流式计算的意义: 1、企业渴望获得更及时的数据,实时 ...

独孤风 发布于 2019-08-21 15:43 评论(0)阅读(137)
0

CDH6.1.1阿里云安装实践

概念介绍 CDH概览 CDH是Apache Hadoop和相关项目的最完整、最受测试和最流行的发行版。CDH提供Hadoop的核心元素 可伸缩存储和分布式计算 以及基于web的用户界面和重要的企业功能。CDH是Apache许可的开放源码,是唯一提供统一批处理、交互式SQL和交互式搜索以及基于角色的访 ...

JupiterMouse 发布于 2019-08-21 10:37 评论(0)阅读(11)
0

Kafka 2.3 Producer (0.9以后版本适用)

kafka0.9版本以后用java重新编写了producer,废除了原来scala编写的版本。 这里直接使用最新2.3版本,0.9以后的版本都适用。 注意引用的包为:org.apache.kafka.clients.producer 0.11.0以后增加了事务,事务producer的示例代码如下,需 ...

独孤风 发布于 2019-08-21 09:40 评论(0)阅读(10)
0

ElasticSearch实战系列一: ElasticSearch集群+Kinaba安装教程

前言 本文主要介绍的是ElasticSearch集群和kinaba的安装教程。 ElasticSearch介绍 ElasticSearch是一个基于Lucene的搜索服务器,其实就是对Lucene进行封装,提供了 REST API 的操作接口. ElasticSearch作为一个高度可拓展的开源全文 ...

虚无境 发布于 2019-08-20 20:07 评论(0)阅读(161)
0

python搞搞大数据之hbase——初探

使用python链接mysql读入一个表并把它再写到hbase 里去(九头蛇万岁) 先声明一下需要用的库: 俩!!: happybase (写这个的老哥真的happy) pymysql 建议使用anaconda进行相应版本匹配安装,在装happybase的时候,conda默认的channel是找不到 ...

lovely_lisk 发布于 2019-08-20 19:15 评论(0)阅读(21)
0

大数据安全利器ranger 编译安装

ranger大数据领域的一个集中式安全管理框架,它可以对诸如hdfs、hive、kafka、storm等组件进行细粒度的权限控制。本文将介绍部署过程 1. 部署准备 ranger: 进入apach官网下载 http://ranger.apache.org/download.html, 本次使用的是r ...

懂点IT的耿小厨 发布于 2019-08-20 18:35 评论(0)阅读(15)
0

java中Super到底是什么意思?必须举例说明!

[学习笔记] 3."超"关键字(super keyword) Super是一个参考(或说指针)指向他紧邻的父类(见下面的例子)。用super可以指向被隐藏的父类的同名成员。 3.1 super指向父类的成员 注意: 下例中:子类和父类都有i,我们一共有两个i,用super可以指向前一个父类的i。 例 ...

海中一神兽 发布于 2019-08-20 18:01 评论(0)阅读(6)
0

Python机器学习之数据探索可视化库yellowbrick-tutorial

背景介绍 从学sklearn时,除了算法的坎要过,还得学习matplotlib可视化,对我的实践应用而言,可视化更重要一些,然而matplotlib的易用性和美观性确实不敢恭维。陆续使用过plotly、seaborn,最终定格在了Bokeh,因为它可以与Flask完美的结合,数据看板的开发难度降低了 ...

yeayee 发布于 2019-08-20 16:49 评论(0)阅读(124)
0

Python机器学习之数据探索可视化库yellowbrick

# 背景介绍 从学sklearn时,除了算法的坎要过,还得学习matplotlib可视化,对我的实践应用而言,可视化更重要一些,然而matplotlib的易用性和美观性确实不敢恭维。陆续使用过plotly、seaborn,最终定格在了Bokeh,因为它可以与Flask完美的结合,数据看板的开发难度降 ...

yeayee 发布于 2019-08-20 16:19 评论(0)阅读(16)
0

Hadoop HDFS读写流程

读取: 1) 客户端调用 DistributedFileSystem 的 Open() 方法打开文件。2) DistributedFileSystem 用 RPC 连接到 NameNode,请求获取文件的数据块的信息;NameNode 返回文件的部分或者全部数据块列表;对于每个数据块,NameNod ...

Alcesttt 发布于 2019-08-19 21:01 评论(0)阅读(12)
1

Kafka JAVAAPI的使用之Producer(核心原理与示例)

通过https://www.cnblogs.com/tree1123/p/11243668.html 已经对consumer有了一定的了解。producer比consumer要简单一些。 一、旧版本producer 0.9.0.0版本以前,是由scala编写的旧版本producer。 入口类:kaf ...

独孤风 发布于 2019-08-19 16:47 评论(1)阅读(63)
0

CDH5.13快速体验

相对于易用性很差Apache Hadoop,其他商业版Hadoop的性能易用性都有更好的表现,如Cloudera、Hortonworks、MapR以及国产的星环,下面使用CDH(Cloudera Distribution Hadoop)快速体验下。首先从,从Cloudera官网下载部署好的虚拟机环境... ...

九命猫幺 发布于 2019-08-19 15:07 评论(0)阅读(13)
0

重学计算机组成原理(十一)- 门电路的"千里传音"

人用纸和笔来做运算,都是用十进制,直接用十进制和我们最熟悉的符号不是最简单么? 为什么计算机里我们最终要选择二进制呢? 来看看,计算机在硬件层面究竟是怎么表示二进制的,你就会明白,为什么计算机会选择二进制。 1 怎么做到“千里传书” 马拉松的故事相信你听说过。公元前490年,在雅典附近的马拉松海边, ...

JavaEdge 发布于 2019-08-18 22:34 评论(1)阅读(141)
1

重学计算机组成原理(十)- "烫烫烫"乱码的由来

程序 = 算法 + 数据结