摘要:        
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。 HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。 它是Hadoop的生态系统,提供对数据的随机实时读/写访    阅读全文
        posted @ 2018-09-17 19:42
脆皮软心
阅读(254)
评论(0)
推荐(0)
            
        
        
摘要:        
1详细的读写流程 https://blog.csdn.net/qq_41544550/article/details/90412767 2. 读取: 写入: https://www.imooc.com/article/70527    阅读全文
        posted @ 2018-09-17 15:45
脆皮软心
阅读(154)
评论(0)
推荐(0)
            
        
        
摘要:        
1、列出Hadoop集群的Hadoop守护进程和相关的角色。 Namenode:它运行上Master节点(主节点)上,负责存储的文件和目录所有元数据。它管理文件的块信息,以及块在集群中分布的信息。(管理文件系统的命名空间和客户端对文件的访问操作) Datanode:它是一个存储实际数据的Slave节    阅读全文
        posted @ 2018-09-17 15:36
脆皮软心
阅读(277)
评论(0)
推荐(0)
            
        
        
摘要:        
a、InputFormat类。该类的作用是将输入的文件和数据分割成许多小的split文件, 并将split的每个行通过LineRecorderReader解析成<Key,Value>,通过job.setInputFromatClass()函数来设置, 默认的情况为类TextInputFormat,其    阅读全文
        posted @ 2018-09-17 13:51
脆皮软心
阅读(510)
评论(0)
推荐(0)
 
                    
                     
                    
                 
                    
                 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号