08 2019 档案
摘要:这次博客记录下MapReduce模型的编程和相关学习。 MapReduce的最主要的特点就是移动计算,而不是数据跟着计算走,这个在分布式系统中十分有效,最大的好处就是节约数据移动的开销,用很小的数据流量来完成对数据的分析和计算。 MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象
阅读全文
摘要:本次博客主要记录HBASE的eclipse api编程访问,与shell方式操作HBASE数据库不同,用java代码形式运行可以封装打包运行,不过需要进行一些配置。 首先启动Hadoop和HBASE(因为之前设置好了虚拟机所以可以在Windows上使用eclipse,只需要启动就可以)。 然后新建个
阅读全文
摘要:这次来安装HBase到虚拟机上边。 把HBase1.4.0上传到usr/local/位置并解压完毕。 配置好环境变量。 改好权限后就可以查看数据库版本以检查安装是否完成。 之后就是单机模式的配置。 修改/usr/local/hbase/conf/hbase-env.sh,添加以下—— 修改/usr/
阅读全文
摘要:本周主要是熟悉HDFS的操作。 在虚拟机安装好Hadoop后,我需要先熟悉下其自带的HDFS文件系统以及MapReduce的一系列操作,为接下来HBase的学习做好铺垫。因为HBase的文件存储系统是HDFS、数据处理方式是MapReduce,在很多操作上面有很多需要操作HDFS来进行的,所以我需要
阅读全文

浙公网安备 33010602011771号