hadoop - 随笔分类 - 七星6609

Spark3.0.1各种集群模式搭建及spark on yarn日志配置

摘要：对于spark前来围观的小伙伴应该都有所了解，也是现在比较流行的计算框架，基本上是有点规模的公司标配，所以如果有时间也可以补一下短板。简单来说Spark作为准实时大数据计算引擎，Spark的运行需要依赖资源调度和任务管理，Spark自带了standalone模式资源调度和任务管理工具，运行在其他资阅读全文

posted @ 2020-11-21 23:29 七星6609 阅读(4835) 评论(0) 推荐(0)

hadoop-2.10.0安装hive-2.3.6

摘要：公司建立数仓，hive是必不可少的，hive是建立在hadoop基础上的数据库，前面已经搭建起了hadoop高可用，要学习hive，先从搭建开始，下面梳理一下hive搭建过程 1.下载hive安装包，下载地址：https://hive.apache.org/downloads.html 找到自己h 阅读全文

posted @ 2020-02-07 23:40 七星6609 阅读(2561) 评论(0) 推荐(0)

centos7搭建hadoop2.10高可用(HA)

摘要：本篇介绍在centos7中搭建hadoop2.10高可用集群，首先准备6台机器：2台nn(namenode);4台dn(datanode)；3台jn(journalnode)；3台zk(zookeeper) IP hostname 进程 192.168.30.141 s141 nn1（namenod 阅读全文

posted @ 2020-02-02 23:31 七星6609 阅读(2136) 评论(0) 推荐(3)

centos7搭建hadoop2.10完全分布式

摘要：本篇介绍在centos7中大家hadoop2.10完全分布式，首先准备4台机器：1台nn(namenode);3台dn(datanode) IP hostname 进程 192.168.30.141 s141 nn（namenode） 192.168.30.142 s142 dn（datanode）阅读全文

posted @ 2020-01-29 22:56 七星6609 阅读(1798) 评论(0) 推荐(0)

centos7搭建hadoop2.10伪分布模式

摘要：1.准备一台Vmware虚拟机，添加hdfs用户及用户组，配置网络见 https://www.cnblogs.com/qixing/p/11396835.html 在root用户下添加hdfs用户，并设置密码：将hdfs用户添加到hdfs用户组中前面一个hdfs是组名，后面一个hdfs是用户名阅读全文

posted @ 2019-12-29 23:00 七星6609 阅读(2561) 评论(0) 推荐(0)

hadoop-3.1.2启动httpfs

摘要：最近有一个需求，要求使用httpfs读取数据，一开始看到httpfs这个词，第一感觉是不是多了个f，是不是https，后来百度一下，其实不然。 httpfs其实是使用http协议访问hdfs文件系统： HttpFS是一台提供REST HTTP网关的服务器，该网关支持所有HDFS文件系统操作（读取和写阅读全文

posted @ 2019-10-25 14:23 七星6609 阅读(3114) 评论(0) 推荐(0)

hbase读取快照数据-lzo压缩遇到的问题

摘要：1.读取hbase快照数据时报UnsatisfiedLinkError: no gplcompression in java.library.path错：在使用java 命令执行时可加上 -Djava.library.path=/opt/hadoop/lib/native，就没有此报错 2.解决完阅读全文

posted @ 2019-09-12 19:44 七星6609 阅读(1788) 评论(0) 推荐(0)

使用TableSnapshotInputFormat读取Hbase快照数据

摘要：根据快照名称读取hbase快照中的数据，在网上查了好多资料，很少有资料能够给出清晰的方案，根据自己的摸索终于实现，现将代码贴出，希望能给大家有所帮助：如果读取快照数据时，数据列簇使用的是lzo压缩的话，可能会遇到lzo解压缩问题，可以参照：hbase读取快照数据-lzo压缩遇到的问题阅读全文

posted @ 2019-09-04 20:53 七星6609 阅读(1734) 评论(0) 推荐(0)

Hadoop3.1.2 + Hbase2.2.0 设置lzo压缩算法

摘要：Hadoop3.1.2 + Hbase2.2.0 设置lzo压缩算法：写在前面，在配置hbase使用lzo算法时，在网上搜了很多文章，一般都是比较老的文章，一是版本低，二是一般都是使用hadoop-gpl-compression，hadoop-gpl-compression是一个比较老的依赖包，现阅读全文

posted @ 2019-09-03 16:46 七星6609 阅读(2145) 评论(0) 推荐(0)

Hadoop HA Hbase启动报UnknownHostException: mycluster

摘要：Hadoop HA 搭建hbase启动时只有HMaster起来，HRegionServer没有起来查看报错信息为：由于无法找到mycluster 解决方法：将hadoop/etc/中的 core-site.xml和hdfs-site.xml 复制到hbase的conf目录下，启动hbase就好阅读全文

posted @ 2019-08-31 19:42 七星6609 阅读(2598) 评论(0) 推荐(0)

hbase启动后HMaster几秒后死掉

摘要：通过 http://s128:16010 无法访问Hbase Web端查看master日志，有报错：解决方法：在hbase-site.xml中添加如下配置：阅读全文

posted @ 2019-08-30 17:47 七星6609 阅读(1470) 评论(0) 推荐(0)

hadoop批量命令脚本xrsync.sh传输脚本

摘要：1.xrsync.sh脚本需要安装rsync远程数据同步工具其中i代表服务器部分尾号名称，服务器名称为s202,s203,s204等使用时需要将xrsync.sh放到/usr/local/bin下，在任何目录中都可以使用例：将hbase-2.2.0同步到其它机器的 /opt/ 目录下阅读全文

posted @ 2019-08-29 19:36 七星6609 阅读(800) 评论(0) 推荐(0)

hadoop批量命令脚本xcall.sh及jps找不到命令解决

摘要：1.xcall.sh批量命令脚本：其中i为服务器命名部分序号，服务器命名为s128,s129,s130,s131共4台机器设置xcall.sh为可执行文件：主要是根据ssh在不同的机器上执行其后面的命令如：在每台机器上执行 jps -l 命令结果：如果想在任何地方都能使用xcall.s 阅读全文

posted @ 2019-08-29 17:17 七星6609 阅读(3820) 评论(0) 推荐(0)

七星6609

随笔分类 - hadoop

公告