大数据 - 随笔分类 - 再也伤不起

java 连接Kafka报错java.nio.channels.ClosedChannelExcep

摘要：是由于Kafka server.properties中的advertised.host.name 属性没有配置。这个属性代表客户端访问Kafka的地址。如果没配置默认是主机名。阅读全文

posted @ 2018-01-18 17:39 再也伤不起阅读(2840) 评论(0) 推荐(0)

摘要：1：创建子节点的时候没有根节点 org.apache.zookeeper.KeeperException$NoNodeException: KeeperErrorCode = NoNode for ... 解决方案：创建父节点即可阅读全文

posted @ 2018-01-16 14:49 再也伤不起阅读(581) 评论(0) 推荐(0)

搭建zookeeper单机版以及简单命令的使用

摘要：1：创建目录 #数据目录dataDir=/opt/hadoop/zookeeper-3.3.5-cdh3u5/data#日志目录dataLogDir=/opt/hadoop/zookeeper-3.3.5-cdh3u5/logs 2：修改/opt/hadoop/zookeeper-3.3.5-cdh 阅读全文

posted @ 2018-01-15 11:01 再也伤不起阅读(251) 评论(0) 推荐(0)

Oozie与Coordinator调度讲解及系统时区配置与定时触发两种配置方式

摘要：1：修改本地linux时区查看时区 - 号代表西 + 号代表东北京时间是东八区设置时区的配置文件所在位置选择以亚洲的上海的时区为基址删除本地配置文件创建一个硬连接时区变成东八区了设置时间 2：设置oozie的时区在oozie-site.xml修改 oozie默认使用UTC 等同阅读全文

posted @ 2017-12-20 20:34 再也伤不起阅读(2762) 评论(0) 推荐(0)

oozie与sqoop的简单案例

摘要：1：拷贝模板 2：拷贝hive用的jar包方式一： 3：编辑job.properties 4.编辑workflow.xml 注意在这里如果要指定sqoop导出数据的格式要用双引号单引号没效果的而且只识别单字符不识别多字符这里的$$$ 导出的数据格式是 $ 5：上传到hdfs 6：启动阅读全文

posted @ 2017-12-19 11:50 再也伤不起阅读(1084) 评论(0) 推荐(0)

oozie与hive的简单案例

摘要：1.把oozie中自带的hive案例拷贝到测试目录 /opt/cdh-5.3.6/oozie-4.0.0-cdh5.3.6/oozie-apps下 2. 编辑 job.properties 3.拷贝hive的配置文件hive-site.xm 4.拷贝mysql的jar包 5.编辑workflow. 阅读全文

posted @ 2017-12-18 20:29 再也伤不起阅读(3923) 评论(1) 推荐(0)

oozie与mapreduce简单案例

摘要：准备工作拷贝原来的模板配置文件修改 workflow.xml ： job.properties ：把自己写的MapReduce的jar 放上去把改好的文件放入到hdfs 准备测试数据在hdfs创建输入目录并把刚创建的文件上传运行oozie 查看输出结果原文件统计后的文件 http: 阅读全文

posted @ 2017-12-15 16:35 再也伤不起阅读(538) 评论(0) 推荐(0)

oozie的简易安装

摘要：1. 解压 tar -zxvf oozie-4.0.0-cdh5.3.6.tar.gz 2.配置hadoop的集群，添加一个代理用户(给oozie运行mapreduce的权限) 在hadoop的core-site.xml配置文件中添加（要在hadoop启动之前添加） root 可以改成当前操作系阅读全文

posted @ 2017-12-14 17:40 再也伤不起阅读(2273) 评论(0) 推荐(0)

flume监控一个linux指定的一个文件夹的文件信息

摘要：1.编辑一个配置文件 flume-app.conf 拷贝至fulme的安装目录的conf下创建 spoollogs 文件夹准备一些数据测试 .log结尾的文件是否被扫描到执行命令查看文件 .log结尾的文件果然没有被读取到已经读取的文件也被加上后缀了在hdfs上自动以当天时间命名生成了阅读全文

posted @ 2017-12-14 16:28 再也伤不起阅读(4803) 评论(0) 推荐(0)

用java代码在创建hbase表时指定region的范围

摘要：1 package com.liveyc.common.utils; 2 3 import java.util.List; 4 5 import org.apache.hadoop.hbase.util.Bytes; 6 import com.liveyc.datarecover.utils.FileToHbase; 7 public class NewTable { 8 ... 阅读全文

posted @ 2017-12-12 16:15 再也伤不起阅读(2145) 评论(0) 推荐(0)

用java代码调用shell脚本执行sqoop将hive表中数据导出到mysql

摘要：1：创建shell脚本编辑文件特地将执行map的个数设置为变量测试可以java代码传参数同时也验证sqoop的 options 属性支持这种写法 2：创建 sqoop-import-mysql.txt 文件并编辑 hive数据存在hdfs位置 3：开始写java后台代码目前只支持 win 阅读全文

posted @ 2017-12-07 16:36 再也伤不起阅读(2151) 评论(3) 推荐(0)

用sqoop将mysql的数据导入到hive表中

摘要：1：先将mysql一张表的数据用sqoop导入到hdfs中准备一张表需求将 bbs_product 表中的前100条数据导导出来只要id brand_id和 name 这3个字段数据存在 hdfs 目录 /user/xuyou/sqoop/imp_bbs_product_sannpy_ 阅读全文

posted @ 2017-12-07 14:17 再也伤不起阅读(83756) 评论(0) 推荐(4)

使sqoop能够启用压缩的一些配置

摘要：在使用sqoop 将数据库表中数据导入至hdfs时配置启用压缩 hadoop 的命令检查本地库支持哪些 bin/hadoop checknative 需要配置native 要编译版本删除hadoop安装目录 lib 下的native文件夹将解压好的native文件拷贝到hadoop lib 阅读全文

posted @ 2017-12-07 11:39 再也伤不起阅读(1815) 评论(0) 推荐(0)

简易安装sqoop

摘要：版本：hive-0.13.1-cdh5.3.6.tar.gz 1：解压然后进到 conf 目录修改 sqoop-env.sh 2：如果使用mysql 数据库要将 mysql驱动包拷贝到 sqoop安装目录的lib文件夹下阅读全文

posted @ 2017-12-06 16:14 再也伤不起阅读(211) 评论(0) 推荐(0)

sqoop一些语法的使用

摘要：参数详细资料观看这个博客 http://shiyanjun.cn/archives/624.html Sqoop可以在HDFS/Hive和关系型数据库之间进行数据的导入导出，其中主要使用了import和export这两个工具。这两个工具非常强大，提供了很多选项帮助我们完成数据的迁移和同步。比如，下阅读全文

posted @ 2017-12-06 11:51 再也伤不起阅读(27593) 评论(3) 推荐(3)

搭建cdh单机版版本的hive所遇到的问题总汇

摘要：今天按照网上教程搭建了下 cdh 单机版的 hive 将相关配置记录下来以便以后方便翻阅版本 hive-0.13.1-cdh5.3.6.tar.gz 1. 直接解压然后将 mysql驱动包拷贝到 hive 的lib目录下 2. 进入 conf 配置目录下总共要修改3个文件其中hive-s 阅读全文

posted @ 2017-12-06 11:08 再也伤不起阅读(2024) 评论(0) 推荐(0)

通过删除hbase表中的region来达到删除表中数据

摘要：公司最近在搞一个hbase删除数据，由于在建表的时候是通过region来对每日的数据进行存储的，所以要求在删除的时候直接通过删除region的来删除数据（最好的方案是只删除region中的数据，不把region删掉，但是百度了很久没找到只删除region中数据的解决方法，实在遗憾，最终也就通过删除region来删除数据了这样的弊端是在hbase 中执行scan全表的时候会报错，找不到某某re... 阅读全文

posted @ 2017-12-05 14:34 再也伤不起阅读(4761) 评论(2) 推荐(0)

再也伤不起

随笔分类 - 大数据

公告