09 2020 档案
摘要:1.hive的数据传输 Hive 中的 Null 在底层是以“\N”来存储,而 MySQL 中的 Null 在底层就是 Null,为了 保证数据两端的一致性。在导出数据时采用--input-null-string 和--input-null-non-string 两个参 数。导入数据时采用--nul
阅读全文
摘要:1.Channel的选择 memory channel 速度快,但可能会造成数据丢失 file channel 不会造成数据丢失,安全性高,但速度相对较慢 也可以选择kafka channel ,省去了sink 阶段,提高传输效率 2.FileChannel 优化 通过配置 dataDirs 指向多
阅读全文
摘要:1.Kafka 压测 用 Kafka 官方自带的脚本,对 Kafka 进行压测。Kafka 压测时,可以查看到哪个地方出 现了瓶颈(CPU,内存,网络 IO)。一般都是网络 IO 达到瓶颈。 kafka-consumer-perf-test.sh kafka-producer-perf-test.s
阅读全文
摘要:注意看后面的报错类型 1.文件不存在 -- 在对应服务器添加文件 2. 文件没有执行权限 -- chmod 777 xxx 3.文件格式不是unix -- 在notepad++ 将文件改成unix
阅读全文
摘要:1.上传tez.tar.gz至hdfs的/tez,随后在本地目录解压 2.在hive的conf目录下创建tez-site.xml 输入: <?xml version="1.0" encoding="UTF-8"?> <?xml-stylesheet type="text/xsl" href="con
阅读全文
摘要:1.首先确保sqoop路径正确且命令没有敲错。 2. 可执行命令必须全部是蓝色 如果某行开始出现白色,那里肯定是找不到的 解决:在蓝色命令末尾回车,重新打一遍命令,一般情况下会变成蓝色。 记住把白色的命令行删掉
阅读全文
摘要:1. 解压 2.vim config/server.properties 找到下列参数位置,并修改 #broker 的全局唯一编号,不能重复 broker.id=0 #kafka 运行日志存放的路径 log.dirs=/opt/module/kafka/logs #配置连接 Zookeeper 集群
阅读全文
摘要:1.解压 2.配置flume-env.sh文件: 将 flume/conf 下 的 flume-env.sh.template 文 件 修 改 为 flume-env.sh , 并 配 置 flume-env.sh 文件, 声明jdk路径 export JAVA_HOME=/opt/module/j
阅读全文

浙公网安备 33010602011771号