摘要:
flume可以将数据从kafka中获取到再放到hdfs中,我在想是不是可以跳过kafka这一步。 这样的命令去运行flume name是配置文件里面的名称,但是执行结果在hdfs中找不到,目前不知道如何解决。 阅读全文
posted @ 2022-03-11 22:58
不咬牙
阅读(17)
评论(0)
推荐(0)
摘要:
今天继续学习大数据流程, flume的配置有了些了解 .conf 文件中的参数是这样的 source采集日志数据,将采集到的日志数据传输给channel channel一个队列,存储source传递过来的数据 sink从channel中获取数据,将数据输出到目标位置(HDFS、HBase、Sourc 阅读全文
posted @ 2022-03-11 22:58
不咬牙
阅读(26)
评论(0)
推荐(0)
摘要:
今天学了flume收集数据并给到kafka但是 我思索了一遍流程把 在哪里联系本地数据忘了 有点脱节了。 阅读全文
posted @ 2022-03-09 22:42
不咬牙
阅读(24)
评论(0)
推荐(0)
摘要:
kafka在启动测试小工具的时候,需要注意的是 如果安装的zookeeper是集群的话 ,要将整个集群数量至少打开两台机器,不然会报错说该地址下的zookeeper连接不上 zookeeper启动命令 bin/zkServer.sh start 在每台机器目录下启动。 强制退出的命令是ctrl+c 阅读全文
posted @ 2022-03-07 20:31
不咬牙
阅读(33)
评论(0)
推荐(0)
摘要:
发现了python脚本是在linux中输入,在linux中创建.py 文件,然后在spark中提交,但是提交之后,没有创建出相应的表,我目前没有解决。 阅读全文
posted @ 2022-03-03 22:23
不咬牙
阅读(18)
评论(0)
推荐(0)
摘要:
不知道经过什么配置,我的hive启动命令是 bin/hive 不需要其他的操作。 阅读全文
posted @ 2022-03-02 20:05
不咬牙
阅读(9)
评论(0)
推荐(0)
摘要:
今天做了课堂测试,对之前的hive内容遗忘了很多,一点点复习了起来。 阅读全文
posted @ 2022-03-01 21:46
不咬牙
阅读(111)
评论(0)
推荐(0)
浙公网安备 33010602011771号