06 2016 档案

摘要:Flume中的HDFS Sink应该是非常常用的,其中的配置参数也比较多,在这里记录备忘一下。 channel type hdfs path 写入hdfs的路径,需要包含文件系统标识,比如:hdfs://namenode/flume/webdata/ 可以使用flume提供的日期及%{host}表达 阅读全文
posted @ 2016-06-30 14:43 暗痛 阅读(2609) 评论(0) 推荐(0)
摘要:装了一个多星期的hive on spark 遇到了许多坑。还是写一篇随笔,免得以后自己忘记了。同事也给我一样苦逼的人参考。 先说明一下,这里说的Hive on Spark是Hive跑在Spark上,用的是Spark执行引擎,而不是MapReduce,和Hive on Tez的道理一样。 先看官网的资 阅读全文
posted @ 2016-06-02 11:16 暗痛 阅读(19621) 评论(9) 推荐(2)