咖啡猫

导航

2015年3月14日 #

flume

摘要: 1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。3.agent里面包含3个核心组件:source、channel、sink。3.1 source组件是专用于收集日志的,可以处理各种类... 阅读全文

posted @ 2015-03-14 16:43 咖啡猫1292 阅读(223) 评论(0) 推荐(0) 编辑

sqoop

摘要: 把mysql中的表复制到hdfs/hive中,hdfs默认路径是/user/(username)中sqoop ##sqoop命令 import ##表示导入 --connect jdbc:mysql://ip:3306/sqoop ##告诉jdbc,连接mysql的url --userna... 阅读全文

posted @ 2015-03-14 10:42 咖啡猫1292 阅读(293) 评论(0) 推荐(0) 编辑