用过的baidu空间,太难用了,还是cnblogs好用
GZ.Jackey
学无止境,博采众长。

要做数据分析,领导让研究一下kettle。

先占个坑。

这里有个3.0的文档:

http://wenku.baidu.com/link?url=hvw_cOBIXLXSGvftkGhXQic3CLC75-0IILGrtB-AyuxIgaDarhmZjfBLhMRcn9gIUEQPJ1OtxTT9joLgVXyFJxFougqR4ZnTQTCZ8vlIcMW

 

今天开始搞了一下,下载之后运行了一个sample。

 下载安装很简单,到官网,直接download下了一个压缩吧, 解压之后就可以运行了。点spoon.sh, windows对应的时spoon.bat

前提是你要有java运行环境哦。

 

open目录的几个sample,先了解一些基本概念:

这个玩意儿到底是怎么运作的。

 

 

 

说白了,跟spark区别,不用自己写代码了,数据源可以从各种类型(cvs,txt,hadoop,mysql甚至excel中)导入。

然后,你就按照平台中已有的东东,拖拽一下,形成一个数据分析的逻辑,最终呢,还能生成图表(怎么生成,后面再研究)

上面的例子,Add Checksum, 为每条数据生成一个checksum数据(CRC32),然后Add sequence ,新增一个SequenceField字段,自增加,每次+1.

 

posted on 2015-04-07 17:15  GZ.Jackey  阅读(502)  评论(0编辑  收藏  举报