迷糊妖

永不停止追寻前进的脚步
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2013年10月17日

摘要: 1、使用获取文件名步骤,获取本地一个目录下的所有 jpg 图片文件。通过java script 步骤,读取这些二进制文件的内容,放到一个字段里, 再通过表输出步骤把文件名字段和文件内容字段写入到数据库里。代码:var file = new java.io.File(filename);var fileInputStream = new java.io.FileInputStream(file);var Content = org.pentaho.di.core.Const.createByteArray(file.length());fileInputStream.read(Content, 阅读全文

posted @ 2013-10-17 16:09 迷糊妖 阅读(8881) 评论(0) 推荐(0) 编辑

摘要: 1、Argument, Parameter, Variable 的区别 a、Argument作为位置参数不能复用,而其他2个可以根据名称重复使用 b、 Argument, Parameter作用域局限于当前转换,而Variable可以根据需要设置为系统级等等2、设置变量的方法 a、通过Set Variables步骤 b、在Modified Java Script Value使用setVariable(var,var,var)函数 c、在kettle.properties中设置 d、通过java 命令行的 -D 参数3、变量的作用域: a、Valid in the Java Vir... 阅读全文

posted @ 2013-10-17 16:05 迷糊妖 阅读(1859) 评论(0) 推荐(0) 编辑

摘要: 1、将文件1、文件2组合成xml文件文件1f1;f2;f31;张三;242;李四;25文件2张三;语文;78张三;数学;88xml文件 78 882、3、结果 78 88 阅读全文

posted @ 2013-10-17 16:01 迷糊妖 阅读(1805) 评论(0) 推荐(0) 编辑

摘要: 阅读全文

posted @ 2013-10-17 15:42 迷糊妖 阅读(3079) 评论(0) 推荐(1) 编辑

摘要: 表1设置表2 阅读全文

posted @ 2013-10-17 15:37 迷糊妖 阅读(953) 评论(0) 推荐(0) 编辑

摘要: 1、Get Data from XMLxml文件内容:菜||焦溜丸子||2013-03-28/image/0/0001-thumb.jpg环境||门面||2013-03-28/image/0/0002-thumb.jpg环境||门面||2013-03-28/image/0/0003-thumb.jpg设置及结果:2、Jason Input{"store": { "book": [ { "category": "reference", "author": "Nigel Rees" 阅读全文

posted @ 2013-10-17 15:29 迷糊妖 阅读(6270) 评论(0) 推荐(0) 编辑

2013年7月10日

摘要: 1、首先使用非聚集索引SET STATISTICS IO ON SET STATISTICS TIME ON SELECT MemberId , MAX(AddDT) AS RecentSucDT ,--最近成功订单日期 COUNT(1) AS SucOrderNum ,--成功订单数 SUM(VExpd) AS SucAmount ,--成功订单金额 DATEDIFF(DD, MIN(AddDT), MAX(AddDT)) AS Tenure ,--活跃天数 DATEDIFF(DD, MAX(AddDT), GETDAT... 阅读全文

posted @ 2013-07-10 14:18 迷糊妖 阅读(512) 评论(0) 推荐(0) 编辑

2013年4月1日

摘要: 方法一:cats函数data sas04;informat date yymmdd10.;input date ;*方法一:cats函数 ;y = YEAR(date);m = MONTH(date);d = DAY(date);new = cats(of y,'年',m,'月',d,'日');drop date y m d ;datalines;2013-03-17 0 7922013-03-17 15 7922013-03-17 0 123362013-03-17 0 123362013-03-17 15 7922013-03-17 0 12 阅读全文

posted @ 2013-04-01 14:56 迷糊妖 阅读(2569) 评论(0) 推荐(0) 编辑

摘要: data work.sas0002;*infile 'D:\train\SAS\homework\ip_pv_log';/*input a1 $ month $ day a2 $ a3 $ year #2 ip #3 pv ;dd=cats(OF day,month,year);date=input(dd,date9.);*/input date anydtdte28. #2 ip #3 pv;datalines;Sun Jul 8 01:42:36 HKT 20124015153Sun Jul 8 23:59:02 HKT 2012192291938;proc print d 阅读全文

posted @ 2013-04-01 11:14 迷糊妖 阅读(403) 评论(0) 推荐(0) 编辑

2013年3月29日

摘要: Hive安装环境:CentOS 6.2 X64Hadoop 0.20.2Hive 0.10.01、下载hive 0.10.02、解压hive并放到/home/grid下,修改目录名为hive3、配置hive-config.sh4、复制hive-site.xml5、安装mysql6、启动mysql服务7、运行mysql8、创建metastore数据库9、创建mysql用户10、到MySQL官网上下载MySQL jdbcdrivers数据库连接驱动器。下载后,解压mysql-connector-java-5.1.22-bin.jar到 hive/lib目录11、 修改hive-site.xml12 阅读全文

posted @ 2013-03-29 13:55 迷糊妖 阅读(309) 评论(0) 推荐(0) 编辑