最新评论
Re:Sqlserver2005 文件组的折腾 stewen 2012-05-26 16:15
重建聚集索引无异于重新划分了数据分区 。
Re:使用Ganglia对hadoop进行监控 勒色 2012-03-30 14:57
博主您好,我想请问一下,gmetad一定要安装在Namenode上吗?我希望单独部署一台服务器运行gmetad和Web Frontend,这样可以吗?
Re:hadoop1.0.0正式版发布了 旗舰 2012-03-05 16:04
我顶一下,现在还没接触这个
Re:超级维度表处理(亿行数据级别) 旗舰 2012-03-05 16:01
你的经验越来越丰富了,都超过了你的年龄,我怎么没遇到过你那样的项目,我顶一下
Re:背包问题趣事 超级菜鸟 2011-12-23 15:43
这个解法是明显的递归,也就是你说的遍历
Re:把BI团队从按用户需求开发的怪圈中解放出来 nfffff 2011-11-28 16:40
方法就是教会一部分客户配置cognos8?
我总结的对不?呵呵。
Re:一步一步学习sqlserver BI--ETL设计 sun0201 2011-11-21 13:16
关注!
Re:SSIS包的调用方式 sun0201 2011-11-21 13:14
mark
Re:sqlserver2005的KPI展示控件开发详解 Engineer 2011-11-05 19:44
看到这些东西,我感觉我就像个白痴。
Re:把BI团队从按用户需求开发的怪圈中解放出来 李梦蛟 2011-11-03 13:48
当数据驱动在公司成为一种认识的时候,其实把大家召集起来开会什么的,还是比较容易的,因为他们很多时候要数据,有求于你。
Re:把BI团队从按用户需求开发的怪圈中解放出来 李梦蛟 2011-11-03 13:47
@tippoint
通常来说,让用户部门来参与开发做报表确实很难,但是这里有个前提是,报表太多,BI部门开发不过来,用户等不及的时候,他们很想快速解决,这种情况下,去培训他们,他们就很乐意接受了,这里我们也只是说的让他们做简单的报表而已。
Re:把BI团队从按用户需求开发的怪圈中解放出来 tippoint 2011-10-31 10:10
你们部门真牛,可以调动公司相关部门的人协助一起开发bi系统,可是现实中技术部门只是一个支持部门,很难把使用部门全部召集起来吧。
Re:关于kettle使用crontab+kitchen部署的一点波折 bnuyangzhen 2011-10-27 09:34
@李梦蛟
jdbc目录下的确有hive的驱动,但是没有组件···
Re:关于kettle使用crontab+kitchen部署的一点波折 李梦蛟 2011-10-26 16:55
以前我是从4.1企业版里面提取的,你去kettle的根目录下的/libext/JDBC下面去检查下有没有hive的jdbc驱动
Re:关于kettle使用crontab+kitchen部署的一点波折 bnuyangzhen 2011-10-26 16:30
@李梦蛟
非常感谢您的回复。 我用的是kettle 4.2.0 企业版的, 在表输入里面不能找到hive选项,h开头的只有H2和hypersonic两项。您用的是哪一个版本的呢?
Re:关于kettle使用crontab+kitchen部署的一点波折 李梦蛟 2011-10-26 13:30
@bnuyangzhen
在企业版的kettle里面是有hive组件的,貌似最新版的社区版kettle也有了吧,我是根据企业版里面的反编译了一下,自己组织了一下代码,就能用了。
位置是在table input组件选择hive的连接就可以了。如果你做不到,还有一种简单的方法可以从hive获取数据,通过运行hive命令把查询的数据重定向到文件系统,然后从文件系统读取文本的方式读到kettle里面来
Re:关于kettle使用crontab+kitchen部署的一点波折 bnuyangzhen 2011-10-26 08:35
@李梦蛟
非常感谢, 我再kettle的论坛上也看到了说jar包得版本要一致, 的确是这样换掉就能连接上了。 还有我想问一下, 如何跟hive连接的, kettle里面没有hive的控件。kettle如何自己编写java程序? 谢谢·
Re:关于拥有海量数据的电子商务网站的CRM系统建设底层存储实现的一点随想 李梦蛟 2011-10-24 17:04
根据我最新的了解,这篇文章的思路其实是行不太通的哈,因为hbase中的row如果很大的话,性能会变得非常低下
Re:超级维度表处理(亿行数据级别) 李梦蛟 2011-10-24 17:02
kettle
Re:关于kettle使用crontab+kitchen部署的一点波折 李梦蛟 2011-10-24 17:01
@bnuyangzhen
我这里可以连上,建议从以下几个方面查原因:1.文件路径大小写;2.hadoop版本和kettle中hadoop的jar的版本是否匹配;
3.是否存在网络限制问题(在ETL的机器上用浏览器能够访问hdfs中的文件吗)
