12 2017 档案

摘要:一、大数据框架: Impala:hadoop的sql平台、支持hbase/hdfs、支持超大数据、支持多并发、sql支持好、对内存依赖比较严重。需要自己优化,并且有的语句超过内存会报错。 Spark:各种格式、各种计算(机器学习、图形计算)、可sql、可代码处理、支持scala/java/pytho 阅读全文
posted @ 2017-12-29 11:46 double_kill 阅读(4598) 评论(0) 推荐(1)
摘要:此篇说明对应的kettle版本是6.1,实际使用时7.x应该也是一样的。 一、 kettle开发流程(规范步骤,防止出错) (一) Kettle设置检查 如果不加一下配置项,数据转换后中文会出现乱码,很难处理。 本地连接资源库:配置项 defaultFetchSize 500 useCursorFe 阅读全文
posted @ 2017-12-28 12:34 double_kill 阅读(2755) 评论(0) 推荐(3)