12 2017 档案

大数据常用框架特点

摘要：一、大数据框架： Impala：hadoop的sql平台、支持hbase/hdfs、支持超大数据、支持多并发、sql支持好、对内存依赖比较严重。需要自己优化，并且有的语句超过内存会报错。 Spark：各种格式、各种计算（机器学习、图形计算）、可sql、可代码处理、支持scala/java/pytho 阅读全文

posted @ 2017-12-29 11:46 double_kill 阅读(4598) 评论(0) 推荐(1)

一、 kettle开发、上线常见问题以及防错规范步骤

摘要：此篇说明对应的kettle版本是6.1，实际使用时7.x应该也是一样的。一、 kettle开发流程（规范步骤，防止出错） (一) Kettle设置检查如果不加一下配置项，数据转换后中文会出现乱码，很难处理。本地连接资源库：配置项 defaultFetchSize 500 useCursorFe 阅读全文

posted @ 2017-12-28 12:34 double_kill 阅读(2755) 评论(0) 推荐(3)

double_kill

12 2017 档案

公告