随笔分类 - 大数据
摘要:Transformation 主要做的是就是将一个已有的RDD生成另外一个RDD。Transformation具有lazy特性(延迟加载)。Transformation算子的代码不会真正被执行。只有当我们的程序里面遇到一个action算子的时候,代码才会真正的被执行。这种设计让Spark更加有效率地
阅读全文
摘要:上周遇到了将数据从oracle导入到impala的问题,这个项目耽误了我近一周的时间,虽然是种种原因导致的,但是还是做个总结。 需求首先是跑数据,跑数据这个就不叙述,用的是公司的平台。 讲讲耽误我最久的事吧 数据的导入导出。 将数据从oracle导出 PLSQL直接导出 我这边连接公司的orcle数
阅读全文

浙公网安备 33010602011771号