摘要: R语言作为BI中ETL的工具,增删改 R语言提供了强大的R_package与各种数据库进行数据交互。 外加其强大数据变换清洗函数,为ETL提供一条方便快捷的道路。 RODBC ROracal RMysql Rmongodb http://mirrors.ustc.edu.cn/CRAN/web/pa 阅读全文
posted @ 2016-08-01 14:43 li_volleyball 阅读(910) 评论(0) 推荐(0) 编辑
摘要: Yarn 原理介绍 大纲: Hadoop 架构介绍 YARN 产生的背景 YARN 基础架构及原理 Hadoop的1.X架构的介绍 在1.x中的NameNodes只可能有一个,虽然可以通过SecondaryNameNode与NameNode进行数据同步备份,但是总会存在一定的时延,如果NameNod 阅读全文
posted @ 2016-08-01 07:26 li_volleyball 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 大数据实战(上) # MapReduce原理介绍 大纲: * Mapreduce介绍 * MapReduce2运行原理 * shuffle及排序 定义 * Mapreduce 最早是由google公司研究提出的一种免息nag大规模数据处理的并行计算模型和方法。是hadoop面向大数据并行处理的计算模 阅读全文
posted @ 2016-08-01 06:51 li_volleyball 阅读(308) 评论(0) 推荐(0) 编辑