摘要:之前有幸在MOOC学院抽中小象学院hadoop体验课。 这是小象学院hadoop2.X的笔记 由于平时对数据挖掘做的比较多,所以优先看Mahout方向视频。 Mahout有很好的扩展性与容错性(基于HDFS&MapReduce开发),实现了大部分常用的数据挖掘算法(聚类、分类、推荐算法)不过数据挖掘 阅读全文
posted @ 2015-08-28 23:52 尾巴AR 阅读(1406) 评论(0) 推荐(0) 编辑
摘要:之前有幸在MOOC学院抽中小象学院hadoop体验课。 这是小象学院hadoop2.X概述第八章的笔记 主要介绍HBase,一个分布式数据库的应用案例。 案例概况: 1)时间序列数据库(OpenTSDB) 用HBase储存时间序列数据,每时每刻都在解决,数据库为开源 2)HBase爬虫调度库 垂直搜 阅读全文
posted @ 2015-08-28 21:06 尾巴AR 阅读(924) 评论(0) 推荐(0) 编辑
摘要:之前有幸在MOOC学院抽中小象学院hadoop体验课。 这是小象学院hadoop2.X概述第一章的笔记 第一章主要讲的是hadoop基础知识。老师讲的还是比较全面简单的,起码作为一个非专业码农以及数据库管理人员,也能狗大致了解其特点。后面因为8月比较忙,就主要看案例那一部分了,应用及基础部分笔记基本 阅读全文
posted @ 2015-08-28 20:59 尾巴AR 阅读(234) 评论(0) 推荐(0) 编辑