摘要: 1 Hive Hadoop在海量离线数据分析时遇到的问题: 开发调试一个复杂的MR程序,不适合要求快速得出结果的业务场景。 Hadoop是由Java开发的,MR天生对java支持最好,对其他语言的使用者不太友好。 需要对Hadoop底层具有一定的了解,并且要记忆大量的API,才能开发出一个优秀MR。 阅读全文
posted @ 2018-04-03 19:06 项羽齐 阅读(443) 评论(0) 推荐(0) 编辑
摘要: external 外部的;表面的;[药] 外用的;外国的;外面的 delimited v. 划定…的界限;限定(delimit的过去分词) adj. 划定界限的;被限定了的 terminated ['tɝmə,net] v. 终止;结束;终结(terminate的过去分词) adj. 终止的;有限的 阅读全文
posted @ 2018-04-03 18:16 项羽齐 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 为什么要使用Hadoop技术?为什么会诞生Hadoop技术? 透过现象看本质:所以应用程序集中4个方面: 分布式、高并发、高可用(互联网架构技术)、海量数据(lucene+solr/es数据存储-索引、数据检索) 海量数据存储PB、EB 海量数据分析Hadoop离线分析,Spark实时分析,Stor 阅读全文
posted @ 2018-04-03 12:29 项羽齐 阅读(186) 评论(0) 推荐(0) 编辑