摘要:
1 Hive Hadoop在海量离线数据分析时遇到的问题: 开发调试一个复杂的MR程序,不适合要求快速得出结果的业务场景。 Hadoop是由Java开发的,MR天生对java支持最好,对其他语言的使用者不太友好。 需要对Hadoop底层具有一定的了解,并且要记忆大量的API,才能开发出一个优秀MR。 阅读全文
摘要:
external 外部的;表面的;[药] 外用的;外国的;外面的 delimited v. 划定…的界限;限定(delimit的过去分词) adj. 划定界限的;被限定了的 terminated ['tɝmə,net] v. 终止;结束;终结(terminate的过去分词) adj. 终止的;有限的 阅读全文
摘要:
为什么要使用Hadoop技术?为什么会诞生Hadoop技术? 透过现象看本质:所以应用程序集中4个方面: 分布式、高并发、高可用(互联网架构技术)、海量数据(lucene+solr/es数据存储-索引、数据检索) 海量数据存储PB、EB 海量数据分析Hadoop离线分析,Spark实时分析,Stor 阅读全文