随笔分类 -  Hadoop

摘要:原文:《大型网站技术架构:核心原理与案例分析》,作者:李智慧 本书前面提到,由于传统的机械磁盘具有快速顺序读写、慢速随机读写的访问特性,这个特性对磁盘存储结构和算法的选择影响甚大。 为了改善数据访问特性,文件系统或数据库系统通常会对数据排序后存储,加快数据检索速度,这就需要保证数据在不断更新、插入、 阅读全文
posted @ 2017-11-07 22:59 奋斗终生 阅读(886) 评论(0) 推荐(1)
摘要:HBase概念学习(一)基本架构 HBase概念学习(二)JAVA API操作概览 HBase概念学习(三)Java API之CRUD(增查改删) HBase概念学习(四)Java API之扫描和过滤器 HBase概念学习(五)Java API之计数器 HBase概念学习(六)java API之HT 阅读全文
posted @ 2017-11-07 21:34 奋斗终生 阅读(409) 评论(0) 推荐(0)
摘要:dd by zhj: 最近的工作需要跟HBase打交道,所以花时间把《HBase权威指南》粗略看了一遍,感觉不过瘾,又从网上找了几篇经典文章。 下面这篇就是很经典的文章,对HBase的架构进行了比较详细的描述。我自己也进行了简单的总结,简单的说,HBase使用的是LSM( Log-Structure 阅读全文
posted @ 2017-11-06 00:03 奋斗终生 阅读(10185) 评论(0) 推荐(1)
摘要:add by zhj: 这篇文章写的通俗易懂,介绍了HBase最重要的几点特性。 英文原文:https://dzone.com/articles/understanding-hbase-and-bigtab 译文:https://lunatictwo.github.io/2017/09/25/Hba 阅读全文
posted @ 2017-11-05 23:31 奋斗终生 阅读(6936) 评论(0) 推荐(1)
摘要:add by zhj: 终于明白了什么是列式存储,什么是行式存储。这跟数据在存储介质中的存储结构有关, 列式存储是指,一列中的数据在存储介质中是连续存储的;行式存储是指一行中的数据在存储介质 中是连续存储的。简单的说,你可以把列式数据库认为是每一列都是一个表,这个表只有一列,如 果只在该列进行条件查 阅读全文
posted @ 2017-11-02 12:41 奋斗终生 阅读(16619) 评论(1) 推荐(5)