上一页 1 2 3 4 5 6 7 8 ··· 11 下一页
摘要: 本系列博客是LeetCode的刷题笔记。给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。注意不能在买入股票前卖出股票。 阅读全文
posted @ 2019-07-01 14:53 gzshan 阅读(4655) 评论(0) 推荐(0)
摘要: HBase是Hadoop中的一个重要组件,自然也是基于Java语言开发的,因此HBase有很好的Java接口供程序员调用,通过一个例子来演示java如何使用HBase数据库。除了Java接口之外,HBase作为Hadoop的“三驾马车”之一,与MapReduce也有很好的衔接,可以作为MapReduce 作业的源/输出。 阅读全文
posted @ 2019-06-30 15:37 gzshan 阅读(1219) 评论(0) 推荐(1)
摘要: 通过前面的介绍,对HBase数据模型,运行机制等理论基本了解,接下来从实践的角度介绍HBase的安装以及其各种接口的使用方法。通过一个简单的示例演示Hbase数据库的基本操作。 阅读全文
posted @ 2019-06-28 15:38 gzshan 阅读(1368) 评论(0) 推荐(0)
摘要: HBase作为一种NoSQL的数据库,和传统的类似于mysql这样的关系型数据库是有很大区别的,本文来对他们做一个对比分析,以便更加深入的了解HBase。它们的区别体现在六个方面:数据类型、数据操作、存储模式、数据索引、数据维护、可伸缩性。 阅读全文
posted @ 2019-06-27 13:11 gzshan 阅读(1071) 评论(0) 推荐(0)
摘要: 整个Hadoop生态中大量使用了master-slave的主从式架构,如同HDFS中的namenode和datanode,MapReduce中的JobTracker和TaskTracker,YARN中的资源管理器和节点管理器,Zookeeper中的leader和follower。我们将看到HBase同样是基于这种主从式的一种运行机制。一个master节点协调管理多个RegionServer从属机。 阅读全文
posted @ 2019-06-26 09:56 gzshan 阅读(2361) 评论(0) 推荐(0)
摘要: HBase是一个基于HDFS开发的面向列的分布式数据库,它主要用于超大规模的数据集存储。本文介绍了HBase的基本概念,基本的数据模型及其基础知识,实际上Hbase还是比较容易理解的,HBase表和我们熟知的RDBMS的表很像,不同之处在于:行按行键排序,列划分为列族,单元格有版本号,没有数据类型,需要特别注意区域的概念。 阅读全文
posted @ 2019-06-25 14:19 gzshan 阅读(14909) 评论(0) 推荐(1)
摘要: 本系列博客为LeetCode的刷题笔记。判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。方法:反转后一半与前一半进行比较。 阅读全文
posted @ 2019-06-23 12:40 gzshan 阅读(210) 评论(0) 推荐(0)
摘要: 本系列博客为LeetCode的刷题笔记。给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。从本题开始,由于感觉顺序刷题难度较大,转变一下刷题顺序,先刷easy难度的题。 阅读全文
posted @ 2019-06-23 00:15 gzshan 阅读(266) 评论(0) 推荐(0)
摘要: 这几篇文章相当于《Hadoop权威指南》的读书笔记。Hadoop是用java语言实现的,因此HDFS有很好的java接口用以编程,重点就是Hadoop的FileSystem类,它是所有文件系统的抽象类,HDFS实例(DistributedFileSystem)也是基于它实现的。本部分主要介绍如何通过使用HDFS的java接口来编写程序。 阅读全文
posted @ 2019-06-21 14:37 gzshan 阅读(1555) 评论(0) 推荐(0)
摘要: 我们对HDFS的理论技术基础已经基本了解,既然它是一个文件系统,类似于我们日常使用的本地文件系统,我们就可以通过命令行的一些命令来与其进行交互,接下来主要介绍其命令行接口。其主要的操作无非就是:读取文件、新建目录、移动文件、删除数据、列出目录等等。 阅读全文
posted @ 2019-06-20 18:37 gzshan 阅读(1106) 评论(0) 推荐(0)
摘要: 作为一个文件系统,文件的读和写是最基本的需求,这一部分我们来了解客户端是如何与HDFS进行交互的,也就是客户端与HDFS,以及构成HDFS的两类节点(namenode和datanode)之间的数据流是怎样的。重点是掌握HDFS的文件读写流程,体会这种机制对整个分布式系统性能提升带来的好处。 阅读全文
posted @ 2019-06-06 16:26 gzshan 阅读(1992) 评论(0) 推荐(0)
摘要: HDFS(Hadoop Distributed File System)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般,是最基础的一部分,因为它涉及到数据存储,MapReduce等计算模型都要依赖于存储在HDFS中的数据。HDFS是一个分布式文件系统,以流式数据访问模式存储超大文件,将数据分块存储到一个商业硬件集群内的不同机器上。 阅读全文
posted @ 2019-06-05 17:46 gzshan 阅读(17470) 评论(0) 推荐(0)
摘要: 通过前面关于Redis五种数据类型、相关高级特性以及一些简单示例的使用,对Redis的使用和主要的用途应该有所掌握,但是还有一些原理性的问题我们在本部分做一个探讨,主要包括Redis和mysql的对比,redis高性能的原因,基本实现原理,内存淘汰策略和回收机制。 阅读全文
posted @ 2019-06-04 17:58 gzshan 阅读(768) 评论(0) 推荐(0)
摘要: Redis的安装比较简单,仍然和大多数的Apache开源软件一样,只需要下载,解压,配置环境变量即可。Redis作为一个key-Value的开源数据库,我们在简介中提到它提供了多种语言的API。这里我们通过java和python给出使用其API的简单示例。 阅读全文
posted @ 2019-06-04 15:49 gzshan 阅读(279) 评论(0) 推荐(0)
摘要: 前面我们介绍了Redis的五种基本的数据类型,灵活运用这五种数据类型是使用Redis的基础,除此之外,Redis还有一些特性,掌握这些特性能对Redis有进一步的了解,比如Redis事务、Redis分区、Redis的数据备份、Redis 的发布和订阅等等,本文进一步对这些相关的特性进行介绍。 阅读全文
posted @ 2019-06-04 15:29 gzshan 阅读(378) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 11 下一页