摘要: 一、B+树定义 B+树定义:关键字个数比孩子结点个数小1的树。 除此之外B+树还有以下的要求: 1. B+树包含2种类型的结点:内部结点(也称索引结点)和叶子结点。根结点本身即可以是内部结点,也可以是叶子结点。根结点的关键字个数最少可以只有1个。 2. B+树与B树最大的不同是内部结点不保存数据,只 阅读全文
posted @ 2019-03-29 23:43 冰魄秋雨 阅读(4649) 评论(1) 推荐(1) 编辑
摘要: 定义: 一棵二叉查找树是一棵二叉树,每个节点都含有一个Comparable的键(以及对应的值)。 每个节点的键都大于左子树中任意节点的键而小于右子树中任意节点的键。 树的术语: Name| Function | 路径 | 顺着连接点的边从一个节点走向另一个节点,所经过的节点的顺序排列就称为路径。 根 阅读全文
posted @ 2019-03-28 22:43 冰魄秋雨 阅读(4795) 评论(1) 推荐(2) 编辑
摘要: 网络上有很多文章都描述了算法的重要性,包括大公司面试,有大量的算法题。如果算法弱,那么极大可能与大公司错过。下面谈一谈为什么算法和数据结构重要,并且算法知识需要沉淀。 作为Java web开发人员,如果刚开始没有进入大公司,而进入小公司,又忙于项目,忙于学习各种框架,忽视了底层的学习,经过两三年之后 阅读全文
posted @ 2019-03-28 22:36 冰魄秋雨 阅读(1562) 评论(0) 推荐(0) 编辑
摘要: 持续整理关于算法的知识 2019-3-28 为什么要学习算法和数据结构 树目录: 二叉查找树 -- Java实现 B+树 -- Java实现 阅读全文
posted @ 2019-03-28 22:32 冰魄秋雨 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 对于现阶段到我来说,很难有大型到项目去做,都是来了一个需求,然后开始将这个项目实现,远远达不到那种一天几十万到访问量,需要并发特别高到项目。这个也许其他程序员也有这样到体会。毕竟能够说出来牛叉到项目没有多少,我们都是在堆需求,然后让项目在一定情况下稳定。 没有这种大项目让自己练手,就不学习了吗,这种 阅读全文
posted @ 2019-03-24 13:40 冰魄秋雨 阅读(359) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2018.cnblogs.com/blog/1464717/201903/1464717-20190317161703286-933601384.png) 阅读全文
posted @ 2019-03-17 16:17 冰魄秋雨 阅读(283) 评论(0) 推荐(0) 编辑
摘要: "一、存储格式行存储和列存储" "二、Hive文件存储格式" "三、创建语句和压缩" 一、存储格式行存储和列存储 1. 行存储可以理解为一条记录存储一行,通过条件能够查询一整行数据。 2. 列存储,以字段聚集存储,可以理解为相同的字段存储在一起。 二、Hive文件存储格式 1. TEXTFILE, 阅读全文
posted @ 2019-03-01 23:26 冰魄秋雨 阅读(7355) 评论(0) 推荐(1) 编辑
摘要: 一、metastore元数据存储对mysql的位置 DBS表:存储数据库信息(在hdfs上的存储路径) TBLS表:存储表信息的 COLUMNS_V2表:存储表字段 hive建立一张表的内在机制: 1. 在mysql中记录这张表的定义; 2. 在hdfs中创建目录; 3. 只要把数据文件都到目录下, 阅读全文
posted @ 2019-03-01 23:25 冰魄秋雨 阅读(1022) 评论(0) 推荐(0) 编辑
摘要: 在安装Hive时,一定要在该机器上添加了hadoop服务。 1. 下载并解压文件 2. 修改环境变量 编辑/etc/profile文件在其末尾添加如下内容: 3. 检测Hive是否安装成功,显示版本则表示安装成功 4. 修改配置文件,复制hive env.sh.template,为hive env. 阅读全文
posted @ 2019-02-28 00:06 冰魄秋雨 阅读(177) 评论(0) 推荐(0) 编辑
摘要: "一、Hive概念" "二、为什么要是用Hive" "三、Hive优缺点" "四、hive架构" 一、Hive概念 Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的需求而产生和发展的,是建立在Hadoop上的数据仓库基础架构。作为Hadoopd的一个数据仓库的工具, 阅读全文
posted @ 2019-02-28 00:02 冰魄秋雨 阅读(303) 评论(0) 推荐(0) 编辑