数据结构:八大数据结构分类

前言:可能不是科班出生的缘故吧😄,一直没有对数据结构有个全局的把握(应该说是分不清数据结构的概念,就例如数组我就一直不认为它和数据结构有关系😅,是不是很low),终是零零碎碎的看一些东西。今天看到这个博客好像有一种豁然开朗的感觉,本文99%部分都是摘抄原文,少加了一些自己的理解。我把原文摘抄下来的缘故主要是想1)加深自己数据结构的认识,2)以后想补充该文章的认识。因为我感觉它很重要,然而的确是很有用。

原文地址:https://blog.csdn.net/yeyazhishang/article/details/82353846#4%E9%93%BE%E8%A1%A8

目录:

  1. 数组
  2. 队列
  3. 链表
  4. 散列表

一: 数组

      数组是以内存中连续存储多个元素的结构,在内存中的分配也是连续的,数组中的元素通过数组下标进行访问,数组下标从0开始。例如下面这段代码就是将数组的第一个元素赋值为 1。

  

优点: 
1、按照索引查询元素速度快 
2、按照索引遍历数组方便

缺点: 
1、数组的大小固定后就无法扩容了 
2、数组只能存储一种类型的数据 
3、添加,删除的操作慢,因为要移动其他的元素。

适用场景: 
频繁查询,对存储空间要求不大,很少增加和删除的情况。


 

二: 栈

       栈是一种特殊的线性表,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。 栈的特点是:先进后出,或者说是后进先出,从栈顶放入元素的操作叫入栈,取出元素叫出栈。 

栈的结构就像一个集装箱,越先放进去的东西越晚才能拿出来,所以,栈常应用于实现递归功能方面的场景,例如斐波那契数列。

三: 队列

队列与栈一样,也是一种线性表,不同的是,队列可以在一端添加元素,在另一端取出元素,也就是:先进先出。从一端放入元素的操作称为入队,取出元素为出队,示例图如下: 

使用场景:因为队列先进先出的特点,在多线程阻塞队列管理中非常适用。


 

四: 链表

 链表是物理存储单元上非连续的、非顺序的存储结构,数据元素的逻辑顺序是通过链表的指针地址实现,每个元素包含两个结点,一个是存储元素的数据域 (内存空间),另一个是指向下一个结点地址的指针域。根据指针的指向,链表能形成不同的结构,例如单链表,双向链表,循环链表等。 

链表的优点:
链表是很常用的一种数据结构,不需要初始化容量,可以任意加减元素;
添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可,所以添加,删除很快;

缺点:
因为含有大量的指针域,占用空间较大;
查找元素需要遍历链表来查找,非常耗时。

适用场景:
数据量较小,需要频繁增加,删除操作的场景


 

五:树

树是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:

普通数

1) 每个节点有零个或多个子节点;
2)  没有父节点的节点称为根节点;
3)  每一个非根节点有且只有一个父节点;
4)  除了根节点外,每个子节点可以分为多个不相交的子树;

二叉树的特点如下(在普通树的基础上)

1)左子树上的节点均小于或等于其根节点;

2)右子树上的节点均大于或等于其根节点;

3)左右子树也分别为二叉树;

红黑树的特点:如下5点(在二叉树的基础上)

1) 节点是红色或黑色;
2) 根节点是黑色;
3) 每个叶子(即空节点)节点都是黑色;
4) 每个红色节点的子节点都是黑色;

5)任意节点到每个叶子节点所经历的黑色节点数量都是相同的。

在日常的应用中,我们讨论和用的更多的是树的其中一种结构,就是二叉树。

二叉树是树的特殊一种,具有如下特点:

1、每个结点最多有两颗子树,结点的度最大为2。
2、左子树和右子树是有顺序的,次序不能颠倒。
3、即使某结点只有一个子树,也要区分左右子树。

二叉树是一种比较有用的折中方案,它添加,删除元素都很快,并且在查找方面也有很多的算法优化,所以,二叉树既有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用。

扩展:
二叉树有很多扩展的数据结构,包括平衡二叉树、红黑树、B+树等,这些数据结构二叉树的基础上衍生了很多的功能,在实际应用中广泛用到,例如mysql的数据库索引结构用的就是B+树,还有HashMap的底层源码中用到了红黑树。这些二叉树的功能强大,但算法上比较复杂,想学习的话还是需要花时间去深入的。

备注: 推荐一篇介绍树结构的文章http://www.360doc.com/content/18/0904/19/25944647_783893127.shtml


 

六:散列表

散列表,也叫哈希表,是根据关键码和值 (key和value) 直接进行访问的数据结构,通过key和value来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素。

记录的存储位置=f(key)

这里的对应关系 f 成为散列函数,又称为哈希 (hash函数),而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里,这种存储空间可以充分利用数组的查找优势来查找元素,所以查找的速度很快。

哈希表在应用中也是比较常见的,就如Java中有些集合类就是借鉴了哈希原理构造的,例如HashMap,HashTable等,利用hash表的优势,对于集合的查找元素时非常方便的,然而,因为哈希表是基于数组衍生的数据结构,在添加删除元素方面是比较慢的,所以很多时候需要用到一种数组链表来做,也就是拉链法。拉链法是数组结合链表的一种结构,较早前的hashMap底层的存储就是采用这种结构,直到jdk1.8之后才换成了数组加红黑树的结构,其示例图如下:

从图中可以看出,左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头,当然这个链表可能为空,也可能元素很多。我们根据元素的一些特征把元素分配到不同的链表中去,也是根据这些特征,找到正确的链表,再从链表中找出这个元素。

哈希表的应用场景很多,当然也有很多问题要考虑,比如哈希冲突的问题,如果处理的不好会浪费大量的时间,导致应用崩溃。


 

七:堆

堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象,具有以下的性质:

堆中某个节点的值总是不大于或不小于其父节点的值;

堆总是一棵完全二叉树。

将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2),满足前者的表达式的成为小顶堆,满足后者表达式的为大顶堆,这两者的结构图可以用完全二叉树排列出来,示例图如下:

因为堆有序的特点,一般用来做数组中的排序,称为堆排序


 

八:图

图是由结点的有穷集合V和边的集合E组成。其中,为了与树形结构加以区别,在图结构中常常将结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关系。

按照顶点指向的方向可分为无向图和有向图: 


 

个人小结:

  在看原文的时候我发现,有读者留言,问:树和堆的区别?作者回:堆是一种特殊的树。对于这个问题我也有一点自己的认识(因为我之前写过堆排序的过程),我的回答有一下几点

1)树结构给我们一种构造数据结构的思想,即通过父节点和子节点来构造一种数据结构。因为父节点和子节点构造出了两个关系>>1)层级关系(即上下||父子关系)2)左右关系(同一层级的关系)

2)  堆也是一种特殊的树(无可非议)

3)从概念的看,树注重的是层级关系,即上一层一定要大于或小于下一层的的树(可以理解为当前节点一定要小于父亲,以及父亲的兄弟姐妹),而且也注重左右关系即自己和自己的兄弟姐妹关系。不注重自己有多少个兄弟姐妹(即可以有多个兄弟姐妹)

4)堆仅注重父子关系,注重兄弟姐妹的数量(即只能有一个兄弟)。并不注重自己和父亲的兄弟姐妹的关系,而且也不注重左右关系即自己的兄弟关系。比如堆排序,因为我们只注重最值,故我们只要跟节点就行,不需要关注子节点的大小。

5)由此我们可以猜测二叉树,黑红树等都是对层级关系和左右关系的不同限定。

 

posted @ 2019-03-28 16:28  爱我-中华  阅读(224)  评论(0编辑  收藏  举报