Loading

【Java面试】面试官为了装X故意为难问你,为什么加索引能提升查询效率?如何回答才能惊呆他!

“为什么加索引能提升查询效率”!

我们都认为“加索引”提升查询效率是理所应当的

竟然还有理由? 该怎么回答呢?

大家好,我是Mic,一个工作了14年的Java程序员

下面分析一下这个问题的考察点

考察目标

这是一道原理性的问题,考察求职者对于Mysql中索引的实现原理的理解程度。

一般情况下,考察3年经验以上人会多一点。

毕竟Mysql是应用开发的基础存储组件。

因此,对于这个问题的回答,建议是把索引的实现以及它的工作原理说清楚,这样会更容易得到面试官的认可。

问题解析

想必大家都知道,Mysql的采用了B+树作为索引的存储结构来提升数据检索的效率。

其实如果大家要真正去理解并且搞懂索引,我建议大家从三个纬度来看。

  • 第一个, 为什么需要索引

  • 第二个, 索引是如何提升效率的

  • 第三个, 为什么采用B+树

第一个问题,为什么需要索引?

很简单,如果一本中华字典,没有前面的字典目录,你需要花多久才能找到某个汉字?

同样的道理,如果没有索引,当我们查询数据的时候,需要从磁盘里面随机查找,机械磁盘随机读取数据需要频繁寻找磁道以及从磁盘读取数据,这个过程非常耗时。

image-20220807171025130

第二个问题,索引是如何提升效率的?

有了索引以后,相当于把索引列以及所属的磁盘块地址缓存到内存里面,在数据查询的时候,直接找到目标数据列所属的磁盘地址,去读取对应磁盘块的数据就行了,相当于减少了磁盘IO的次数。

第三个问题,为什么要采用B+树

原因有很多,如果单纯在在性能角度来考虑,磁盘IO次数越少越好。

那用什么样的数据结构来存储索引列能够达到这个目的呢?

很显然,多路平衡查找树就是一个很好的选择,也就是B树或者B+树。

至于为什么采用B+树,我在前面的视频里面有专门说过,大家可以去找找看。

高手:

准确来说,只有命中了索引列的查询,才能提升效率。

并且,即便是命中了索引,查询效率也不一定高,比如在性别字段上加索引。

因为数据的散列度不高,导致可能会遍历整颗B+树。

我认为,加索引能够提升查询效率的根本原因是:

InnoDB采用了B+树这种多路平衡查找树来存储索引,使得在千万级数量的情况下,树的高度可以控制在3层以内。

而层高代表磁盘IO的次数,因此基于索引查询减少了磁盘IO次数。

总结

好的,你学废了吗?

如果你喜欢我的作品,记得点赞收藏加关注!!!

需要Java面试资料、简历模板、学习路线图扫下方!

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Mic带你学架构
如果本篇文章对您有帮助,还请帮忙点个关注和赞,您的坚持是我不断创作的动力。欢迎关注「跟着Mic学架构」公众号公众号获取更多技术干货!

posted @ 2022-09-21 17:00  跟着Mic学架构  阅读(447)  评论(0编辑  收藏  举报