铁目诱惑

铁目诱惑的博客(www.1986z.com). 【不作无聊的学术研究,只走实际开发有用之道】.

   :: 首页 :: 联系 :: 订阅 订阅 :: 管理
  5 Posts :: 0 Stories :: 30 Comments :: 0 Trackbacks

公告

昵称:铁目诱惑
园龄:1年9个月
粉丝:8
关注:2

搜索

 

常用链接

我的标签

最新评论

我们来简单地看看SQL SERVER索引是如何工作的,关于索引的一些概念就不说了。

 

聚簇索引:

(图A)

 

我们来看图A,聚簇索引的结构图。
数据页就是数据库里实际存储数据的地方,可以看到是按页1页1页存的。

假设那个列是”LastName”。

因为是聚集索引,所以它是按照顺序排下来的。可以看到,索引是一棵树,首先先看一下这棵树是怎么形成的。

先看Page100和Page110的最上面,由它们形成了Page141,Page141的第一条数据是Page100的第一条数据,Page141的最后一条数据是Page110的第一条数据。同理由Page120和Page130形成Page145,Page141和Page145形成根Page140.

好了,然后来看看它是如何查找数据的。

我们来找”Rudd”这个姓。

首先它会从根即Page140开始找,因为”Rudd”的值比”Martin”大(只要比较一下他们首字母就知道了,按26个字母顺序R排在M的后面),所以会往”Martin”的后面找,即找到Page145,然后在比较一下”Rudd”和”Smith”,”Rudd”比”Smith”小,所以会往左边找即Page120,然后在Page120逐行扫描下来直到找到”Rudd”。

如果不建索引的话,SQL SERVER会从第一页开始按顺序每页逐行扫描过去,直到找到”Rudd”。显然如果对于一个百万行的表来说,效率是极其低下的,如果建了索引,非常快就能找到。

非聚簇索引:

(图B) 

看图B,非聚簇索引的结构图。

聚簇索引和非聚簇索引的区别就是:聚簇索引的数据物理存储顺序和索引顺序一致的,也就是它的数据就是按顺序排下来的。非聚簇索引的数据存储是无序的,不按索引顺序排列。

从图B可以看到数据页里是无序的。那么它的索引是如何建立的呢?

再看图B,它是把这个索引列的数据复制了一份然后按顺序排下来,再建立索引。每行数据都有一个指针。

我们再来找”Rudd”.首先从索引页的根开始找,查找原理跟聚集索引是一样的。在索引页的Page61找到”Rudd”,它的指针是470501,然后在数据页的Page5找到470501,这个位置就是”Rudd”在数据库中的实际位置,这样就找到了”Rudd”。

好了,索引的基本工作原理就是这样,可能实际上要复杂些。

 

 

SQL SERVER索引优化系列之一:工作原理&聚簇索引|非聚簇索引

SQL SERVER索引优化系列之二:索引性能考虑

SQL SERVER索引优化系列之三:填充因子

男人的程序:性 能 至上!
posted on 2010-09-29 00:00 铁目诱惑 阅读(1888) 评论(5) 编辑 收藏

Feedback

#1楼2010-09-29 08:48寻自己      
这两张图我看的不下10遍了,天下文章一大抄
 回复 引用 查看   
#2楼[楼主]2010-09-29 09:03铁目诱惑      
@寻自己
:(
哈,这说明你很细心,你知道得太多了。。。
其实真相是:图片是别人的,文字是自己的。
要自己做图片也行,但似乎没那个必要。
 回复 引用 查看   
引用.首先从索引页的根开始找,查找原理跟聚集索引是一样的


按照上面所说,聚簇索引和非聚簇索引 在索引页里面索引 Rudd 的时间是一样的,差别只在非聚簇索引多了一步用指针指向Rudd的实际数据位置。
我想指针的指向应该不会花费太长的时间。
按照你所说,应该是两者查找花费的时间差不多。
这是我的理解,可能我理解错了,请赐教!!
 回复 引用 查看   
#4楼[楼主]2010-09-29 10:15铁目诱惑      
@小李飛菜刀
在这里,并没有谈论它们(聚簇索引和非聚簇索引)的时间差别,事实上,从这个图片事例,也不能比较它们的时间。

在此只是简单总结了下它们的原理:
聚簇索引的顺序是记录存储的物理顺序,非聚簇索引是逻辑顺序。
不过,一般来说,对查询来说聚簇索引快,但聚簇索引会影响插入、更新、删除的效率。
 回复 引用 查看   
#5楼2011-01-02 17:01wtq      
楼主太厉害了,受益匪浅。
 回复 引用 查看