漫谈计算机组成原理（五）高速缓冲存储器

本文讲什么？

老样子，在正式开始介绍“高速缓冲存储器”之前，我们先来了解一下其相关的信息。

我相信，上面这张图你一定已经非常熟悉了，没错，这就是在本章绪论说的“存储器的层次结构”。
上一讲我们介绍了存储层次结构中的L4，即主存。继续向上看，你会看到L3、L2、L1都是高速缓冲存储器。那么究竟什么是高速缓冲存储器呢？那就要从“速度”这个关键词说起。
随着计算机硬件行业的不断进步，以因特尔为首的芯片企业造出了一代又一代的高速CPU，可以说CPU处理数据的速度是越来越快。但是从图中我们能够看到，L0-L6的设备的速度是逐渐下降的，而且速度相差越来越大。
虽然说近年来的存储技术也有进步，但是照着CPU就差远了。这就造成了CPU和主存之间速度差距越来越大。高速缓冲存储器的存在就是为了尽可能的消除这种差距。
在这个存储层次结构中，虽然高速缓冲存储器分为三个档次，但是他们的作用都是相同的，都是起到一种桥梁的作用，不同的只是速度和造价。此外，L1的速度几乎和寄存器的速度相同。接下来，我们来看看高速缓冲存储器在CPU中的具体位置。

这种结构进一步的验证了存储器的层次结构——高速缓冲存储器位于寄存器之下的特点。好了，说了这么多，那让我们来看看高速缓冲存储器的工作原理吧！

高速缓冲存储器(Cache)的工作原理

实际上，Cache的工作原理非常简单，就是利用了映射的方式来获取主存信息。
我们知道，主存的地址范围是2^n（即2^n个字），而每个字都有一个n位的地址。（不明白的可以翻翻这个系列的前几篇文章）。所谓映射，就是两个元素之间的对应关系。而我们很清楚，主存的容量肯定是远远大于高速缓冲存储器的。所以，这种映射必然是一对多的关系，某部分高速缓冲存储器中的内容对应着主存中的的吧部分内容。
为了实现上面所说的映射，我们需要对主存和缓存进行块的划分，使这些“字块”实现一对多的映射关系。简略图如下：
可以看见，我们将主存和缓存划分成了一个又一个的字块，从而实现映射关系。

CPU想要处理信息，首先就是看缓存（高速缓冲存储器）中是否存在信息，如果存在，那么好，就从缓存中读入一个字（一个字块可能包括多个字）；如果缓存中没有数据，那么就会根据这种映射关系，将主存中的数据一个字块一个字块地映射到相应的位置，然后再由CPU进行读取即可。
这里有一个名词，叫做缓存命中和缓存不命中。上面说的两种情况中的第一种就是缓存命中，而后一种就是缓存不命中。命中率是衡量缓存的效率的。命中率越高，效率越好。命中率=缓存命中/（缓存命中+缓存不命中）。

上面说的例子，可以理解为映射中的第一种方式——直接相连映射。下面我们就来详细的了解一下映射方式。

主存——高速缓冲存储器之间的映射方式

直接映射

下图给出了直接映射的示意图：

直接相连映射可以说是一种最简单的方法，为什么这样说呢，因为他的逻辑最为清晰、也是最好理解的一种映射方式。
你可能会说，这么复杂的一个图你跟我说这是最简单的方法，你怕不是个傻子吧！不要急，听我慢慢说。
首先，先看Cache，Cache被分成了2^c 块，而主存则被分成了n*2^c, n就是n组，从图中的连接线可以很直观的看出，主存中的字块0~2^c-1 块对应着Cache中的0~2^c-1 块。而主存中的2^c 块则是对应着Cache中的第0块，依次类推。即主存中的每一组字块对应着Cache中的相应字块。
好了，对应关系说完了，我们来解释一下图中的其他内容。
首先说标记，标记代表的意义就是当前Cache字块中的数据是否有效。可以这样想，我们之前讲了缓存命中和缓存不命中，当CPU向缓存推送地址，说“我想拿到Cache中字块0上的数据”，那么好，Cache首先要看看字块0上的标记位是否为1，如果是1，就把这个数据给CPU，这就叫缓存命中；如果标记位为0，则说明此时Cache上的数据无效，则不推送，这就叫做缓存不命中。你可能会这样想：Cache上的数据不都是从主存上拿到的吗，为什么还会有无效的时候呢？这样的例子不少，比如说Cache刚通电的那一瞬间，这时候Cache上面是没有数据的，标记位的0就起了很大作用。如果发现是0的话，接着主存会向Cache推送数据的，这一点不必担心。看到这，我相信你肯定也知道比较器是个什么玩意了。

全相联映射

如果说直接相连映射是最简单的方法的话，那么全相连映射就是一种最粗暴的映射方式。还是先看图：

我相信你此时一定知道我为啥说这是一种相当粗暴的映射方式了，没错，看到那交错纵横的线，一开始我是拒绝的，这货太暴力了。
标记位自然是不用说，主要是这货的主存不分组，主存中的任何一个字块都可以映射到Cache中的任何一个字块，所以看起来十分的凌乱。但是还是有好处的，你看直接映射，比如说主存还是分成n组，也就是说Cache中的每一个字块都有n个主存中的字块对应，且主存中的字块只能对应Cache中的一个字块。所以说，如果Cache中的数据没有失效的时候，主存中的其他的n-1个字块都是需要等待的。
但是全相联映射不同——主存中的字块可以对应任何一个Cache中的字块，也就是说，如果主存想要向Cache推送数据，只需要挑一个失效的地方，将原有数据覆盖即可。
这种方式比较混乱，电路可能会很复杂，同时又会造成较高的成本。

组相联映射

计算机组成原理很有意思，你会发现，在计算机结构的设计方案中，一般都是这样的：有一种比较简单的方案，但是效率并不怎么好，然后有一种效率很好的方案但是可能过于复杂，接着就会出现第三种方案，一般这种方案都是以上二者的折中。在有效的消除了二者的缺点的同时，又极大的利用了二者的优点，不得不感叹这些科学家的聪明才智。

首先说对应方式，组相联的映射方式和直接相连的映射方式相同，都是主存中的每一组字块中的每一个字块对应着Cache中的一个相应字块，但是有不同之处在于，Cache中的字块分成了两组，这种方式也叫做二路组相联。
其次说下这种连接方式的优点：可以看到，在二路组相联中，除非是Cache中每块的两组字块都被占用了，否则不存在冲突的问题，这大大提高了效率，同时又没有全相联那种暴力的方式。

总结

本文详细的讨论了Cache的工作原理及三种映射方式，希望对大家有所帮助。
如果你喜欢我的文章，请帮忙点赞；如果你对本文内容存在疑问，请留言告诉我。您的点赞和留言是对原创作者的最大支持，感谢您的阅读。
此外，本人一直在寻找志同道合的小伙伴，同样如此的可以邮件联系我：roobtyan@outlook.com.
本人微信公众号：

posted @ 2018-08-15 18:30 roobtyan 阅读(2572) 评论(0) 收藏举报

刷新页面返回顶部

roobtyan

深自缄默，如云漂泊