参考视频:
Cache Access Example (Part I)
Cache Access Example (Part II)
众所周知,计算机中使用缓存技术来提高数据的读写效率。Cache hit,即缓存命中,能大大提高CPU的工作效率。
数据访问的延迟
那么,我们实际访问内存(Main Memory)中的数据时,Cache是如何工作的呢?如何判断Cache hit or miss?
为了解答这些问题,我们需要了解缓存映射(Cache Mapping)。
Direct Mapped Cache ( or 1-way set-associative cache)
首先,我们需要设定一些参数:
- Cache Size (缓存总大小) : 128 Byte (实际使用的缓存通常是KB量级的)
- Address Bits (内存地址位数): 12 bit (实际上通常是32位或是64位)
- Cache Block ( Cache Line )size (缓存块或缓存线大小): 32 Byte
接下来我们要做一些计算:
- Number of Offset bits = log2( Block Size) = log2(32) = 5 bit
- Number of Sets = CacheSize/CacheBlock = 128/32 = 4
- Number of Set index bits = log2(Number of Sets) = log2(4) = 2 bit
- Number of Tag bits = Address Bits - Number of Offset bits - Number of Set index bits = 12 - 5 - 2 = 5 bit
经过上述计算后,我们就可以把内存地址分成三个部分。比如:
Address | Tag | Index | Offset |
---|---|---|---|
0x060 = 0000 0110 0000 | 00000 | 11 | 00000 |
我们的Cache看起来是这样的:
Set Index | Valid Bit(V) | Tag |
---|---|---|
00 | ||
01 | ||
10 | ||
11 |
Cache共有4个set,每个set有Valid Bit(有效位),表明当前set是否有数据,Tag则是用来标识数据的ID。
映射算法如下:
1、跟据address中index部分找到cache中对应的set行
2、查看valid bit是否被设置
3、如未被设置,则cache读取内存中的数据到当前set,接着设置valid bit为1,tag值为address中的tag值,当然这次访问为“缓存未命中 miss”
4、如被设置,则比较tag值是否相等。如相等,则“缓存命中 hit”;不相等,则cache会读取数据覆盖当前set里的内容,并将tag更新,此次访问为“缓存未命中 miss”
假设我们要顺序访问以下内存位置:
访问0x070时,我们先看set部分为11,此时cache set 11 的 V值为0,所以cache miss,cache将内存中的数据读入,将v值设为1,tag值设为00000 = 0。
Set Index | Valid Bit(V) | Tag |
---|---|---|
00 | ||
01 | ||
10 | ||
11 | 1 | 0 |
访问0x080时,同理可得,cache miss。
Set Index | Valid Bit(V) | Tag |
---|---|---|
00 | 1 | 1 |
01 | ||
10 | ||
11 | 1 | 0 |
访问0x068时,我们发现set值、tag值均匹配,于是cache hit。
其他依次类推。
我们按列表顺序访问两遍内存,可以得到缓存命中率为:
第一轮: Hit Rate = 2/9 = 22%
第二轮: Hit Rate = 3/9 = 33%
2 - Way Set-associative Cache ( extended to N-Way )
同样,我们设定一些参数:
- Cache Size : 128 Byte
- Address Bits : 12 bit
- 2- way set-associative
- Cache Block ( Cache Line )size : 32 Byte
做一些计算:
- Offset bits = log2(32) = 5
- Number of sets = 128/(32 * 2) = 2 (分母中的2,表示两路,我们的1个set中有2个block了)
- Number of index bits = log2(2) = 1
- Number of tag bits = 12 - 5 - 1 = 6
经过上述计算后,我们就可以把内存地址分成三个部分。比如:
Address | Tag | Index | Offset |
---|---|---|---|
0x060 = 0000 0110 0000 | 000001 | 1 | 00000 |
我们的Cache看起来像这样:
其中LRU = least recently used 即标识哪路数据是我们最久以前使用的,因为我们是2-way,因此LRU只需要1位。
映射算法与direct mapping基本一致,区别在于当cache miss时,我们要根据LRU将内存中的数据填入到set中对应的block中。每次访问cache时,都要更新LRU值。
网友评论