经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » C++ » 查看文章
一个无竞争的缓存
来源:cnblogs  作者:charlieroro  时间:2024/4/29 9:27:23  对本文有异议

一个无竞争的缓存

otter是一个无竞争的缓存,在相关的性能测试中表项突出。otter的原理基于如下论文:

Cache定义

Cache的定义如下,其主要的组件包括:

  • hashmap:保存全部缓存数据
  • policy(s3-FIFO):这是一个驱逐策略。当在hashmap中添加一个数据时,会同时将该数据添加到s3-FIFO中,若此时s3-FIFO驱逐出了老的数据,则需要同时删除hashmap中的对应数据。因此hashmap中的数据内容受限于s3-FIFO,hashmap和s3-FIFO中的数据是以最终一致的方式呈现的。
  • readBuffers:是一个缓存之上的缓存,其数据空间是较小且固定。用于找出热点数据,并增加热点数据的使用频率(freq),以辅助实现s3-FIFO驱逐策略。
  • expiryPolicy:数据的缓存策略,支持固定TTL、可变TTL以及无过期方式。通过一个名为的cleanup 的goroutine来定期清理过期数据。
  • writeBuffer:这是一个事件队列,haspmap的增删改操作会将数据变更事件push到writeBuffer中,再由单独的goroutine异步处理这些事件,以保证hashmap、s3-FIFO和expiryPolicy的数据一致性。

otter将大部分存储的大小都设置为2的幂,这样实现的好处有两点:

  • 在进行存储大小调整时,方便通过移位操作进行扩缩容

  • 通过位与操作可以方便找到ring buffer中的数据位置:

    1. func RoundUpPowerOf2(v uint32) uint32 {
    2. if v == 0 {
    3. return 1
    4. }
    5. v--
    6. v |= v >> 1
    7. v |= v >> 2
    8. v |= v >> 4
    9. v |= v >> 8
    10. v |= v >> 16
    11. v++
    12. return v
    13. }
    14. func main() {
    15. var capacity uint32 = 5 //定义buffer容量
    16. var bufferHead uint32
    17. t := RoundUpPowerOf2(capacity) //将buffer容量转换为向上取2的幂
    18. mask := t - 1 //获取掩码
    19. buffer := make([]int, t)
    20. head := atomic.LoadUint32(&bufferHead)
    21. buffer[head&mask] = 100 //获取下一个数据位置,并保存数据
    22. atomic.AddUint32(&bufferHead, 1) //下一个数据位置+1
    23. }

在Cache中有一个锁evictionMutex,并发访问竞争中,仅用于变更从readBuffers中返回的热点数据的freq,因此对并发访问竞争的影响很小。

  1. type Cache[K comparable, V any] struct {
  2. nodeManager *node.Manager[K, V]
  3. hashmap *hashtable.Map[K, V] //hashmap
  4. policy *s3fifo.Policy[K, V] //s3-FIFO
  5. expiryPolicy expiryPolicy[K, V] //expiryPolicy
  6. stats *stats.Stats
  7. readBuffers []*lossy.Buffer[K, V] //readBuffers
  8. writeBuffer *queue.Growable[task[K, V]] //writeBuffer
  9. evictionMutex sync.Mutex
  10. closeOnce sync.Once
  11. doneClear chan struct{}
  12. costFunc func(key K, value V) uint32
  13. deletionListener func(key K, value V, cause DeletionCause)
  14. capacity int
  15. mask uint32
  16. ttl uint32
  17. withExpiration bool
  18. isClosed bool
  19. }

数据节点的创建

Otter中的数据单位为node,一个node表示一个[k,v]。使用Manager来创建node,根据使用的过期策略和Cost,可以创建becbcbeb四种类型的节点:

  • b -->Base:基本类型

  • e -->Expiration:使用过期策略

  • c -->Cost:大部分场景下的node的cost设置为1即可,但在如某个node的数据较大的情况下,可以通过cost来限制s3-FIFO中的数据量,以此来控制缓存占用的内存大小。

  1. type Manager[K comparable, V any] struct {
  2. create func(key K, value V, expiration, cost uint32) Node[K, V]
  3. fromPointer func(ptr unsafe.Pointer) Node[K, V]
  4. }

NewManager可以根据配置创建不同类型的node:

  1. func NewManager[K comparable, V any](c Config) *Manager[K, V] {
  2. var sb strings.Builder
  3. sb.WriteString("b")
  4. if c.WithExpiration {
  5. sb.WriteString("e")
  6. }
  7. if c.WithCost {
  8. sb.WriteString("c")
  9. }
  10. nodeType := sb.String()
  11. m := &Manager[K, V]{}
  12. switch nodeType {
  13. case "bec":
  14. m.create = NewBEC[K, V]
  15. m.fromPointer = CastPointerToBEC[K, V]
  16. case "bc":
  17. m.create = NewBC[K, V]
  18. m.fromPointer = CastPointerToBC[K, V]
  19. case "be":
  20. m.create = NewBE[K, V]
  21. m.fromPointer = CastPointerToBE[K, V]
  22. case "b":
  23. m.create = NewB[K, V]
  24. m.fromPointer = CastPointerToB[K, V]
  25. default:
  26. panic("not valid nodeType")
  27. }
  28. return m
  29. }

需要注意的是NewBECNewBCNewBENewB返回的都是node指针,后续可能会将该指针保存到hashmap、s3-FIFO、readBuffers等组件中,因此在可以保证各组件操作的是同一个node,但同时也需要注意node指针的回收,防止内存泄露。

hashmap

hashmap是一个支持并发访问的数据结构,它保存了所有缓存数据。这里参考了puzpuzpuz/xsyncmapof实现。

一个table包含一个bucket数组,每个bucket为一个链表,每个链表节点包含一个长度为3的node数组:

  1. type Map[K comparable, V any] struct {
  2. table unsafe.Pointer //指向一个table结构体,用于保存缓存数据
  3. nodeManager *node.Manager[K, V] //用于管理node
  4. // only used along with resizeCond
  5. resizeMutex sync.Mutex
  6. // used to wake up resize waiters (concurrent modifications)
  7. resizeCond sync.Cond
  8. // resize in progress flag; updated atomically
  9. resizing atomic.Int64 //用于表示该map正处于resizing阶段,resizing可能会生成新的table,导致set失效,该值作为一个条件判断使用
  10. }
  1. type table[K comparable] struct {
  2. buckets []paddedBucket //其长度为2的幂
  3. // sharded counter for number of table entries;
  4. // used to determine if a table shrinking is needed
  5. // occupies min(buckets_memory/1024, 64KB) of memory
  6. size []paddedCounter//用于统计table中的node个数,使用多个counter分散统计的目的是为了降低访问冲突
  7. mask uint64 //为len(buckets)-1, 用于和node的哈希值作位于运算,计算node所在的bucket位置
  8. hasher maphash.Hasher[K] //哈希方法,计算node的哈希值
  9. }

bucket是一个单向链表:

  1. type bucket struct {
  2. hashes [bucketSize]uint64 //保存node的哈希值,bucketSize为3
  3. nodes [bucketSize]unsafe.Pointer //保存node指针,node指针和node的哈希值所在的索引位置相同
  4. next unsafe.Pointer//指向下一个bucket
  5. mutex sync.Mutex //用于操作本bucket的锁
  6. }

table的结构如下

image

下面是map的初始化方法,为了增加检索效率并降低链表长度,table中的buckets数目(size)不宜过小

  1. func newMap[K comparable, V any](nodeManager *node.Manager[K, V], size int) *Map[K, V] {
  2. m := &Map[K, V]{
  3. nodeManager: nodeManager,
  4. }
  5. m.resizeCond = *sync.NewCond(&m.resizeMutex)
  6. var t *table[K]
  7. if size <= minNodeCount {
  8. t = newTable(minBucketCount, maphash.NewHasher[K]()) //minBucketCount=32
  9. } else {
  10. bucketCount := xmath.RoundUpPowerOf2(uint32(size / bucketSize))
  11. t = newTable(int(bucketCount), maphash.NewHasher[K]())
  12. }
  13. atomic.StorePointer(&m.table, unsafe.Pointer(t))
  14. return m
  15. }

下面是向map添加数据的方式,注意它支持并行添加数据。set操作的是一个table中的某个bucket。如果table中的元素大于某个阈值,就会触发hashmap扩容(resize),此时会创建一个新的table,并将老的table中的数据拷贝到新建的table中。

setresize都会变更相同的table,为了防止冲突,下面使用了bucket锁以及一些判断来防止此类情况:

  • 每个bucket都有一个锁,resize在调整table大小时会新建一个table,然后调用copyBuckets将原table的buckets中的数据拷贝到新的table的buckets中。通过bucket锁可以保证resizeset不会同时操作相同的bucket

  • 由于resize会创建新的table,有可能导致setresize操作不同的table,进而导致set到无效的table中。

    • 如果resize发生在set之前,则通过if m.resizeInProgress() 来保证二则操作不同的table

    • 如果同时发生resizeset,则可以通过bucket锁+if m.newerTableExists(t)来保证操作的是最新的table。

      由于copyBuckets时也会用到bucket锁,如果此时正在执行set,则copyBuckets会等待set操作完成后再将数据拷贝到新的table中。copyBuckets之后会将新的table保存到hashmap中,因此需要保证bucket和table的一致性,在set时获取到bucket锁之后需要进一步验证table是否一致。

  1. func (m *Map[K, V]) set(n node.Node[K, V], onlyIfAbsent bool) node.Node[K, V] {
  2. for {
  3. RETRY:
  4. var (
  5. emptyBucket *paddedBucket
  6. emptyIdx int
  7. )
  8. //获取map的table
  9. t := (*table[K])(atomic.LoadPointer(&m.table))
  10. tableLen := len(t.buckets)
  11. hash := t.calcShiftHash(n.Key())//获取node的哈希值
  12. bucketIdx := hash & t.mask //获取node在table中的bucket位置
  13. //获取node所在的bucket位置
  14. rootBucket := &t.buckets[bucketIdx]
  15. //获取所操作的bucket锁,在resize时,会创建一个新的table,然后将原table中的数据拷贝到新创建的table中。
  16. //resize的copyBuckets是以bucket为单位进行拷贝的,且在拷贝时,也会对bucket加锁。这样就保证了,如果同时发生set和resize,
  17. //resize的copyBuckets也会等操作相同bucket的set结束之后才会进行拷贝。
  18. rootBucket.mutex.Lock()
  19. // the following two checks must go in reverse to what's
  20. // in the resize method.
  21. //如果正在调整map大小,则可能会生成一个新的table,为了防止出现无效操作,此时不允许继续添加数据
  22. if m.resizeInProgress() {
  23. // resize is in progress. wait, then go for another attempt.
  24. rootBucket.mutex.Unlock()
  25. m.waitForResize()
  26. goto RETRY
  27. }
  28. //如果当前操作的是一个新的table,需要重新选择table
  29. if m.newerTableExists(t) {
  30. // someone resized the table, go for another attempt.
  31. rootBucket.mutex.Unlock()
  32. goto RETRY
  33. }
  34. b := rootBucket
  35. //set node的逻辑是首先在bucket链表中搜索是否已经存在该node,如果存在则直接更新,如果不存在再找一个空位将其set进去
  36. for {
  37. //本循环用于在单个bucket中查找是否已经存在需要set的node。如果找到则根据是否设置onlyIfAbsent来选择
  38. //是否原地更新。如果没有在当前bucket中找到所需的node,则需要继续查找下一个bucket
  39. for i := 0; i < bucketSize; i++ {
  40. h := b.hashes[i]
  41. if h == uint64(0) {
  42. if emptyBucket == nil {
  43. emptyBucket = b //找到一个最近的空位,如果后续没有在bucket链表中找到已存在的node,则将node添加到该位置
  44. emptyIdx = i
  45. }
  46. continue
  47. }
  48. if h != hash { //查找与node哈希值相同的node
  49. continue
  50. }
  51. prev := m.nodeManager.FromPointer(b.nodes[i])
  52. if n.Key() != prev.Key() { //为了避免哈希碰撞,进一步比较node的key
  53. continue
  54. }
  55. if onlyIfAbsent { //onlyIfAbsent用于表示,如果node已存在,则不会再更新
  56. // found node, drop set
  57. rootBucket.mutex.Unlock()
  58. return n
  59. }
  60. // in-place update.
  61. // We get a copy of the value via an interface{} on each call,
  62. // thus the live value pointers are unique. Otherwise atomic
  63. // snapshot won't be correct in case of multiple Store calls
  64. // using the same value.
  65. atomic.StorePointer(&b.nodes[i], n.AsPointer())//node原地更新,保存node指针即可
  66. rootBucket.mutex.Unlock()
  67. return prev
  68. }
  69. //b.next == nil说明已经查找到最后一个bucket,如果整个bucket链表中都没有找到所需的node,则表示这是新的node,需要将node
  70. //添加到bucket中。如果bucket空间不足,则需要进行扩容
  71. if b.next == nil {
  72. //如果已有空位,直接添加node即可
  73. if emptyBucket != nil {
  74. // insertion into an existing bucket.
  75. // first we update the hash, then the entry.
  76. atomic.StoreUint64(&emptyBucket.hashes[emptyIdx], hash)
  77. atomic.StorePointer(&emptyBucket.nodes[emptyIdx], n.AsPointer())
  78. rootBucket.mutex.Unlock()
  79. t.addSize(bucketIdx, 1)
  80. return nil
  81. }
  82. //这里判断map中的元素总数是不是已经达到扩容阈值growThreshold,即当前元素总数大于容量的0.75倍时就执行扩容
  83. //其实growThreshold计算的是table中的buckets链表的数目,而t.sumSize()计算的是tables中的node总数,即
  84. //所有链表中的节点总数。这么比较的原因是为了降低计算的时间复杂度,当tables中的nodes较多时,能够及时扩容
  85. //buckets数目,而不是一味地增加链表长度。
  86. //参见:https://github.com/maypok86/otter/issues/79
  87. growThreshold := float64(tableLen) * bucketSize * loadFactor
  88. if t.sumSize() > int64(growThreshold) {
  89. // need to grow the table then go for another attempt.
  90. rootBucket.mutex.Unlock()
  91. //扩容,然后重新在该bucket中查找空位。需要注意的是扩容会给map生成一个新的table,
  92. //并将原table的数据拷贝过来,由于table变了,因此需要重新set(goto RETRY)
  93. m.resize(t, growHint)
  94. goto RETRY
  95. }
  96. // insertion into a new bucket.
  97. // create and append the bucket.
  98. //如果前面bucket中没有空位,且没达到扩容要求,则需要新建一个bucket,并将其添加到bucket链表中
  99. newBucket := &paddedBucket{}
  100. newBucket.hashes[0] = hash
  101. newBucket.nodes[0] = n.AsPointer()
  102. atomic.StorePointer(&b.next, unsafe.Pointer(newBucket))//保存node
  103. rootBucket.mutex.Unlock()
  104. t.addSize(bucketIdx, 1)
  105. return nil
  106. }
  107. //如果没有在当前bucket中找到所需的node,则需要继续查找下一个bucket
  108. b = (*paddedBucket)(b.next)
  109. }
  110. }
  111. }
  1. func (m *Map[K, V]) copyBuckets(b *paddedBucket, dest *table[K]) (copied int) {
  2. rootBucket := b
  3. //使用bucket锁
  4. rootBucket.mutex.Lock()
  5. for {
  6. for i := 0; i < bucketSize; i++ {
  7. if b.nodes[i] == nil {
  8. continue
  9. }
  10. n := m.nodeManager.FromPointer(b.nodes[i])
  11. hash := dest.calcShiftHash(n.Key())
  12. bucketIdx := hash & dest.mask
  13. dest.buckets[bucketIdx].add(hash, b.nodes[i])
  14. copied++
  15. }
  16. if b.next == nil {
  17. rootBucket.mutex.Unlock()
  18. return copied
  19. }
  20. b = (*paddedBucket)(b.next)
  21. }
  22. }

Get的逻辑和set的逻辑类似,但get时无需关心是否会操作老的table,原因是如果产生了新的table,其也会复制老的数据。

s3-FIFO

s3-FIFO可以看作是hashmap的数据过滤器,使用s3-FIFO来淘汰hashmap中的数据。

Dqueue

S3-FIFO的ghost使用了Dqueue。

Dqueue就是一个ring buffer,支持PopFront/PushFront和PushBack/PopBack,其中buffer size为2的幂。其快于golang的container/list库。

image

由于是ring buffer,随着push和pop操作,其back和front的位置会发生变化,因此可能会出现back push的数据到了Front前面的情况。

image

用法如下:

  1. package main
  2. import (
  3. "fmt"
  4. "github.com/gammazero/deque"
  5. )
  6. func main() {
  7. var q deque.Deque[string]
  8. q.PushBack("foo")
  9. q.PushBack("bar")
  10. q.PushBack("baz")
  11. fmt.Println(q.Len()) // Prints: 3
  12. fmt.Println(q.Front()) // Prints: foo
  13. fmt.Println(q.Back()) // Prints: baz
  14. q.PopFront() // remove "foo"
  15. q.PopBack() // remove "baz"
  16. q.PushFront("hello")
  17. q.PushBack("world")
  18. // Consume deque and print elements.
  19. for q.Len() != 0 {
  20. fmt.Println(q.PopFront())
  21. }
  22. }

readBuffers

在读取数据时,会将获取的数据也保存到readBuffers中,readBuffers的空间比较小,其中的数据可以看作是热点数据。当某个readBuffers[i]数组满了之后,会将readBuffers[i]中的所有nodes返回出来,并增加各个node的freq(给s3-FIFO使用),然后清空readBuffers[i]

image

readBuffers是由4倍最大goroutines并发数的lossy.Buffer构成的数组,lossy.Buffer为固定大小的ring buffer 结构,包括用于创建node的nodeManager以及存放node数组的policyBuffers,容量大小为capacity(16)。

  1. parallelism := xruntime.Parallelism()
  2. roundedParallelism := int(xmath.RoundUpPowerOf2(parallelism))
  1. readBuffersCount := 4 * roundedParallelism
  2. readBuffers := make([]*lossy.Buffer[K, V], 0, readBuffersCount)

使用nodeManager来初始化lossy.Buffer

  1. for i := 0; i < readBuffersCount; i++ {
  2. readBuffers = append(readBuffers, lossy.New[K, V](nodeManager))
  3. }

下面是lossy.New的实现,Buffer长度为2的幂。

  1. type Buffer[K comparable, V any] struct {
  2. head atomic.Uint64 //指向buffer的head
  3. headPadding [xruntime.CacheLineSize - unsafe.Sizeof(atomic.Uint64{})]byte
  4. tail atomic.Uint64 //指向buffer的tail
  5. tailPadding [xruntime.CacheLineSize - unsafe.Sizeof(atomic.Uint64{})]byte
  6. nodeManager *node.Manager[K, V] //用于管理node
  7. returned unsafe.Pointer //可以看做是一个条件锁,和hashmap的resizing作用类似,防止在buffer变更(add/free)的同时添加node
  8. returnedPadding [xruntime.CacheLineSize - 2*8]byte
  9. policyBuffers unsafe.Pointer //指向一个容量为16的PolicyBuffers,用于复制读缓存(buffer)中的热点数据
  10. returnedSlicePadding [xruntime.CacheLineSize - 8]byte
  11. buffer [capacity]unsafe.Pointer //存储读缓存的数据
  12. }
  1. type PolicyBuffers[K comparable, V any] struct {
  2. Returned []node.Node[K, V]
  3. }
  1. func New[K comparable, V any](nodeManager *node.Manager[K, V]) *Buffer[K, V] {
  2. pb := &PolicyBuffers[K, V]{
  3. Returned: make([]node.Node[K, V], 0, capacity),
  4. }
  5. b := &Buffer[K, V]{
  6. nodeManager: nodeManager,
  7. policyBuffers: unsafe.Pointer(pb),
  8. }
  9. b.returned = b.policyBuffers
  10. return b
  11. }

下面是向readBuffers中添加数据的方式:

  1. // Add lazily publishes the item to the consumer.
  2. //
  3. // item may be lost due to contention.
  4. func (b *Buffer[K, V]) Add(n node.Node[K, V]) *PolicyBuffers[K, V] {
  5. head := b.head.Load()
  6. tail := b.tail.Load()
  7. size := tail - head
  8. //并发访问可能会导致这种情况,buffer满了就无法再添加元素,需要由其他操作通过返回热点数据来释放buffer空间
  9. if size >= capacity {
  10. // full buffer
  11. return nil
  12. }
  13. // 添加开始,将tail往后移一位
  14. if b.tail.CompareAndSwap(tail, tail+1) {
  15. // tail中保存的是下一个元素的位置。使用mask位与是为了获取当前ring buffer中的tail位置。
  16. index := int(tail & mask)
  17. // 将node的指针保存到buffer的第index位,这样就完成了数据存储
  18. atomic.StorePointer(&b.buffer[index], n.AsPointer())
  19. // buffer满了,此时需要清理缓存,即将读缓存buffer中的热点数据数据存放到policyBuffers中,后续给s3-FIFO使用
  20. if size == capacity-1 {
  21. // 这里可以看做是一个条件锁,如果有其他线程正在处理热点数据,则退出。
  22. if !atomic.CompareAndSwapPointer(&b.returned, b.policyBuffers, nil) {
  23. // somebody already get buffer
  24. return nil
  25. }
  26. //将整个buffer中的数据保存到policyBuffers中,并清空buffer。
  27. pb := (*PolicyBuffers[K, V])(b.policyBuffers)
  28. for i := 0; i < capacity; i++ {
  29. // 获取head的索引
  30. index := int(head & mask)
  31. v := atomic.LoadPointer(&b.buffer[index])
  32. if v != nil {
  33. // published
  34. pb.Returned = append(pb.Returned, b.nodeManager.FromPointer(v))
  35. // 清空buffer的数据
  36. atomic.StorePointer(&b.buffer[index], nil)
  37. }
  38. head++
  39. }
  40. b.head.Store(head)
  41. return pb
  42. }
  43. }
  44. // failed
  45. return nil
  46. }

Otter中的AddFree是成对使用的,只有在Free中才会重置Add中变更的Buffer.returned。因此如果没有执行Free,则对相同Buffer的其他Add操作也无法返回热点数据。

  1. idx := c.getReadBufferIdx()
  2. pb := c.readBuffers[idx].Add(got) //获取热点数据
  3. if pb != nil {
  4. c.evictionMutex.Lock()
  5. c.policy.Read(pb.Returned) //增加热点数据的freq
  6. c.evictionMutex.Unlock()
  7. c.readBuffers[idx].Free() //清空热点数据存放空间
  8. }

Free方法如下:

  1. // 在add返回热点数据,并在增加热点数据的freq之后,会调用Free方法释放热点数据的存放空间
  2. func (b *Buffer[K, V]) Free() {
  3. pb := (*PolicyBuffers[K, V])(b.policyBuffers)
  4. for i := 0; i < len(pb.Returned); i++ {
  5. pb.Returned[i] = nil //清空热点数据
  6. }
  7. pb.Returned = pb.Returned[:0]
  8. atomic.StorePointer(&b.returned, b.policyBuffers)
  9. }

writebuffer

writebuffer队列用于保存node的增删改事件,并由另外一个goroutine异步处理这些事件。事件类型如下:

  1. const (
  2. addReason reason = iota + 1
  3. deleteReason
  4. updateReason
  5. clearReason //执行cache.Clear
  6. closeReason //执行cache.Close
  7. )

writebuffer的初始大小是最大并发goroutines数目的128倍:

  1. queue.NewGrowable[task[K, V]](minWriteBufferCapacity, maxWriteBufferCapacity),

Growable是一个可扩展的ring buffer,从尾部push,从头部pop。在otter中作为存储node变动事件的缓存,类似kubernetes中的workqueue。

  1. type Growable[T any] struct {
  2. mutex sync.Mutex
  3. notEmpty sync.Cond //用于通过push来唤醒由于队列中由于没有数据而等待的Pop操作
  4. notFull sync.Cond //用于通过pop来唤醒由于数据量达到上限maxCap而等待的Push操作
  5. buf []T //保存事件
  6. head int //指向buf中下一个可以pop数据的索引
  7. tail int //指向buf中下一个可以push数据的索引
  8. count int //统计buf中的数据总数
  9. minCap int //定义了buf的初始容量
  10. maxCap int //定义了buf的最大容量,当count数目达到该值之后就不能再对buf进行扩容,需要等待pop操作来释放空间
  11. }

image

writebuffer的队列长度同样是2的幂,包括minCapmaxCap也是是2的幂:

  1. func NewGrowable[T any](minCap, maxCap uint32) *Growable[T] {
  2. minCap = xmath.RoundUpPowerOf2(minCap)
  3. maxCap = xmath.RoundUpPowerOf2(maxCap)
  4. g := &Growable[T]{
  5. buf: make([]T, minCap),
  6. minCap: int(minCap),
  7. maxCap: int(maxCap),
  8. }
  9. g.notEmpty = *sync.NewCond(&g.mutex)
  10. g.notFull = *sync.NewCond(&g.mutex)
  11. return g
  12. }

下面是扩展writebuffer的方法:

  1. func (g *Growable[T]) resize() {
  2. newBuf := make([]T, g.count<<1) //新的buf是原来的2倍
  3. if g.tail > g.head {
  4. copy(newBuf, g.buf[g.head:g.tail]) //将事件拷贝到新的buf
  5. } else {
  6. n := copy(newBuf, g.buf[g.head:]) //pop和push操作导致head和tail位置变动,且tail位于head之前,需要作两次copy
  7. copy(newBuf[n:], g.buf[:g.tail])
  8. }
  9. g.head = 0
  10. g.tail = g.count
  11. g.buf = newBuf
  12. }

Node 过期策略

支持的过期策略有:

  • 固定TTL:所有node的过期时间都一样。将node保存到队列中,因此最早入队列的node最有可能过期,按照FIFO的方式获取队列中的node,判断其是否过期即可。
  • 可变过期策略:这里参考了Bucket-Based Expiration Algorithm: Improving Eviction Efficiency for In-Memory Key-Value Database,该算法的要点是将时间转换为空间位置
  • 无过期策略:即不配置过期时间,在调用RemoveExpired获取过期的nodes时,认为所有nodes都是过期的。

可变过期策略

下面介绍可变过期策略的实现:

  1. var (
  2. buckets = []uint32{64, 64, 32, 4, 1}
  3. //注意spans中的元素值都是2的幂,分别为1(span[0]),64(span[1]),4096(span[2]),131072(span[3]),524288(span[4])。
  4. //上面的buckets定义也很有讲究,spans[i]表示该buckets[i]的超时单位,buckets[i][j]的过期时间为j个spans[i],即过期时间为j*spans[i]。
  5. //buckets之所以为{64, 64, 32, 4, 1},是因为buckets[1]的超时单位为64s,因此如果过期时间大于64s就需要使用buckets[1]的超时单位spans[1],
  6. //反之则使用buckets[0]的超时单位spans[0],因此buckets[0]长度为64(64/1=64);
  7. //以此类推,buckets[2]的超时单位为4096s,如果过期时间大于4096s就需要使用buckets[2]的超时单位spans[2],反之则使用buckets[1]的超时单位spans[1],
  8. //因此buckets[1]长度为64(4096/64=64);buckets[3]的超时单位为131072s,如果过期时间大于131072s就需要使用buckets[3]的超时单位spans[3],
  9. //反之则使用buckets[2]的超时单位spans[2],因此buckets[2]长度为32(131072/4096=32)...
  10. //spass[4]作为最大超时时间单位,超时时间大于该spans[4]时,都按照spans[4]计算
  11. //buckets[i]的长度随过期时间的增加而减少,这也符合常用场景,因为大部分场景中的过期时间都较短,像1.52d这种级别的过期时间比较少见
  12. spans = []uint32{
  13. xmath.RoundUpPowerOf2(uint32((1 * time.Second).Seconds())), // 1s--2^0
  14. xmath.RoundUpPowerOf2(uint32((1 * time.Minute).Seconds())), // 1.07m --64s--2^6
  15. xmath.RoundUpPowerOf2(uint32((1 * time.Hour).Seconds())), // 1.13h --4096s--2^12
  16. xmath.RoundUpPowerOf2(uint32((24 * time.Hour).Seconds())), // 1.52d --131072s--2^17
  17. buckets[3] * xmath.RoundUpPowerOf2(uint32((24 * time.Hour).Seconds())), // 6.07d --524288s--2^19
  18. buckets[3] * xmath.RoundUpPowerOf2(uint32((24 * time.Hour).Seconds())), // 6.07d --524288s--2^19
  19. }
  20. shift = []uint32{
  21. uint32(bits.TrailingZeros32(spans[0])),
  22. uint32(bits.TrailingZeros32(spans[1])),
  23. uint32(bits.TrailingZeros32(spans[2])),
  24. uint32(bits.TrailingZeros32(spans[3])),
  25. uint32(bits.TrailingZeros32(spans[4])),
  26. }
  27. )

下面是缓存数据使用的数据结构。

  1. type Variable[K comparable, V any] struct {
  2. wheel [][]node.Node[K, V]
  3. time uint32
  4. }
  • Variable.wheel的数据结构如下,Variable.wheel[i][]的数组长度等于buckets[i]buckets[i]的超时单位为spans[i]Variable.wheel[i][j]表示过期时间为j*spans[i]的数据所在的位置。

    但由于超时单位跨度比较大,因此即使Variable.wheel[i][j]所在的nodes被认为是过期的,也需要进一步确认node是否真正过期。以64s的超时单位为例,过期时间为65s的node和过期时间为100s的node会放到相同的wheel[1][0]链表中,若当前时间为80s,则只有过期时间为65s的node才是真正过期的。因此需要进一步比较具体的node过期时间。

    image

  • Variable.time是一个重要的成员:其表示上一次执行清理操作(移除过期数据或清除所有数据)的时间,并作为各个wheel[i]数组中的有效数据的起点。该值在执行清理操作之后会被重置,表示新的有效数据起点。要理解该成员的用法,应该将Variable.wheel[i]的数组看做是一个个时间块(而非位置点),每个时间块表示一个超时单位。

Variable的初始化

Variable的初始化方式如下,主要就是初始化一个二维数组:

  1. func NewVariable[K comparable, V any](nodeManager *node.Manager[K, V]) *Variable[K, V] {
  2. wheel := make([][]node.Node[K, V], len(buckets))
  3. for i := 0; i < len(wheel); i++ {
  4. wheel[i] = make([]node.Node[K, V], buckets[i])
  5. for j := 0; j < len(wheel[i]); j++ {
  6. var k K
  7. var v V
  8. fn := nodeManager.Create(k, v, math.MaxUint32, 1) //默认过期时间为math.MaxUint32,相当于没有过期时间
  9. fn.SetPrevExp(fn)
  10. fn.SetNextExp(fn)
  11. wheel[i][j] = fn
  12. }
  13. }
  14. return &Variable[K, V]{
  15. wheel: wheel,
  16. }
  17. }
删除过期数据
  1. func (v *Variable[K, V]) RemoveExpired(expired []node.Node[K, V]) []node.Node[K, V] {
  2. currentTime := unixtime.Now()//获取到目前为止,系统启动的秒数,以此作为当前时间
  3. prevTime := v.time //获取上一次执行清理的时间,在使用时会将其转换为以spans[i]为单位的数值,作为各个wheel[i]的起始清理位置
  4. v.time = currentTime //重置v.time,本次清理之后的有效数据的起始位置,也可以作为下一次清理时的起始位置
  5. //在清理数据时会将时间转换以spans[i]为单位的数值。delta表示上一次清理之后到当前的时间差。
  6. //在清理时需要遍历清理各个wheel[i],如果delta大于buckets[i],则认为整个wheel[i]都可能出现过期数据,
  7. //反之,则认为wheel[i]的部分区间数据可能过期。
  8. for i := 0; i < len(shift); i++ {
  9. //在prevTime和currentTime都小于shift[i]或二者非常接近的情况下delta可能为0,但delte为0时无需执行清理动作
  10. previousTicks := prevTime >> shift[i]
  11. currentTicks := currentTime >> shift[i]
  12. delta := currentTicks - previousTicks
  13. if delta == 0 {
  14. break
  15. }
  16. expired = v.removeExpiredFromBucket(expired, i, previousTicks, delta)
  17. }
  18. return expired
  19. }

下面用于清理wheel[i]下的过期数据:

  1. func (v *Variable[K, V]) removeExpiredFromBucket(expired []node.Node[K, V], index int, prevTicks, delta uint32) []node.Node[K, V] {
  2. mask := buckets[index] - 1
  3. //获取buckets[index]对应的数组长度
  4. steps := buckets[index]
  5. //如果delta小于buckets[index]的大小,则[start,start+delta]之间的数据可能是过期的
  6. //如果delta大于buckets[index]的大小,则整个buckets[i]都可能是过期的
  7. if delta < steps {
  8. steps = delta
  9. }
  10. //取上一次清理的时间作为起始位置,[start,end]之间的数据都认为可能是过期的
  11. start := prevTicks & mask
  12. end := start + steps
  13. timerWheel := v.wheel[index]
  14. for i := start; i < end; i++ {
  15. //遍历wheel[index][i]中的链表
  16. root := timerWheel[i&mask]
  17. n := root.NextExp()
  18. root.SetPrevExp(root)
  19. root.SetNextExp(root)
  20. for !node.Equals(n, root) {
  21. next := n.NextExp()
  22. n.SetPrevExp(nil)
  23. n.SetNextExp(nil)
  24. //注意此时v.time已经被重置为当前时间。进一步比较具体的node过期时间。
  25. if n.Expiration() <= v.time {
  26. expired = append(expired, n)
  27. } else {
  28. v.Add(n)
  29. }
  30. n = next
  31. }
  32. }
  33. return expired
  34. }

下图展示了删除过期数据的方式

  1. v.time中保存了上一次清理的时间,进而转换为本次wheel[i]的清理起始位置
    image
  2. 在下一次清理时,会在此读取上一次清理的时间,并作为本次wheel[i]的清理起始位置
    ![image-20240418154846844](/Users/charlie.liu/Library/Application Support/typora-user-images/image-20240418154846844.png)
添加数据

添加数据时首先需要找到该数据在Variable.wheel中的位置Variable.wheel[i][j],然后添加到该位置的链表中即可。

在添加数据时需要避免将数据添加到上一次清理点之前

  1. // findBucket determines the bucket that the timer event should be added to.
  2. func (v *Variable[K, V]) findBucket(expiration uint32) node.Node[K, V] {
  3. //expiration是绝对时间。获取距离上一次清理过期数据(包括清理所有数据)所过去的时间,或看做是和起始有效数据的距离。
  4. duration := expiration - v.time
  5. length := len(v.wheel) - 1
  6. for i := 0; i < length; i++ {
  7. //找到duration的最佳超时单位spans[i]
  8. if duration < spans[i+1] {
  9. //计算expiration包含多少个超时单位,并以此作为其在wheel[i]中的位置index。
  10. //expiration >> shift[i]等价于(duration + v.time)>> shift[i],即和起始有效数据的距离
  11. ticks := expiration >> shift[i]
  12. index := ticks & (buckets[i] - 1)
  13. return v.wheel[i][index]
  14. }
  15. }
  16. return v.wheel[length][0] //buckets[4]的长度为1,因此二维索引只有一个值0。
  17. }

Cache的Set & Get

image

Set

添加node时需要同时处理node add/update事件。

  1. func (c *Cache[K, V]) set(key K, value V, expiration uint32, onlyIfAbsent bool) bool {
  2. //限制node的cost大小,过大会占用更多的缓存空间
  3. cost := c.costFunc(key, value)
  4. if int(cost) > c.policy.MaxAvailableCost() {
  5. c.stats.IncRejectedSets()
  6. return false
  7. }
  8. n := c.nodeManager.Create(key, value, expiration, cost)
  9. //只添加不存在的节点
  10. if onlyIfAbsent {
  11. //res == nil说明是新增的node
  12. res := c.hashmap.SetIfAbsent(n)
  13. if res == nil {
  14. // 将node添加事件添加到writeBuffer中
  15. c.writeBuffer.Push(newAddTask(n))
  16. return true
  17. }
  18. c.stats.IncRejectedSets() //如果node存在,则不作任何处理,增加rejected统计
  19. return false
  20. }
  21. //evicted != nil表示对已有node进行了更新,反之则表示新加的node
  22. evicted := c.hashmap.Set(n)
  23. if evicted != nil {
  24. // update,将老节点evicted设置为无效状态,并将node更新事件添加到writeBuffer中
  25. evicted.Die()
  26. c.writeBuffer.Push(newUpdateTask(n, evicted))
  27. } else {
  28. // 将node添加事件添加到writeBuffer中
  29. c.writeBuffer.Push(newAddTask(n))
  30. }
  31. return true
  32. }

Get

Get需要处理删除过期node事件。

  1. // GetNode returns the node associated with the key in this cache.
  2. func (c *Cache[K, V]) GetNode(key K) (node.Node[K, V], bool) {
  3. n, ok := c.hashmap.Get(key)
  4. if !ok || !n.IsAlive() { //不返回非active状态的node
  5. c.stats.IncMisses()
  6. return nil, false
  7. }
  8. //如果node过期,需要将node删除事件添加到writeBuffer中,后续由其他goroutine执行数据删除
  9. if n.HasExpired() {
  10. c.writeBuffer.Push(newDeleteTask(n))
  11. c.stats.IncMisses()
  12. return nil, false
  13. }
  14. //在读取node之后的动作,获取热点node,并增加s3-FIFO node的freq
  15. c.afterGet(n)
  16. //增加命中统计
  17. c.stats.IncHits()
  18. return n, true
  19. }

在成功读取node之后,需要处理热点nodes:

  1. func (c *Cache[K, V]) afterGet(got node.Node[K, V]) {
  2. idx := c.getReadBufferIdx()
  3. //获取热点nodes
  4. pb := c.readBuffers[idx].Add(got)
  5. if pb != nil {
  6. c.evictionMutex.Lock()
  7. //增加nodes的freq
  8. c.policy.Read(pb.Returned)
  9. c.evictionMutex.Unlock()
  10. //已经处理完热点数据,清理存放热点数据的buffer
  11. c.readBuffers[idx].Free()
  12. }
  13. }

另外还有一种获取方法,此方法中不会触发驱逐策略,即不会用到readBufferss3-FIFO

  1. func (c *Cache[K, V]) GetNodeQuietly(key K) (node.Node[K, V], bool) {
  2. n, ok := c.hashmap.Get(key)
  3. if !ok || !n.IsAlive() || n.HasExpired() {
  4. return nil, false
  5. }
  6. return n, true
  7. }

事件和过期数据的处理

otter有两种途径来处理缓存中的数据,一种是通过处理writeBuffer中的事件来对缓存数据进行增删改,另一种是定期清理过期数据。

事件处理

writeBuffer中保存了缓存读写过程中的事件。

需要注意的是hashmap中的数据会按照add/delete操作实时更新,只有涉及到s3-FIFO驱逐的数据才会通过writeBuffer异步更新。

  1. func (c *Cache[K, V]) process() {
  2. bufferCapacity := 64
  3. buffer := make([]task[K, V], 0, bufferCapacity)
  4. deleted := make([]node.Node[K, V], 0, bufferCapacity)
  5. i := 0
  6. for {
  7. //从writeBuffer中获取一个事件
  8. t := c.writeBuffer.Pop()
  9. //调用Cache.Clear()或Cache.Close()时会清理cache。Cache.Clear()和Cache.Close()中都会清理hashmap和readBuffers
  10. //这里清理writebuffer和s3-FIFO
  11. if t.isClear() || t.isClose() {
  12. buffer = clearBuffer(buffer)
  13. c.writeBuffer.Clear()
  14. c.evictionMutex.Lock()
  15. c.policy.Clear()
  16. c.expiryPolicy.Clear()
  17. if t.isClose() {
  18. c.isClosed = true
  19. }
  20. c.evictionMutex.Unlock()
  21. //清理完成
  22. c.doneClear <- struct{}{}
  23. //如果是close则直接退出,否则(clear)会继续处理writeBuffer中的事件
  24. if t.isClose() {
  25. break
  26. }
  27. continue
  28. }
  29. //这里使用了批量处理事件的方式
  30. buffer = append(buffer, t)
  31. i++
  32. if i >= bufferCapacity {
  33. i -= bufferCapacity
  34. c.evictionMutex.Lock()
  35. for _, t := range buffer {
  36. n := t.node()
  37. switch {
  38. case t.isDelete()://删除事件,发生在直接删除数据或数据过期的情况下。删除expiryPolicy,和s3-FIFO中的数据
  39. c.expiryPolicy.Delete(n)
  40. c.policy.Delete(n)
  41. case t.isAdd()://添加事件,发送在新增数据的情况下,将数据添加到expiryPolicy和s3-FIFO中
  42. if n.IsAlive() {
  43. c.expiryPolicy.Add(n)
  44. deleted = c.policy.Add(deleted, n) //添加驱逐数据
  45. }
  46. case t.isUpdate()://更新事件,发生在添加相同key的数据的情况下,此时需删除老数据,并添加活动状态的新数据
  47. oldNode := t.oldNode()
  48. c.expiryPolicy.Delete(oldNode)
  49. c.policy.Delete(oldNode)
  50. if n.IsAlive() {
  51. c.expiryPolicy.Add(n)
  52. deleted = c.policy.Add(deleted, n) //添加驱逐数据
  53. }
  54. }
  55. }
  56. //从expiryPolicy中删除s3-FIFO驱逐的数据
  57. for _, n := range deleted {
  58. c.expiryPolicy.Delete(n)
  59. }
  60. c.evictionMutex.Unlock()
  61. for _, t := range buffer {
  62. switch {
  63. case t.isDelete():
  64. n := t.node()
  65. c.notifyDeletion(n.Key(), n.Value(), Explicit)
  66. case t.isUpdate():
  67. n := t.oldNode()
  68. c.notifyDeletion(n.Key(), n.Value(), Replaced)
  69. }
  70. }
  71. //从hashmap中删除s3-FIFO驱逐的数据
  72. for _, n := range deleted {
  73. c.hashmap.DeleteNode(n)
  74. n.Die()
  75. c.notifyDeletion(n.Key(), n.Value(), Size)
  76. c.stats.IncEvictedCount()
  77. c.stats.AddEvictedCost(n.Cost())
  78. }
  79. buffer = clearBuffer(buffer)
  80. deleted = clearBuffer(deleted)
  81. if cap(deleted) > 3*bufferCapacity {
  82. deleted = make([]node.Node[K, V], 0, bufferCapacity)
  83. }
  84. }
  85. }
  86. }

清理过期数据

image

cleanup是一个单独的goroutine,用于定期处理Cache.hashmap中的过期数据。在调用Cache.Get时会判断并删除(通过向writeBuffer中写入deleteReason事件,由process goroutine异步删除)s3-FIFO(Cache.policy)中的过期数据。

另外无需处理readbuffers中的过期数据,因为从readbuffers读取到热点数据之后,只会增加这些数据的freq,随后会清空存放热点数据的空间,不会对其他组件的数据造成影响。

  1. func (c *Cache[K, V]) cleanup() {
  2. bufferCapacity := 64
  3. expired := make([]node.Node[K, V], 0, bufferCapacity)
  4. for {
  5. time.Sleep(time.Second) //每秒尝试清理一次过期数据
  6. c.evictionMutex.Lock()
  7. if c.isClosed {
  8. return
  9. }
  10. //删除expiryPolicy、policy和hashmap中的过期数据
  11. expired = c.expiryPolicy.RemoveExpired(expired)
  12. for _, n := range expired {
  13. c.policy.Delete(n)
  14. }
  15. c.evictionMutex.Unlock()
  16. for _, n := range expired {
  17. c.hashmap.DeleteNode(n)
  18. n.Die()
  19. c.notifyDeletion(n.Key(), n.Value(), Expired)
  20. }
  21. expired = clearBuffer(expired)
  22. if cap(expired) > 3*bufferCapacity {
  23. expired = make([]node.Node[K, V], 0, bufferCapacity)
  24. }
  25. }
  26. }

Issues

这里还有一些跟作者的互动:

原文链接:https://www.cnblogs.com/charlieroro/p/18128412

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号