请你为
最不经常使用(LFU) 缓存算法设计并实现数据结构。
实现 LFUCache
类:
LFUCache(int capacity)
- 用数据结构的容量 capacity
初始化对象
int get(int key)
- 如果键 key
存在于缓存中,则获取键的值,否则返回 -1
。
void put(int key, int value)
- 如果键 key
已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量 capacity
时,则应该在插入新项之前,移除最不经常使用的项。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。
为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。
当一个键首次插入到缓存中时,它的使用计数器被设置为 1
(由于 put 操作)。对缓存中的键执行 get
或 put
操作,使用计数器的值将会递增。
函数 get
和 put
必须以 O(1)
的平均时间复杂度运行。
示例:
**输入:**
["LFUCache", "put", "put", "get", "put", "get", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
**输出:**
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]
**解释:**
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lfu = new LFUCache(2);
lfu.put(1, 1); // cache=[1,_], cnt(1)=1
lfu.put(2, 2); // cache=[2,1], cnt(2)=1, cnt(1)=1
lfu.get(1); // 返回 1
// cache=[1,2], cnt(2)=1, cnt(1)=2
lfu.put(3, 3); // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
// cache=[3,1], cnt(3)=1, cnt(1)=2
lfu.get(2); // 返回 -1(未找到)
lfu.get(3); // 返回 3
// cache=[3,1], cnt(3)=2, cnt(1)=2
lfu.put(4, 4); // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
// cache=[4,3], cnt(4)=1, cnt(3)=2
lfu.get(1); // 返回 -1(未找到)
lfu.get(3); // 返回 3
// cache=[3,4], cnt(4)=1, cnt(3)=3
lfu.get(4); // 返回 4
// cache=[3,4], cnt(4)=2, cnt(3)=3
提示:
1 <= capacity <= 104
0 <= key <= 105
0 <= value <= 109
- 最多调用
2 * 105
次 get
和 put
方法
📺 视频题解
📖 文字题解
方法一:哈希表 + 平衡二叉树
说明
本方法需要使用到「平衡二叉树」。在 C++ 语言中,我们可以直接使用 std::set
类作为平衡二叉树;同样在 Java 语言中,我们可以直接使用 TreeSet
。但是在 Python 语言中,并没有内置的库可以用来模拟平衡二叉树。
思路和算法
首先我们定义缓存的数据结构:
1 2 3 4 5 6 7 8 9 10 11 12
| struct Node { int cnt; int time; int key, value; bool operator< (const Node& rhs) const { return cnt == rhs.cnt ? time < rhs.time : cnt < rhs.cnt; } };
|
其中 cnt
表示缓存使用的频率,time
表示缓存的使用时间,key
和 value
表示缓存的键值。
比较直观的想法就是我们用哈希表 key_table
以键 key
为索引存储缓存,建立一个平衡二叉树 S
来保持缓存根据 (cnt,time)
双关键字由于。在 C++ 中,我们可以使用 STL 提供的 std::set
类,set
背后的实现是红黑树:
对于 get(key)
操作,我们只要查看一下哈希表 key_table
是否有 key
这个键即可,有的话需要同时更新哈希表和集合中该缓存的使用频率以及使用时间,否则返回 -1
。
对于 put(key, value)
操作,首先需要查看 key_table
中是否已有对应的键值。如果有的话操作基本等同于 get(key)
,不同的是需要更新缓存的 value
值。如果没有的话相当于是新插入一个缓存,这时候需要先查看是否达到缓存容量 capacity
,如果达到了的话,需要删除最近最少使用的缓存,即平衡二叉树中最左边的结点,同时删除 key_table
中对应的索引,最后向 key_table
和 S
插入新的缓存信息即可。
[sol1-C++]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68
| struct Node { int cnt, time, key, value;
Node(int _cnt, int _time, int _key, int _value):cnt(_cnt), time(_time), key(_key), value(_value){} bool operator < (const Node& rhs) const { return cnt == rhs.cnt ? time < rhs.time : cnt < rhs.cnt; } }; class LFUCache { int capacity, time; unordered_map<int, Node> key_table; set<Node> S; public: LFUCache(int _capacity) { capacity = _capacity; time = 0; key_table.clear(); S.clear(); } int get(int key) { if (capacity == 0) return -1; auto it = key_table.find(key); if (it == key_table.end()) return -1; Node cache = it -> second; S.erase(cache); cache.cnt += 1; cache.time = ++time; S.insert(cache); it -> second = cache; return cache.value; } void put(int key, int value) { if (capacity == 0) return; auto it = key_table.find(key); if (it == key_table.end()) { if (key_table.size() == capacity) { key_table.erase(S.begin() -> key); S.erase(S.begin()); } Node cache = Node(1, ++time, key, value); key_table.insert(make_pair(key, cache)); S.insert(cache); } else { Node cache = it -> second; S.erase(cache); cache.cnt += 1; cache.time = ++time; cache.value = value; S.insert(cache); it -> second = cache; } } };
|
[sol1-Java]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92
| class LFUCache { int capacity, time; Map<Integer, Node> key_table; TreeSet<Node> S;
public LFUCache(int capacity) { this.capacity = capacity; this.time = 0; key_table = new HashMap<Integer, Node>(); S = new TreeSet<Node>(); } public int get(int key) { if (capacity == 0) { return -1; } if (!key_table.containsKey(key)) { return -1; } Node cache = key_table.get(key); S.remove(cache); cache.cnt += 1; cache.time = ++time; S.add(cache); key_table.put(key, cache); return cache.value; } public void put(int key, int value) { if (capacity == 0) { return; } if (!key_table.containsKey(key)) { if (key_table.size() == capacity) { key_table.remove(S.first().key); S.remove(S.first()); } Node cache = new Node(1, ++time, key, value); key_table.put(key, cache); S.add(cache); } else { Node cache = key_table.get(key); S.remove(cache); cache.cnt += 1; cache.time = ++time; cache.value = value; S.add(cache); key_table.put(key, cache); } } }
class Node implements Comparable<Node> { int cnt, time, key, value;
Node(int cnt, int time, int key, int value) { this.cnt = cnt; this.time = time; this.key = key; this.value = value; }
public boolean equals(Object anObject) { if (this == anObject) { return true; } if (anObject instanceof Node) { Node rhs = (Node) anObject; return this.cnt == rhs.cnt && this.time == rhs.time; } return false; }
public int compareTo(Node rhs) { return cnt == rhs.cnt ? time - rhs.time : cnt - rhs.cnt; }
public int hashCode() { return cnt * 1000000007 + time; } }
|
复杂度分析
方法二:双哈希表
思路和算法
我们定义两个哈希表,第一个 freq_table
以频率 freq
为索引,每个索引存放一个双向链表,这个链表里存放所有使用频率为 freq
的缓存,缓存里存放三个信息,分别为键 key
,值 value
,以及使用频率 freq
。第二个 key_table
以键值 key
为索引,每个索引存放对应缓存在 freq_table
中链表里的内存地址,这样我们就能利用两个哈希表来使得两个操作的时间复杂度均为 $O(1)$。同时需要记录一个当前缓存最少使用的频率 minFreq
,这是为了删除操作服务的。
对于 get(key)
操作,我们能通过索引 key
在 key_table
中找到缓存在 freq_table
中的链表的内存地址,如果不存在直接返回 -1
,否则我们能获取到对应缓存的相关信息,这样我们就能知道缓存的键值还有使用频率,直接返回 key
对应的值即可。
但是我们注意到 get
操作后这个缓存的使用频率加一了,所以我们需要更新缓存在哈希表 freq_table
中的位置。已知这个缓存的键 key
,值 value
,以及使用频率 freq
,那么该缓存应该存放到 freq_table
中 freq + 1
索引下的链表中。所以我们在当前链表中 $O(1)$ 删除该缓存对应的节点,根据情况更新 minFreq
值,然后将其$O(1)$ 插入到 freq + 1
索引下的链表头完成更新。这其中的操作复杂度均为 $O(1)$。你可能会疑惑更新的时候为什么是插入到链表头,这其实是为了保证缓存在当前链表中从链表头到链表尾的插入时间是有序的,为下面的删除操作服务。
对于 put(key, value)
操作,我们先通过索引 key
在 key_table
中查看是否有对应的缓存,如果有的话,其实操作等价于 get(key)
操作,唯一的区别就是我们需要将当前的缓存里的值更新为 value
。如果没有的话,相当于是新加入的缓存,如果缓存已经到达容量,需要先删除最近最少使用的缓存,再进行插入。
先考虑插入,由于是新插入的,所以缓存的使用频率一定是 1
,所以我们将缓存的信息插入到 freq_table
中 1
索引下的列表头即可,同时更新 key_table[key]
的信息,以及更新 minFreq = 1
。
那么剩下的就是删除操作了,由于我们实时维护了 minFreq
,所以我们能够知道 freq_table
里目前最少使用频率的索引,同时因为我们保证了链表中从链表头到链表尾的插入时间是有序的,所以 freq_table[minFreq]
的链表中链表尾的节点即为使用频率最小且插入时间最早的节点,我们删除它同时根据情况更新 minFreq
,整个时间复杂度均为 $O(1)$。
如下图展示了样例的全部操作过程:
<,,,,,,,,,>
[sol2-C++]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
| struct Node { int key, val, freq; Node(int _key,int _val,int _freq): key(_key), val(_val), freq(_freq){} }; class LFUCache { int minfreq, capacity; unordered_map<int, list<Node>::iterator> key_table; unordered_map<int, list<Node>> freq_table; public: LFUCache(int _capacity) { minfreq = 0; capacity = _capacity; key_table.clear(); freq_table.clear(); } int get(int key) { if (capacity == 0) return -1; auto it = key_table.find(key); if (it == key_table.end()) return -1; list<Node>::iterator node = it -> second; int val = node -> val, freq = node -> freq; freq_table[freq].erase(node); if (freq_table[freq].size() == 0) { freq_table.erase(freq); if (minfreq == freq) minfreq += 1; } freq_table[freq + 1].push_front(Node(key, val, freq + 1)); key_table[key] = freq_table[freq + 1].begin(); return val; } void put(int key, int value) { if (capacity == 0) return; auto it = key_table.find(key); if (it == key_table.end()) { if (key_table.size() == capacity) { auto it2 = freq_table[minfreq].back(); key_table.erase(it2.key); freq_table[minfreq].pop_back(); if (freq_table[minfreq].size() == 0) { freq_table.erase(minfreq); } } freq_table[1].push_front(Node(key, value, 1)); key_table[key] = freq_table[1].begin(); minfreq = 1; } else { list<Node>::iterator node = it -> second; int freq = node -> freq; freq_table[freq].erase(node); if (freq_table[freq].size() == 0) { freq_table.erase(freq); if (minfreq == freq) minfreq += 1; } freq_table[freq + 1].push_front(Node(key, value, freq + 1)); key_table[key] = freq_table[freq + 1].begin(); } } };
|
[sol2-Java]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127
| class LFUCache { int minfreq, capacity; Map<Integer, Node> keyTable; Map<Integer, DoublyLinkedList> freqTable;
public LFUCache(int capacity) { this.minfreq = 0; this.capacity = capacity; keyTable = new HashMap<Integer, Node>(); freqTable = new HashMap<Integer, DoublyLinkedList>(); } public int get(int key) { if (capacity == 0) { return -1; } if (!keyTable.containsKey(key)) { return -1; } Node node = keyTable.get(key); int val = node.val, freq = node.freq; freqTable.get(freq).remove(node); if (freqTable.get(freq).size == 0) { freqTable.remove(freq); if (minfreq == freq) { minfreq += 1; } } DoublyLinkedList list = freqTable.getOrDefault(freq + 1, new DoublyLinkedList()); list.addFirst(new Node(key, val, freq + 1)); freqTable.put(freq + 1, list); keyTable.put(key, freqTable.get(freq + 1).getHead()); return val; } public void put(int key, int value) { if (capacity == 0) { return; } if (!keyTable.containsKey(key)) { if (keyTable.size() == capacity) { Node node = freqTable.get(minfreq).getTail(); keyTable.remove(node.key); freqTable.get(minfreq).remove(node); if (freqTable.get(minfreq).size == 0) { freqTable.remove(minfreq); } } DoublyLinkedList list = freqTable.getOrDefault(1, new DoublyLinkedList()); list.addFirst(new Node(key, value, 1)); freqTable.put(1, list); keyTable.put(key, freqTable.get(1).getHead()); minfreq = 1; } else { Node node = keyTable.get(key); int freq = node.freq; freqTable.get(freq).remove(node); if (freqTable.get(freq).size == 0) { freqTable.remove(freq); if (minfreq == freq) { minfreq += 1; } } DoublyLinkedList list = freqTable.getOrDefault(freq + 1, new DoublyLinkedList()); list.addFirst(new Node(key, value, freq + 1)); freqTable.put(freq + 1, list); keyTable.put(key, freqTable.get(freq + 1).getHead()); } } }
class Node { int key, val, freq; Node prev, next;
Node() { this(-1, -1, 0); }
Node(int key, int val, int freq) { this.key = key; this.val = val; this.freq = freq; } }
class DoublyLinkedList { Node dummyHead, dummyTail; int size;
DoublyLinkedList() { dummyHead = new Node(); dummyTail = new Node(); dummyHead.next = dummyTail; dummyTail.prev = dummyHead; size = 0; }
public void addFirst(Node node) { Node prevHead = dummyHead.next; node.prev = dummyHead; dummyHead.next = node; node.next = prevHead; prevHead.prev = node; size++; }
public void remove(Node node) { Node prev = node.prev, next = node.next; prev.next = next; next.prev = prev; size--; }
public Node getHead() { return dummyHead.next; }
public Node getTail() { return dummyTail.prev; } }
|
[sol2-Python3]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68
| class Node: def __init__(self, key, val, pre=None, nex=None, freq=0): self.pre = pre self.nex = nex self.freq = freq self.val = val self.key = key def insert(self, nex): nex.pre = self nex.nex = self.nex self.nex.pre = nex self.nex = nex def create_linked_list(): head = Node(0, 0) tail = Node(0, 0) head.nex = tail tail.pre = head return (head, tail)
class LFUCache: def __init__(self, capacity: int): self.capacity = capacity self.size = 0 self.minFreq = 0 self.freqMap = collections.defaultdict(create_linked_list) self.keyMap = {}
def delete(self, node): if node.pre: node.pre.nex = node.nex node.nex.pre = node.pre if node.pre is self.freqMap[node.freq][0] and node.nex is self.freqMap[node.freq][-1]: self.freqMap.pop(node.freq) return node.key def increase(self, node): node.freq += 1 self.delete(node) self.freqMap[node.freq][-1].pre.insert(node) if node.freq == 1: self.minFreq = 1 elif self.minFreq == node.freq - 1: head, tail = self.freqMap[node.freq - 1] if head.nex is tail: self.minFreq = node.freq
def get(self, key: int) -> int: if key in self.keyMap: self.increase(self.keyMap[key]) return self.keyMap[key].val return -1
def put(self, key: int, value: int) -> None: if self.capacity != 0: if key in self.keyMap: node = self.keyMap[key] node.val = value else: node = Node(key, value) self.keyMap[key] = node self.size += 1 if self.size > self.capacity: self.size -= 1 deleted = self.delete(self.freqMap[self.minFreq][0].nex) self.keyMap.pop(deleted) self.increase(node)
|
复杂度分析