2080-区间内查询数字的频率
请你设计一个数据结构,它能求出给定子数组内一个给定值的 频率 。
子数组中一个值的 频率 指的是这个子数组中这个值的出现次数。
请你实现 RangeFreqQuery
类:
RangeFreqQuery(int[] arr)
用下标从 0 开始的整数数组arr
构造一个类的实例。int query(int left, int right, int value)
返回子数组arr[left...right]
中value
的 频率 。
一个 子数组 指的是数组中一段连续的元素。arr[left...right]
指的是 nums
中包含下标 left
和 right
在内 的中间一段连续元素。
示例 1:
**输入:**
["RangeFreqQuery", "query", "query"]
[[[12, 33, 4, 56, 22, 2, 34, 33, 22, 12, 34, 56]], [1, 2, 4], [0, 11, 33]]
**输出:**
[null, 1, 2]
**解释:**
RangeFreqQuery rangeFreqQuery = new RangeFreqQuery([12, 33, 4, 56, 22, 2, 34, 33, 22, 12, 34, 56]);
rangeFreqQuery.query(1, 2, 4); // 返回 1 。4 在子数组 [33, 4] 中出现 1 次。
rangeFreqQuery.query(0, 11, 33); // 返回 2 。33 在整个子数组中出现 2 次。
提示:
1 <= arr.length <= 105
1 <= arr[i], value <= 104
0 <= left <= right < arr.length
- 调用
query
不超过105
次。
方法一:哈希表 + 二分查找
思路与算法
我们假设数组 arr 的长度为 n。对于单次查询,一种朴素的方法是遍历数组下标在闭区间 [\textit{left}, \textit{right}] 内的所有数,维护目标数 value 的出现次数,但这样的时间复杂度为 O(n),假设查询总数为 q,则总时间复杂度为 O(nq),这样的复杂度无法通过本题。因此我们需要优化单次查询的时间复杂度。
我们可以将单次查询分解为两个部分:
第一步,得到目标数 value 在数组 arr 中出现的所有下标;
第二步,在这些下标中计算位于闭区间 [\textit{left}, \textit{right}] 的下标个数并返回。
对于第一步,由于在本题中数组 arr 在生成后不会发生改变,因此我们可以预处理数组中每个数的出现下标,并对于每个数用相应数组维护。同时,为了优化查询每个数对应下标的时间复杂度,我们可以用数值为键,对应下标数组为值的哈希表来维护。这样,我们可以在 RangeFreqQuery 类初始化时,以 O(n) 的时间复杂度完成哈希表的初始化,并在每次查询时以 O(1) 的时间复杂度查询到该数值对应的(如有)下标数组。
对于第二步,只要我们可以保证下标数组的有序性,就可以利用两次二分查找,O(\log n) 的时间复杂度下计算出位于闭区间 [\textit{left}, \textit{right}] 的下标个数。事实上,只需要我们在第一步中提到的初始化过程中,顺序遍历数组 arr,并始终将新的下标放入对应下标数组的末尾,那么哈希表中所有的下标数组都可以保证有序。
根据上文的分析,我们首先在 RangeFreqQuery 类初始化时建立以数值为键,对应出现下标数组为值的哈希表 occurence,随后顺序遍历数组 arr,将数值与对应下标加入哈希表。具体地:
如果该数值不存在,我们在哈希表 occurence 中建立该数值为键,空数组为值的键值对,并将当前下标加入该空数组末尾;
如果该数值存在,我们直接将当前下标加入该数值在 occurence 中对应的下标数组的末尾。
处理每次查询时,我们首先检查目标数 value 是否存在于哈希表中:如果不存在,则出现次数为 0;如果存在,则我们通过两次二分查找寻找到数组中第一个大于等于 left 的位置 l 与第一个大于 right 的位置 r,此时 r - l 即为符合要求的下标个数(子数组中目标数的出现次数),我们返回该数作为答案。
代码
1 | class RangeFreqQuery { |
1 | class RangeFreqQuery: |
复杂度分析
时间复杂度:O(n + q \log n),其中 n 为 arr 的长度, q 为调用 query 的次数。初始化哈希表的时间复杂度为 O(n),每次查询的时间复杂度为 O(\log n)。
空间复杂度:O(n),即为哈希表的空间开销。