给你两个整数数组 nums1
和 nums2
,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。
示例 1:
**输入:** nums1 = [1,2,2,1], nums2 = [2,2]
**输出:** [2,2]
示例 2:
**输入:** nums1 = [4,9,5], nums2 = [9,4,9,8,4]
**输出:** [4,9]
提示:
1 <= nums1.length, nums2.length <= 1000
0 <= nums1[i], nums2[i] <= 1000
进阶 :
- 如果给定的数组已经排好序呢?你将如何优化你的算法?
- 如果
nums1
_ _ 的大小比 nums2
小,哪种方法更优?
- 如果
nums2
_ _ 的元素存储在磁盘上,内存是有限的,并且你不能一次加载所有的元素到内存中,你该怎么办?
📺 视频题解
📖 文字题解
方法一:哈希表
由于同一个数字在两个数组中都可能出现多次,因此需要用哈希表存储每个数字出现的次数。对于一个数字,其在交集中出现的次数等于该数字在两个数组中出现次数的最小值。
首先遍历第一个数组,并在哈希表中记录第一个数组中的每个数字以及对应出现的次数,然后遍历第二个数组,对于第二个数组中的每个数字,如果在哈希表中存在这个数字,则将该数字添加到答案,并减少哈希表中该数字出现的次数。
为了降低空间复杂度,首先遍历较短的数组并在哈希表中记录每个数字以及对应出现的次数,然后遍历较长的数组得到交集。
[sol1-Java]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
| class Solution { public int[] intersect(int[] nums1, int[] nums2) { if (nums1.length > nums2.length) { return intersect(nums2, nums1); } Map<Integer, Integer> map = new HashMap<Integer, Integer>(); for (int num : nums1) { int count = map.getOrDefault(num, 0) + 1; map.put(num, count); } int[] intersection = new int[nums1.length]; int index = 0; for (int num : nums2) { int count = map.getOrDefault(num, 0); if (count > 0) { intersection[index++] = num; count--; if (count > 0) { map.put(num, count); } else { map.remove(num); } } } return Arrays.copyOfRange(intersection, 0, index); } }
|
[sol1-C++]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
| class Solution { public: vector<int> intersect(vector<int>& nums1, vector<int>& nums2) { if (nums1.size() > nums2.size()) { return intersect(nums2, nums1); } unordered_map <int, int> m; for (int num : nums1) { ++m[num]; } vector<int> intersection; for (int num : nums2) { if (m.count(num)) { intersection.push_back(num); --m[num]; if (m[num] == 0) { m.erase(num); } } } return intersection; } };
|
[sol1-Python3]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| class Solution: def intersect(self, nums1: List[int], nums2: List[int]) -> List[int]: if len(nums1) > len(nums2): return self.intersect(nums2, nums1) m = collections.Counter() for num in nums1: m[num] += 1 intersection = list() for num in nums2: if (count := m.get(num, 0)) > 0: intersection.append(num) m[num] -= 1 if m[num] == 0: m.pop(num) return intersection
|
[sol1-Golang]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| func intersect(nums1 []int, nums2 []int) []int { if len(nums1) > len(nums2) { return intersect(nums2, nums1) } m := map[int]int{} for _, num := range nums1 { m[num]++ }
intersection := []int{} for _, num := range nums2 { if m[num] > 0 { intersection = append(intersection, num) m[num]-- } } return intersection }
|
复杂度分析
时间复杂度:$O(m+n)$,其中 $m$ 和 $n$ 分别是两个数组的长度。需要遍历两个数组并对哈希表进行操作,哈希表操作的时间复杂度是 $O(1)$,因此总时间复杂度与两个数组的长度和呈线性关系。
空间复杂度:$O(\min(m,n))$,其中 $m$ 和 $n$ 分别是两个数组的长度。对较短的数组进行哈希表的操作,哈希表的大小不会超过较短的数组的长度。为返回值创建一个数组 intersection
,其长度为较短的数组的长度。
方法二:排序 + 双指针
如果两个数组是有序的,则可以使用双指针的方法得到两个数组的交集。
首先对两个数组进行排序,然后使用两个指针遍历两个数组。
初始时,两个指针分别指向两个数组的头部。每次比较两个指针指向的两个数组中的数字,如果两个数字不相等,则将指向较小数字的指针右移一位,如果两个数字相等,将该数字添加到答案,并将两个指针都右移一位。当至少有一个指针超出数组范围时,遍历结束。
[sol2-Java]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| class Solution { public int[] intersect(int[] nums1, int[] nums2) { Arrays.sort(nums1); Arrays.sort(nums2); int length1 = nums1.length, length2 = nums2.length; int[] intersection = new int[Math.min(length1, length2)]; int index1 = 0, index2 = 0, index = 0; while (index1 < length1 && index2 < length2) { if (nums1[index1] < nums2[index2]) { index1++; } else if (nums1[index1] > nums2[index2]) { index2++; } else { intersection[index] = nums1[index1]; index1++; index2++; index++; } } return Arrays.copyOfRange(intersection, 0, index); } }
|
[sol2-C++]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| class Solution { public: vector<int> intersect(vector<int>& nums1, vector<int>& nums2) { sort(nums1.begin(), nums1.end()); sort(nums2.begin(), nums2.end()); int length1 = nums1.size(), length2 = nums2.size(); vector<int> intersection; int index1 = 0, index2 = 0; while (index1 < length1 && index2 < length2) { if (nums1[index1] < nums2[index2]) { index1++; } else if (nums1[index1] > nums2[index2]) { index2++; } else { intersection.push_back(nums1[index1]); index1++; index2++; } } return intersection; } };
|
[sol2-Python3]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| class Solution: def intersect(self, nums1: List[int], nums2: List[int]) -> List[int]: nums1.sort() nums2.sort()
length1, length2 = len(nums1), len(nums2) intersection = list() index1 = index2 = 0 while index1 < length1 and index2 < length2: if nums1[index1] < nums2[index2]: index1 += 1 elif nums1[index1] > nums2[index2]: index2 += 1 else: intersection.append(nums1[index1]) index1 += 1 index2 += 1 return intersection
|
[sol2-Golang]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| func intersect(nums1 []int, nums2 []int) []int { sort.Ints(nums1) sort.Ints(nums2) length1, length2 := len(nums1), len(nums2) index1, index2 := 0, 0
intersection := []int{} for index1 < length1 && index2 < length2 { if nums1[index1] < nums2[index2] { index1++ } else if nums1[index1] > nums2[index2] { index2++ } else { intersection = append(intersection, nums1[index1]) index1++ index2++ } } return intersection }
|
[sol2-C]1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
| int cmp(const void* _a, const void* _b) { int *a = _a, *b = (int*)_b; return *a == *b ? 0 : *a > *b ? 1 : -1; }
int* intersect(int* nums1, int nums1Size, int* nums2, int nums2Size, int* returnSize) { qsort(nums1, nums1Size, sizeof(int), cmp); qsort(nums2, nums2Size, sizeof(int), cmp); *returnSize = 0; int* intersection = (int*)malloc(sizeof(int) * fmin(nums1Size, nums2Size)); int index1 = 0, index2 = 0; while (index1 < nums1Size && index2 < nums2Size) { if (nums1[index1] < nums2[index2]) { index1++; } else if (nums1[index1] > nums2[index2]) { index2++; } else { intersection[(*returnSize)++] = nums1[index1]; index1++; index2++; } } return intersection; }
|
复杂度分析
时间复杂度:$O(m \log m+n \log n)$,其中 $m$ 和 $n$ 分别是两个数组的长度。对两个数组进行排序的时间复杂度是 $O(m \log m+n \log n)$,遍历两个数组的时间复杂度是 $O(m+n)$,因此总时间复杂度是 $O(m \log m+n \log n)$。
空间复杂度:$O(\min(m,n))$,其中 $m$ 和 $n$ 分别是两个数组的长度。为返回值创建一个数组 intersection
,其长度为较短的数组的长度。不过在 C++ 中,我们可以直接创建一个 vector
,不需要把答案临时存放在一个额外的数组中,所以这种实现的空间复杂度为 $O(1)$。
结语
如果 nums}_2$ 的元素存储在磁盘上,磁盘内存是有限的,并且你不能一次加载所有的元素到内存中。那么就无法高效地对 nums}_2$ 进行排序,因此推荐使用方法一而不是方法二。在方法一中,nums}_2$ 只关系到查询操作,因此每次读取 nums}_2$ 中的一部分数据,并进行处理即可。