1898-可移除字符的最大数目

Raphael Liu Lv10

给你两个字符串 sp ,其中 ps 的一个 子序列 。同时,给你一个元素 互不相同 且下标 从 0 开始
计数的整数数组 removable ,该数组是 s 中下标的一个子集(s 的下标也 从 0 开始 计数)。

请你找出一个整数 k0 <= k <= removable.length),选出 removable 中的 k 个下标,然后从
s 中移除这些下标对应的 k 个字符。整数 k 需满足:在执行完上述步骤后, p 仍然是 s 的一个 子序列
。更正式的解释是,对于每个 0 <= i < k ,先标记出位于 s[removable[i]] 的字符,接着移除所有标记过的字符,然后检查 p
是否仍然是 s 的一个子序列。

返回你可以找出的 最大 __k __ ,满足在移除字符后 __p __ 仍然是 s 的一个子序列。

字符串的一个 子序列 是一个由原字符串生成的新字符串,生成过程中可能会移除原字符串中的一些字符(也可能不移除)但不改变剩余字符之间的相对顺序。

示例 1:

**输入:** s = "abcacb", p = "ab", removable = [3,1,0]
**输出:** 2
**解释:** 在移除下标 3 和 1 对应的字符后,"a **b** c **a** cb" 变成 "accb" 。
"ab" 是 " **a** cc **b** " 的一个子序列。
如果移除下标 3、1 和 0 对应的字符后," **ab** c **a** cb" 变成 "ccb" ,那么 "ab" 就不再是 s 的一个子序列。
因此,最大的 k 是 2 。

示例 2:

**输入:** s = "abcbddddd", p = "abcd", removable = [3,2,1,4,5,6]
**输出:** 1
**解释:** 在移除下标 3 对应的字符后,"abc **b** ddddd" 变成 "abcddddd" 。
"abcd" 是 " **abcd** dddd" 的一个子序列。

示例 3:

**输入:** s = "abcab", p = "abc", removable = [0,1,2,3,4]
**输出:** 0
**解释:** 如果移除数组 removable 的第一个下标,"abc" 就不再是 s 的一个子序列。

提示:

  • 1 <= p.length <= s.length <= 105
  • 0 <= removable.length < s.length
  • 0 <= removable[i] < s.length
  • ps 的一个 子字符串
  • sp 都由小写英文字母组成
  • removable 中的元素 互不相同

方法一:二分查找转化为判定问题

提示 1

如果移除 removable 中的前 k + 1 个下标后 p 依旧是 s 的子序列,那么移除前 k 个下标后依旧成立。

提示 1 解释

假设移除前 k 个下标后的字符串为 s_k,那么 s_k 可以通过对 s_{k+1 添加一个字符得到,亦即 s_{k+1 是 s_k 的子序列。那么如果 p 是 s_{k+1 的子序列,则它一定也是 s_k 的子序列。

思路与算法

根据 提示 1,p 是否为 s_k 子序列这个判定问题如果对于某个 k 成立,那么它对于 [0, k] 闭区间内的所有整数均成立。这也就说明这个判定问题对于 k 具有二值性。因此我们可以通过二分查找确定使得该判定问题成立的最大的 k。

对于移除 k 个下标时的判定问题,我们引入辅助函数 check}(k) 来判断。

在辅助函数 check}(k) 中,我们可以用数组 state 来维护 s 中的每个字符是否被删除,其中 1 代表未删除,0 代表已删除。我们将 state 的所有元素初始化为 1,随后遍历 removable 中的前 k 个元素并将下标对应的状态置为 0。

而判断 p 是否为 s_k 的子序列,我们可以用双指针的方法从左至右贪心匹配两个子序列的相同字符。在遍历到 s[i] 时,我们需要在 state 中检查该字符是否被删除以决定是否应当尝试匹配。对于相关方法的细节与正确性证明,读者可以参考「392. 判断子序列」的官方题解

最终,我们将判定问题的答案作为 check}(k) 的返回值。

代码

[sol1-C++]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
class Solution {
public:
int maximumRemovals(string s, string p, vector<int>& removable) {
int ns = s.size();
int np = p.size();
int n = removable.size();
// 辅助函数,用来判断移除 k 个下标后 p 是否是 s_k 的子序列
auto check = [&](int k) -> bool {
vector<int> state(ns, 1); // s 中每个字符的状态
for (int i = 0; i < k; ++i){
state[removable[i]] = 0;
}
// 匹配 s_k 与 p
int j = 0;
for (int i = 0; i < ns; ++i){
// s[i] 未被删除且与 p[j] 相等时,匹配成功,增加 j
if (state[i] && s[i] == p[j]){
++j;
if (j == np){
return true;
}
}
}
return false;
};

// 二分查找
int l = 0;
int r = n + 1;
while (l < r){
int mid = l + (r - l) / 2;
if (check(mid)){
l = mid + 1;
}
else{
r = mid;
}
}
return l - 1;

}
};
[sol1-Python3]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class Solution:
def maximumRemovals(self, s: str, p: str, removable: List[int]) -> int:
ns, np = len(s), len(p)
n = len(removable)
# 辅助函数,用来判断移除 k 个下标后 p 是否是 s_k 的子序列
def check(k: int) -> bool:
state = [True] * ns # s 中每个字符的状态
for i in range(k):
state[removable[i]] = False
# 匹配 s_k 与 p
j = 0
for i in range(ns):
# s[i] 未被删除且与 p[j] 相等时,匹配成功,增加 j
if state[i] and s[i] == p[j]:
j += 1
if j == np:
return True
return False

# 二分查找
l, r = 0, n + 1
while l < r:
mid = l + (r - l) // 2
if check(mid):
l = mid + 1
else:
r = mid
return l - 1

复杂度分析

  • 时间复杂度:O(n\log n),其中 n 为 s 的长度。我们需要进行 O(\log n) 次二分查找,每次二分查找中,判断是否为子序列的时间复杂度为 O(n)。

  • 空间复杂度:O(n),即为二分查找时 state 数组的空间开销。

 Comments
On this page
1898-可移除字符的最大数目