1898-可移除字符的最大数目
给你两个字符串 s
和 p
,其中 p
是 s
的一个 子序列 。同时,给你一个元素 互不相同 且下标 从 0 开始
计数的整数数组 removable
,该数组是 s
中下标的一个子集(s
的下标也 从 0 开始 计数)。
请你找出一个整数 k
(0 <= k <= removable.length
),选出 removable
中的 前 k
个下标,然后从s
中移除这些下标对应的 k
个字符。整数 k
需满足:在执行完上述步骤后, p
仍然是 s
的一个 子序列
。更正式的解释是,对于每个 0 <= i < k
,先标记出位于 s[removable[i]]
的字符,接着移除所有标记过的字符,然后检查 p
是否仍然是 s
的一个子序列。
返回你可以找出的 最大 __k
__ ,满足在移除字符后 __p
__ 仍然是 s
的一个子序列。
字符串的一个 子序列 是一个由原字符串生成的新字符串,生成过程中可能会移除原字符串中的一些字符(也可能不移除)但不改变剩余字符之间的相对顺序。
示例 1:
**输入:** s = "abcacb", p = "ab", removable = [3,1,0]
**输出:** 2
**解释:** 在移除下标 3 和 1 对应的字符后,"a **b** c **a** cb" 变成 "accb" 。
"ab" 是 " **a** cc **b** " 的一个子序列。
如果移除下标 3、1 和 0 对应的字符后," **ab** c **a** cb" 变成 "ccb" ,那么 "ab" 就不再是 s 的一个子序列。
因此,最大的 k 是 2 。
示例 2:
**输入:** s = "abcbddddd", p = "abcd", removable = [3,2,1,4,5,6]
**输出:** 1
**解释:** 在移除下标 3 对应的字符后,"abc **b** ddddd" 变成 "abcddddd" 。
"abcd" 是 " **abcd** dddd" 的一个子序列。
示例 3:
**输入:** s = "abcab", p = "abc", removable = [0,1,2,3,4]
**输出:** 0
**解释:** 如果移除数组 removable 的第一个下标,"abc" 就不再是 s 的一个子序列。
提示:
1 <= p.length <= s.length <= 105
0 <= removable.length < s.length
0 <= removable[i] < s.length
p
是s
的一个 子字符串s
和p
都由小写英文字母组成removable
中的元素 互不相同
方法一:二分查找转化为判定问题
提示 1
如果移除 removable 中的前 k + 1 个下标后 p 依旧是 s 的子序列,那么移除前 k 个下标后依旧成立。
提示 1 解释
假设移除前 k 个下标后的字符串为 s_k,那么 s_k 可以通过对 s_{k+1 添加一个字符得到,亦即 s_{k+1 是 s_k 的子序列。那么如果 p 是 s_{k+1 的子序列,则它一定也是 s_k 的子序列。
思路与算法
根据 提示 1,p 是否为 s_k 子序列这个判定问题如果对于某个 k 成立,那么它对于 [0, k] 闭区间内的所有整数均成立。这也就说明这个判定问题对于 k 具有二值性。因此我们可以通过二分查找确定使得该判定问题成立的最大的 k。
对于移除 k 个下标时的判定问题,我们引入辅助函数 check}(k) 来判断。
在辅助函数 check}(k) 中,我们可以用数组 state 来维护 s 中的每个字符是否被删除,其中 1 代表未删除,0 代表已删除。我们将 state 的所有元素初始化为 1,随后遍历 removable 中的前 k 个元素并将下标对应的状态置为 0。
而判断 p 是否为 s_k 的子序列,我们可以用双指针的方法从左至右贪心匹配两个子序列的相同字符。在遍历到 s[i] 时,我们需要在 state 中检查该字符是否被删除以决定是否应当尝试匹配。对于相关方法的细节与正确性证明,读者可以参考「392. 判断子序列」的官方题解 。
最终,我们将判定问题的答案作为 check}(k) 的返回值。
代码
1 | class Solution { |
1 | class Solution: |
复杂度分析
时间复杂度:O(n\log n),其中 n 为 s 的长度。我们需要进行 O(\log n) 次二分查找,每次二分查找中,判断是否为子序列的时间复杂度为 O(n)。
空间复杂度:O(n),即为二分查找时 state 数组的空间开销。