0828-统计子串中的唯一字符

Raphael Liu Lv10

我们定义了一个函数 countUniqueChars(s) 来统计字符串 s 中的唯一字符,并返回唯一字符的个数。

例如:s = "LEETCODE" ,则其中 "L", "T","C","O","D" 都是唯一字符,因为它们只出现一次,所以
countUniqueChars(s) = 5

本题将会给你一个字符串 s ,我们需要返回 countUniqueChars(t) 的总和,其中 ts
的子字符串。输入用例保证返回值为 32 位整数。

注意,某些子字符串可能是重复的,但你统计时也必须算上这些重复的子字符串(也就是说,你必须统计 s 的所有子字符串中的唯一字符)。

示例 1:

**输入:** s = "ABC"
**输出:** 10
**解释:** 所有可能的子串为:"A","B","C","AB","BC" 和 "ABC"。
     其中,每一个子串都由独特字符构成。
     所以其长度总和为:1 + 1 + 1 + 2 + 2 + 3 = 10

示例 2:

**输入:** s = "ABA"
**输出:** 8
**解释:** 除了 countUniqueChars("ABA") = 1 之外,其余与示例 1 相同。

示例 3:

**输入:** s = "LEETCODE"
**输出:** 92

提示:

  • 1 <= s.length <= 105
  • s 只包含大写英文字符

方法一:分别计算每个字符的贡献

思路

对于下标为 i 的字符 c_i,当它在某个子字符串中仅出现一次时,它会对这个子字符串统计唯一字符时有贡献。只需对每个字符,计算有多少子字符串仅包含该字符一次即可。对于 c_i, 记同字符上一次出现的位置为 c_j,下一次出现的位置为 c_k,那么这样的子字符串就一共有 (c_i - c_j) \times (c_k - c_i) 种,即子字符串的起始位置有 c_j(不含)到 c_i(含)之间这 (c_i - c_j) 种可能,到结束位置有 (c_k - c_i) 种可能。可以预处理 s,将相同字符的下标放入数组中,方便计算。最后对所有字符进行这种计算即可。

代码

[sol1-Python3]
1
2
3
4
5
6
7
8
9
10
11
12
class Solution:
def uniqueLetterString(self, s: str) -> int:
index = collections.defaultdict(list)
for i, c in enumerate(s):
index[c].append(i)

res = 0
for arr in index.values():
arr = [-1] + arr + [len(s)]
for i in range(1, len(arr) - 1):
res += (arr[i] - arr[i - 1]) * (arr[i + 1] - arr[i])
return res
[sol1-C++]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
class Solution {
public:
int uniqueLetterString(string s) {
unordered_map<char, vector<int>> index;
for (int i = 0; i < s.size(); i++) {
index[s[i]].emplace_back(i);
}
int res = 0;
for (auto &&[_, arr]: index) {
arr.insert(arr.begin(), -1);
arr.emplace_back(s.size());
for (int i = 1; i < arr.size() - 1; i++) {
res += (arr[i] - arr[i - 1]) * (arr[i + 1] - arr[i]);
}
}
return res;
}
};
[sol1-Java]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
class Solution {
public int uniqueLetterString(String s) {
Map<Character, List<Integer>> index = new HashMap<Character, List<Integer>>();
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (!index.containsKey(c)) {
index.put(c, new ArrayList<Integer>());
index.get(c).add(-1);
}
index.get(c).add(i);
}
int res = 0;
for (Map.Entry<Character, List<Integer>> entry : index.entrySet()) {
List<Integer> arr = entry.getValue();
arr.add(s.length());
for (int i = 1; i < arr.size() - 1; i++) {
res += (arr.get(i) - arr.get(i - 1)) * (arr.get(i + 1) - arr.get(i));
}
}
return res;
}
}
[sol1-C#]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public class Solution {
public int UniqueLetterString(string s) {
Dictionary<char, IList<int>> index = new Dictionary<char, IList<int>>();
for (int i = 0; i < s.Length; i++) {
if (!index.ContainsKey(s[i])) {
index.Add(s[i], new List<int>());
index[s[i]].Add(-1);
}
index[s[i]].Add(i);
}
int res = 0;
foreach (KeyValuePair<char, IList<int>> pair in index) {
IList<int> arr = pair.Value;
arr.Add(s.Length);
for (int i = 1; i < arr.Count - 1; i++) {
res += (arr[i] - arr[i - 1]) * (arr[i + 1] - arr[i]);
}
}
return res;
}
}
[sol1-C]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
int uniqueLetterString(char * s){
struct ListNode **index = (struct ListNode **)malloc(sizeof(struct ListNode *) * 26);
for (int i = 0; i < 26; i++) {
index[i] = NULL;
}
int len = strlen(s);
for (int i = 0; i < len; i++) {
struct ListNode *node = (struct ListNode *)malloc(sizeof(struct ListNode));
node->val = i;
node->next = index[s[i] - 'A'];
index[s[i] - 'A'] = node;
}
int res = 0;
for (int i = 0; i < 26; i++) {
if (index[i]) {
struct ListNode *curr = index[i];
struct ListNode *prev = NULL;
struct ListNode *next = curr->next;
while (curr) {
if (prev == NULL && next == NULL) {
res += (curr->val + 1) * (len - curr->val);
} else if (prev == NULL) {
res += (curr->val - next->val) * (len - curr->val);
} else if (next == NULL) {
res += (curr->val + 1) * (prev->val - curr->val);
} else {
res += (curr->val - next->val) * (prev->val - curr->val);
}
prev = curr;
curr = curr->next;
if (next) {
next = next->next;
}
}
}
}
for (int i = 0; i < 26; i++) {
if (index[i]) {
struct ListNode *curr = NULL, *tmp = NULL;
for (curr = index[i]; curr; ) {
tmp = curr;
curr = curr->next;
free(tmp);
}
}
}
return res;
}
[sol1-JavaScript]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
var uniqueLetterString = function(s) {
const index = new Map();
for (let i = 0; i < s.length; i++) {
const c = s[i];
if (!index.has(c)) {
index.set(c, []);
index.get(c).push(-1);
}
index.get(c).push(i);
}
let res = 0;
for (const [_, arr] of index.entries()) {
arr.push(s.length);
for (let i = 1; i < arr.length - 1; i++) {
res += (arr[i] - arr[i - 1]) * (arr[i + 1] - arr[i]);
}
}
return res;
};
[sol1-Golang]
1
2
3
4
5
6
7
8
9
10
11
12
13
func uniqueLetterString(s string) (ans int) {
idx := map[rune][]int{}
for i, c := range s {
idx[c] = append(idx[c], i)
}
for _, arr := range idx {
arr = append(append([]int{-1}, arr...), len(s))
for i := 1; i < len(arr)-1; i++ {
ans += (arr[i] - arr[i-1]) * (arr[i+1] - arr[i])
}
}
return
}

复杂度分析

  • 时间复杂度:O(n),其中 n 是 s 的长度。每个下标会被计算一次。

  • 空间复杂度:O(n),哈希表占用 O(n) 空间。

 Comments
On this page
0828-统计子串中的唯一字符