leetcode 763. 划分字母区间(greedy)

字符串 \(S\) 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。

输入:S = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca", "defegde", "hijhklij"。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 的划分是错误的,因为划分的片段数较少。

思路

这道题目是典型的贪心策略,关于贪心一直做的不是很多,思路也不是特别清晰,但是总觉得很神奇。
具体做法如下:

  • 从左到右遍历字符串,遍历的同时维护当前片段的开始下标 \(start\) 和结束下标 \(end\),初始时 \(start=end=0\)
  • 对于每个访问到的字母 \(c\),得到当前字母的最后一次出现的下标位置 \(end_c\) ,则当前片段的结束下标一定不会小于 \(end_c\) ,因此令 \(end=max(end,end_c)\)
  • 当访问到下标 \(end\) 时,当前片段访问结束,当前片段的下标范围是 \([start,end]\),长度为\(end−start+1\),将当前片段的长度添加到返回值,然后令 \(start=end+1\),继续寻找下一个片段。
  • 重复上述过程,直到遍历完字符串

上述做法使用贪心的思想寻找每个片段可能的最小结束下标,因此可以保证每个片段的长度一定是符合要求的最短长度,如果取更短的片段,则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段,因此得到的片段数也是最多的

class Solution {
public:
    vector<int> partitionLabels(string S) {
        // greedy
        int pos[26];
        int n = S.size(); 
        for(int i = 0; i < n ; i++){
            pos[S[i] - 'a'] = i;
        }
        int start = 0; int end = 0; 
        vector<int> partition;
        for(int i = 0; i < n ; i++){
            end = max(pos[S[i] - 'a'], end);
            if (end == i){ 
                partition.push_back(end - start + 1);
                start = end + 1; 
            }
        }
        return partition;
    }
};
posted @ 2020-10-22 16:01  wsl-hitsz  阅读(98)  评论(0编辑  收藏  举报