leetcode 763. 划分字母区间（greedy）

字符串 \(S\) 由小写字母组成。我们要把这个字符串划分为尽可能多的片段，同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。

输入：S = "ababcbacadefegdehijhklij"
输出：[9,7,8]
解释：
划分结果为 "ababcbaca", "defegde", "hijhklij"。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 的划分是错误的，因为划分的片段数较少。

思路

这道题目是典型的贪心策略，关于贪心一直做的不是很多，思路也不是特别清晰，但是总觉得很神奇。
具体做法如下：

从左到右遍历字符串，遍历的同时维护当前片段的开始下标 \(start\) 和结束下标 \(end\)，初始时 \(start=end=0\)
对于每个访问到的字母 \(c\)，得到当前字母的最后一次出现的下标位置 \(end_c\) ，则当前片段的结束下标一定不会小于 \(end_c\) ，因此令 \(end=max(end,end_c)\)
当访问到下标 \(end\) 时，当前片段访问结束，当前片段的下标范围是 \([start,end]\)，长度为\(end−start+1\)，将当前片段的长度添加到返回值，然后令 \(start=end+1\)，继续寻找下一个片段。
重复上述过程，直到遍历完字符串

上述做法使用贪心的思想寻找每个片段可能的最小结束下标，因此可以保证每个片段的长度一定是符合要求的最短长度，如果取更短的片段，则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段，因此得到的片段数也是最多的

class Solution {
public:
    vector<int> partitionLabels(string S) {
        // greedy
        int pos[26];
        int n = S.size(); 
        for(int i = 0; i < n ; i++){
            pos[S[i] - 'a'] = i;
        }
        int start = 0; int end = 0; 
        vector<int> partition;
        for(int i = 0; i < n ; i++){
            end = max(pos[S[i] - 'a'], end);
            if (end == i){ 
                partition.push_back(end - start + 1);
                start = end + 1; 
            }
        }
        return partition;
    }
};

posted @ 2020-10-22 16:01 wsl-hitsz 阅读(112) 评论(0) 收藏举报

刷新页面返回顶部

wsl-hitsz

leetcode 763. 划分字母区间（greedy）

思路

公告