【算法题】字符串单词拆分

题目：

给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict，判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。

说明：

拆分时可以重复使用字典中的单词。
你可以假设字典中没有重复的单词。

示例 1：

输入: s = "leetcode", wordDict = ["leet", "code"]
输出: true
解释: 返回 true 因为 "leetcode" 可以被拆分成 "leet code"。

示例 2：

输入: s = "applepenapple", wordDict = ["apple", "pen"]
输出: true
解释: 返回 true 因为 "applepenapple" 可以被拆分成 "apple pen apple"。
     注意你可以重复使用字典中的单词。

示例 3：

输入: s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]
输出: false

解题：

题目的要求就是，一个字符串必须刚好被分为几个单词且这几个单词都在词典里，像实例3那样子交叉着是不行的，要独立分出来，其实这样就反而简单了呢。

假如有一个字符串是“youarelovely”，作为一个普通人，先想到是从头开始找第一个字典里的单词，也就是you；

然后再找发现are在字典里，而are前面的you也被确认过了，那么l以前的都在字典里可查；

再接着看，发现lovely也在字典里，而且e及以前的都被确认存在了，那么y及以前的都在字典里可查；

y之后没有了，返回y记录，发现是true，说明这整个字符串在字典里都有迹可循，完工。

以上就是一个动态规划的办法，动态规划需要有一个规则，也就是什么时候赋什么值。明明同学查了一个新词儿是对的，而且这个词儿之前的老词儿都对，那么新词儿及以前的都对，查后面的就行了。设置一个dp一维数组，当前字母及以前的内容都符合，设为true，如果0到i的之前都被确认过存在，而且i到j的刚刚确定存在，则可以说j及以前的都在词典里符合要求。

PS：注意注意！dp[0]要设为true，因为要考虑整个字符串是一个单词的情况时，该单词前面的词儿为空，空气无处不在所以也一定能够在词典里找到（跑火车了）。。。其实是因为dp[i]表示的是i以前字符串是否符合要求，不包括i，因此为了让最后一个字符有存在感，dp长度要设为字符串长度+1。而dp[0]表示的是0以前位置的内容，为了符合if语句（前面的部分为真且后面的部分也可查）要设置为true。

Python3代码：

class Solution:
    def wordBreak(self, s: str, wordDict: List[str]) -> bool:
        n=len(s)
        dp=[False]*(n+1)
        dp[0]=True
        for i in range(n):
            for j in range(i+1,n+1):
                if(dp[i] and (s[i:j]in wordDict)):
                    dp[j]=True
        return dp[-1]

Java代码

class Solution {
    public boolean wordBreak(String s, List<String> wordDict) {
        int len=s.length();
        boolean[] dp=new boolean[len+1];
        dp[0]=true;
        HashSet<String> set=new HashSet<>();//为了快速查字典，放到一个无重复的集合里
        for(String str:wordDict){
            set.add(str);
        }
        for(int i=0;i<len;i++){
            for(int j=i;j<len;j++){
                if(dp[i] && set.contains(s.substring(i,j+1)))//前面的都可查，后面一段也可查
                    dp[j+1]=true;
            }
        }
        return dp[len];
    }
}

力扣139题：https://leetcode-cn.com/problems/word-break/

HARD版本题目

单词拆分 II

给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict，在字符串中增加空格来构建一个句子，使得句子中所有的单词都在词典中。返回所有这些可能的句子。

说明：

分隔时可以重复使用字典中的单词。
你可以假设字典中没有重复的单词。

示例 1：

输入:
s = "catsanddog"
wordDict = ["cat", "cats", "and", "sand", "dog"]
输出:
[
  "cats and dog",
  "cat sand dog"
]

让把给的一串字母自己切分，使得每一个部分都在字典里面。
以示例为例思考一下：
还是用之前求的dp，从前面一个个词切还是后面呢？
当dp[i]=true而且i~j部分的词在字典里，就从i砍一刀，分为两个词，然后就该从j开始了，怎么知道j到哪里是一个词呢？
毕竟dp保存的是从0到当前这一整段里都能在字典中找到，可能是一个词也可能是多个，完了，j所在的词儿如果正好在字符串中间，前后都有若干个词，凉凉。
因此，鸡贼的我们要从后往前切。
如果dp[i]=true而且i到end的词可以查到，那么就果断在i砍一刀，然后把最后这个词加入一个list中，就不管i后面的了，对0~i的部分做同样操作，把end设置为i。
直到end=0，无处可砍事已至此，一种切分情况完整保存。
当然根据例子看，有很多种情况，这些路线在我们一个一个动i的时候就能分出来让它们自己砍，没错，又要递归了，就是那永远迷迷糊糊的递归。
这道题科学来讲是“动态规划+回溯”。先得到每个字符位置以前是否合法，也就是dp数组，再从后往前倒着走，每次都在之前算好的合法点切开。

Java代码：

class Solution {
    LinkedList<String> stack=new LinkedList<>();
    ArrayList<String> list=new ArrayList<>();
    public List<String> wordBreak(String s, List<String> wordDict) {
        int len=s.length();
        boolean[] dp=new boolean[len+1];
        dp[0]=true;
        Set<String> set=new HashSet<>();
        for(String str:wordDict){
            set.add(str);
        }
        for(int i=0;i<len;i++){
            if(set.contains(s.substring(0,i+1)))dp[i+1]=true;
        }

       //这里用了小巧思：想求dp[j]，
       // 只要j以前能有一种切法符合单词都可查就可以break了，
　　    //之后继续去求dp[j+1]
        for(int j=1;j<=len;j++){
            for(int i=0;i<j;i++){
                if(dp[i] && set.contains(s.substring(i,j))) {
                    dp[j]=true;
                    break;
                }
            }
        }
        solution(s,len-1,dp,set);
        return list;
        
    }
    public void solution(String s,int end,boolean[] dp,Set<String> set){
        if(end<0){
            StringBuilder nsbr=new StringBuilder();
            for(String n:stack){
                nsbr.append(n+" ");
            }
            nsbr.deleteCharAt(nsbr.length()-1);
            list.add(nsbr.toString());
        }
        for(int i=0;i<=end;i++){
            if(dp[i]){
　　　　         //i前面的都合法，那么只要最后一个单词（i~end）也合法就可以切
                String last=s.substring(i,end+1);
                if(set.contains(last)){
                    stack.addFirst(last);
                    solution(s,i-1,dp,set);
　　　　             //用的是同一个容器，因此当运行到这里时就代表切last的路线已完成
　　　　             //把last移除，再去找其它的切法
                    stack.removeFirst();
                }
            }
        }
    }
}

Python代码：

from collections import deque
class Solution:
    def wordBreak(self, s: str, wordDict: List[str]) -> List[str]:
        size = len(s)
        assert size > 0
        word_set = {word for word in wordDict}
        dp = [0 for _ in range(size + 1)]#0~size
        dp[0] = 1

        for i in range(1, size + 1):#i: 1~size
            for j in range(i):#j: 0~i-1
                if dp[j] and s[j:i] in word_set:#0~j-1 true; j~i-1 in
                    dp[i] = 1
                    break

        res = []
        queue = deque()
        self.__dfs(s, size, word_set, res, queue, dp)
        return res

    def __dfs(self, s, end, word_set, res, queue, dp):
        if end == 0:
            res.append(' '.join(queue))
            return
        for i in range(end): #0~end-1
            if dp[i]:  #0~i-1 true
                suffix = s[i:end] #i~end-1
                if suffix in word_set:
                    queue.appendleft(suffix)
                    self.__dfs(s, i, word_set, res, queue, dp) #0~i-1
                    queue.popleft()

https://leetcode-cn.com/problems/word-break-ii/

posted @ 2020-04-04 00:25 盖世阿萌阅读(985) 评论(0) 收藏举报

刷新页面返回顶部

无力明明

在java路上摸爬滚打的菜鸟美少女

【算法题】字符串单词拆分

解题：

公告