leetcode72. Edit Distance(编辑距离)

leetcode discuss 原解析地址

  • 以下为个人翻译方便理解

  • 编辑距离问题是一个经典的动态规划问题。首先定义dp[i][j表示word1[0..i-1]到word2[0..j-1]的最小操作数(即编辑距离)。

  • 状态转换方程有两种情况:边界情况和一般情况,以上表示中 i和j均从1开始(注释:即至少一个字符的字符串向一个字符的字符串转换,0字符到0字符转换编辑距离自然为0)

  • 1.边界情况:将一个字符串转化为空串,很容易看出把word[0...i-1]转化成空串“”至少需要i次操作(注释:i次删除),则其编辑距离为i,即:dp[i][0] = i;dp[0][j] = j.

  • 2.一般情况:转化非空字符串word1[0..i - 1] 为另一非空字符串 word2[0..j - 1],此处问题转化为几个个子问题:假定已知word1[0..i - 2] 到 word2[0..j - 2]的编辑距离, 即dp[i - 1][j - 1],只需考虑word[i - 1] 和 word2[j - 1]
    - 如果 word[i - 1] == word2[j - 1],无需操作即可满足word1[0..i - 1] 与 word2[0..j - 1]相同,则编辑距离dp[i][j] = dp[i - 1][j - 1]
    - 如果 word[i - 1] != word2[j - 1],分为三种子情况:
    - 用 word2[j - 1]替换word1[i - 1],则有 (dp[i][j] = dp[i - 1][j - 1] + 1 (一次操作用于替换));
    - 删除 word1[i - 1] 使得 word1[0..i - 2] = word2[0..j - 1],则有(dp[i][j] = dp[i - 1][j] + 1 (一次操作用于删除));
    - 在word1[0..i - 1] 中插入 word2[j - 1] 使得 word1[0..i - 1] + word2[j - 1] = word2[0..j - 1] ,则有(dp[i][j] = dp[i][j - 1] + 1 (一次操作用于插入)).
    为了保证理解插入和删除带来的细微差别,对于删除,其实是将word1[0..i - 2] 转化成 word2[0..j - 1], 编辑距离是 dp[i - 1][j],之后直接删除word1[i - 1],一次操作,插入也是类似
    (注释:就是由word1[0..i - 2] 编辑转化成 word2[0..j - 1],删除word1[i - 1]两个操作共同完成实现将word1[0..i - 1] 转化成 word2[0..j - 1])

  • 合并规如下:

    • dp[i][0] = i;
    • dp[0][j] = j;
    • dp[i][j] = dp[i - 1][j - 1], if word1[i - 1] = word2[j - 1];
    • dp[i][j] = min(dp[i - 1][j - 1] + 1, dp[i - 1][j] + 1, dp[i][j - 1] + 1)
  • 转化为代码如下
    '''
    class Solution {
    public:
    int minDistance(string word1, string word2) {
    int m = word1.length(), n = word2.length();
    vector<vector > dp(m + 1, vector (n + 1, 0));
    for (int i = 1; i <= m; i++)
    dp[i][0] = i;
    for (int j = 1; j <= n; j++)
    dp[0][j] = j;
    for (int i = 1; i <= m; i++) {
    for (int j = 1; j <= n; j++) {
    if (word1[i - 1] == word2[j - 1])
    dp[i][j] = dp[i - 1][j - 1];
    else dp[i][j] = min(dp[i - 1][j - 1] + 1, min(dp[i][j - 1] + 1, dp[i - 1][j] + 1));
    }
    }
    return dp[m][n];
    }
    };
    '''

  • 你可能会注意到每次更新dp[i][j],我们只需要dp[i - 1][j - 1], dp[i][j - 1], dp[i - 1][j]就行

  • 事实上我们不必维护整个m*n矩阵。相反维护一栏即可,代码空间复杂度降为O(m)或者O(n)取决于你维护的的是矩阵的一行还是一列

  • 优化后代码如下:
    '''
    class Solution {
    public:
    int minDistance(string word1, string word2) {
    int m = word1.length(), n = word2.length();
    vector cur(m + 1, 0);
    for (int i = 1; i <= m; i++)
    cur[i] = i;
    for (int j = 1; j <= n; j++) {
    int pre = cur[0];
    cur[0] = j;
    for (int i = 1; i <= m; i++) {
    int temp = cur[i];
    if (word1[i - 1] == word2[j - 1])
    cur[i] = pre;
    else cur[i] = min(pre + 1, min(cur[i] + 1, cur[i - 1] + 1));
    pre = temp;
    }
    }
    return cur[m];
    }
    };
    '''

posted @ 2016-12-25 17:29  zeroArn  阅读(128)  评论(0)    收藏  举报