LeetCode 周赛上分之旅 #43 计算机科学本质上是数学吗？

⭐️ 本文已收录到 AndroidFamily，技术和职场问题，请关注公众号 [彭旭锐] 和 BaguTree Pro 知识星球提问。

学习数据结构与算法的关键在于掌握问题背后的算法思维框架，你的思考越抽象，它能覆盖的问题域就越广，理解难度也更复杂。在这个专栏里，小彭与你分享每场 LeetCode 周赛的解题报告，一起体会上分之旅。

本文是 LeetCode 上分之旅系列的第 43 篇文章，往期回顾请移步到文章末尾~

LeetCode 双周赛 112

T1. 判断通过操作能否让字符串相等 I（Easy）

标签：模拟

T2. 判断通过操作能否让字符串相等 II（Medium）

标签：模拟、计数、排序

T3. 几乎唯一子数组的最大和（Medium）

标签：滑动窗口、计数

T4. 统计一个字符串的 k 子序列美丽值最大的数目（Hard）

标签：枚举、贪心、排序、乘法原理、组合数

T1. 判断通过操作能否让字符串相等 I（Easy）

https://leetcode.cn/problems/check-if-strings-can-be-made-equal-with-operations-i/

题解（模拟）

因为只能交换距离偶数倍的位置，因此相当于比较两个字符串相同奇偶性下标上的元素是否相等。

写法 1：基于散列表

class Solution {
    fun canBeEqual(s1: String, s2: String): Boolean {
        return setOf(s1[0], s1[2]) == setOf(s2[0], s2[2]) && setOf(s1[1], s1[3]) == setOf(s2[1], s2[3])
    }
}

写法 2：基于字符串

class Solution:
    def checkStrings(self, s1: str, s2: str) -> bool:
        return sorted(s1[0::2]) == sorted(s2[0::2]) and sorted(s1[1::2]) == sorted(s2[1::2])

复杂度分析：

时间复杂度：$O(1)$
空间复杂度：$O(1)$

T2. 判断通过操作能否让字符串相等 II（Medium）

https://leetcode.cn/problems/check-if-strings-can-be-made-equal-with-operations-ii/

题解（模拟）

同上，分别统计奇偶下标上的元素个数是否相等。

写法 1：基于计数；

class Solution {
    fun checkStrings(s1: String, s2: String): Boolean {
        val U = 26
        val cnts = Array(2) { IntArray(U) }
        for ((i, e) in s1.withIndex()) {
            cnts[i % 2][e - 'a']++
        }
        for ((i, e) in s2.withIndex()) {
            cnts[i % 2][e - 'a']--
        }
        return cnts[0].all {it == 0} && cnts[1].all {it == 0}
    }
}

复杂度分析：

时间复杂度：$O(n + U)$ 线性遍历时间与计数时间；
空间复杂度：$O(U)$ 计数数组空间。

写法 2：基于字符串：

class Solution:
    def checkStrings(self, s: str, t: str) -> bool:
        return all(sorted(s[p::2]) == sorted(t[p::2]) for p in range(2))

复杂度分析：

时间复杂度：$O(nlgn)$ 排序时间；
空间复杂度：$O(n)$ 构造字符串空间。

T3. 几乎唯一子数组的最大和（Medium）

https://leetcode.cn/problems/maximum-sum-of-almost-unique-subarray/

题解（滑动窗口 + 计数）

滑动窗口模板题，维护窗口中不同元素的种类数和总和：

class Solution {
    fun maxSum(nums: List<Int>, m: Int, k: Int): Long {
        var cnts = HashMap<Int, Int>()
        var type = 0
        var sum = 0L
        var ret = 0L
        for (j in nums.indices) {
            // 滑入
            cnts[nums[j]] = cnts.getOrDefault(nums[j], 0) + 1
            if (1 == cnts[nums[j]]!!) type++
            sum += nums[j]
            // 滑出
            if (j >= k) {
                val i = j - k
                cnts[nums[i]] = cnts[nums[i]]!! - 1
                if (0 == cnts[nums[i]]) type --
                sum -= nums[i]
            }
            // 记录
            if (j >= k - 1 && type >= m) {
                ret = max(ret, sum)
            }
        }
        return ret
    }
}

复杂度分析：

时间复杂度：$O(n)$ 线性遍历时间；
空间复杂度：$O(n)$ 散列表空间。

T4. 统计一个字符串的 k 子序列美丽值最大的数目（Hard）

https://leetcode.cn/problems/count-k-subsequences-of-a-string-with-maximum-beauty/

问题分析

问题目标： 求所有长为 $k$ 的子序列中美丽值是最大值的子序列数目；
问题要件： 先计算长为 $k$ 的子序列的最大美丽值，再计算满足美丽值是最大值的子序列方案数；
关键信息 1： 子序列要选择不重复的字母；
关键信息 2： 同一个字符在原字符串中的不同位置可以构造不同子序列；
核心变量： $f(c)$ 是字符 $c$ 的出现次数，美丽值是子序列中字符的 $f(c)$ 之和；
边界情况： 既然子序列要选择不重复的字母，那么存在边界情况，当 $k$ > 字符串的字符种类数：那么一定不能构造 $k$ 子序列，返回 $0$。

题解一（暴力枚举 + 乘法原理）

最简单的做法，我们可以枚举所有可能的 $k$ 子序列，并记录出现最大美丽值的方案数，怎么实现呢？

方法 1 - 考虑到子序列需要保留原字符串的顺序，直接的想法是枚举字符串中的每个下标 $s[i]$ 选和不选，但是时间复杂度是 $O(2^n)$ 显然不成立；
方法 2 - 事实上我们不需要从原字符串的角度枚举，而是可以从字符集的角度枚举，那样时间复杂度就可以用乘法原理来优化。比如说 a 的出现次数是 $2$，而 b 的出现次数是 $3$，那么所有 a 与 b 可以构造的子序列方案数就是 2 * 3 = 6。

那么，方法会不会超时呢，我们来简单分析下：

由于字符集的大小 $U$ 最多只有 $26$ 个，那么子序列的方案数最多有 $C_{26}^k$ 个，而由于 $k$ 大于 $U$ 的方案是不存在的，因此合法的方案数最多只有 $C_{U}^{\frac{U}{2}} = C_{26}^{13} = 10400600$ 约等于 $10^7$。只要我们保证求解每个子问题的时间复杂度是 $O(1)$ 的话是可以通过的。

枚举实现：

class Solution {
    fun countKSubsequencesWithMaxBeauty(s: String, k: Int): Int {
        val MOD = 1000000007
        // 计数
        val cnts = HashMap<Char, Int>()
        for (e in s) {
            cnts[e] = cnts.getOrDefault(e, 0) + 1
        }
        val m = cnts.size
        if (m < k) return 0 // 特判
        // 枚举子序列
        val keys = cnts.toList()
        var maxCount = 0L
        var maxF = 0
        // 回溯
        fun count(index: Int, size: Int, curF: Int, curCount: Long) {
            // 终止条件
            if (size == k) {                
                if (curF > maxF) {
                    maxF = curF
                    maxCount = curCount // 更新最大美丽值方案数
                } else if (curF == maxF) {
                    maxCount = (maxCount + curCount) % MOD // 增加方案数
                }
                return
            }
            if (size + m - index < k) return // 剪枝（长度不够）
            for (i in index until m) {
                val (c, cnt) = keys[i]
                count(i + 1, size + 1, curF + cnt, curCount * cnt % MOD /* 乘法原理 */) 
            }
        }
        count(0, 0, 0, 1)
        return maxCount.toInt()
    }
}

复杂度分析：

时间复杂度：$O(C_m^k)$ 其中 $m$ 为字符种类；
空间复杂度：$O(m)$ 散列表空间与递归栈空间。

题解二（排序 + 贪心 + 乘法原理）

考虑 $k = 1$ 的边界情况：

显然需要选择 $f(c)$ 值最大的 $1$ 个字母，如果存在 $m$ 个字母的 $f(c)$ 等于最大值，那么存在 $C_m^1 = m$ 种方案。这说明我们没必要枚举所有字母的子序列：由于子序列中的字符是不重复的，因此 $k$ 子序列必然要选择 $f(c)$ 值最大的 $k$ 个字母，我们可以将字母按照 $f(c)$ 倒序排序，优先取 $f(c)$ 更大的字母。

具体实现上：

我们将字母按照 $f(c)$ 分桶排序，如果桶内字母数量 $K$ 小于等于 $k$，那么桶内元素都需要选择，否则还要计算桶内元素选择 $k$ 个的方案数：

选择桶内所有元素，方案数为 $cnt^K$
选择桶内部分元素，方案数为 $C_K^k · cnt^k$

其中涉及到幂运算，本质是倍增思想：

// 快速幂 x^n
private fun powM(a: Int, b: Int, mod: Int) : Long {
    var x = a.toLong()
    var n = b.toLong()
    var ret = 1L
    while (n > 0L) {
        if (n % 2 == 1L) ret = ret * x % mod
        x = x * x % mod
        n /= 2
    }
    return ret
}

其中涉及到组合数：

计算式：

// 组合数计算公式 O(k)
private fun comb(n: Int, k: Int, mod: Int) : Int {
    var ret = 1L
    for (i in 1 .. k) {
        ret = ret * (n - i + 1) / i % mod
    }
    return ret.toInt()
}

递推式（杨辉三角）：

// 递归 O(n^2)
private fun comb(n: Int, k: Int, mod: Int) : Int {
    if (n == k) {
        return 1
    } else if (k == 1) {
        return n
    } else {
        return (comb(n - 1, k - 1, mod) + comb(n - 1, k, mod)) % mod
    }
}

// 迭代 O(n^2)
private fun comb(n: Int, k: Int, mod: Int) : Int {
    val c = Array(n + 1) { IntArray(n + 1) }
    for (i in 1 .. n) {
        c[i][0] = 1
        c[i][i] = 1
        for (j in 1 until i) {
            c[i][j] = (c[i-1][j] + c[i-1][j-1]) % mod
        }
    }
    return c[n][k]
}

卢卡斯定理：当问题规模很大，且模不太大时使用 Lucas 定理。

// 组合数计算公式
private fun comb(n: Long, k: Long, mod: Int) : Int {
    var n = n
    var ret = 1L
    for (i in 1 .. k) {
        ret = ret * n-- / i % mod
    }
    return ret.toInt()
}

// 卢卡斯定理
fun Lucas(n: Long, k: Long, mod: Int) : Long {
    if (k == 0L) return 1L;
    return (comb(n % mod, k % mod, mod) * Lucas(n / mod, k / mod, mod)) % mod;
}

完整代码：

class Solution {
    fun countKSubsequencesWithMaxBeauty(s: String, k: Int): Int {
        val MOD = 1000000007
        // 计数
        val cnts = HashMap<Char, Int>()
        var maxCnt = 0
        for (e in s) {
            cnts[e] = cnts.getOrDefault(e, 0) + 1
            maxCnt = max(maxCnt, cnts[e]!!)
        }
        val m = cnts.size
        if (m < k) return 0 // 特判
        // 有序集合
        val map = TreeMap<Int, Int>() { c1, c2 -> 
            c2 - c1
        }
        // 二次频率
        for ((_, c) in cnts) {
            map[c] = map.getOrDefault(c, 0) + 1
        }
        val cntCnts = map.toList()
        // println(cntCnts.joinToString())
        // 构造方案
        var ret = 1L
        var leftK = k
        for ((cnt, K) in cntCnts) {
            if (K > leftK) {
                ret = ret * powM(cnt, leftK, MOD) * comb(K, leftK, MOD) % MOD
            } else {
                ret = ret * powM(cnt, K, MOD) % MOD
            }
            leftK -= K
            if (leftK <= 0) break
        }
        return ret.toInt()
    }

    // 组合数计算公式 C_n^k
    private fun comb(n: Int, k: Int, mod: Int) : Int {
        if (n == k) {
            return 1
        } else if (k == 1) {
            return n
        } else {
            return (comb(n - 1, k - 1, mod) + comb(n - 1, k, mod)) % mod
        }
    }

    // 快速幂 x^n
    private fun powM(x_: Int, n_: Int, mod: Int) : Long {
        var x = x_.toLong()
        var n = n_.toLong()
        var ret = 1L
        while (n > 0L) {
            if (n % 2 == 1L) ret = ret * x % mod
            x = x * x % mod
            n /= 2
        }
        return ret
    }
}

Python 中组合数和幂运算可以很方便地使用库函数：

class Solution:
    def countKSubsequencesWithMaxBeauty(self, s: str, k: int) -> int:
        MOD = 10 ** 9 + 7
        ans = 1
        cnt = Counter(Counter(s).values())
        for c, num in sorted(cnt.items(), reverse=True): # 二次计数
            if num >= k:
                return ans * pow(c, k, MOD) * comb(num, k) % MOD
            ans *= pow(c, num, MOD)
            k -= num
        return 0

复杂度分析：

时间复杂度：$O(n + m)$ 主要时间在枚举字符串的环节；
空间复杂度：$O(m)$ 散列表空间。

推荐阅读

LeetCode 上分之旅系列往期回顾：

LeetCode 单周赛第 360 场 · 当 LeetCode 考树上倍增，出题的趋势在变化吗

LeetCode 单周赛第 359 场 · 结合离散化的线性 DP 问题

LeetCode 双周赛第 111 场 · 按部就班地解决动态规划问题

LeetCode 双周赛第 110 场 · 结合排序不等式的动态规划

⭐️ 永远相信美好的事情即将发生，欢迎加入小彭的 Android 交流社群~

posted @ 2023-09-04 12:32 彭旭锐阅读(343) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

pengxurui

掘金签约作者，头条 / 简书优秀作者。这里有 Android 进阶成长路线笔记 & 博客，有志同道合的朋友，加入交流群一起成长。

LeetCode 周赛上分之旅 #43 计算机科学本质上是数学吗？

LeetCode 双周赛 112

T1. 判断通过操作能否让字符串相等 I（Easy）

题解（模拟）

T2. 判断通过操作能否让字符串相等 II（Medium）

题解（模拟）

T3. 几乎唯一子数组的最大和（Medium）

题解（滑动窗口 + 计数）

T4. 统计一个字符串的 k 子序列美丽值最大的数目（Hard）

问题分析

题解一（暴力枚举 + 乘法原理）

题解二（排序 + 贪心 + 乘法原理）

推荐阅读

公告