USACO2025OPEN G 做题记录
USACO2025OPEN G 做题记录
520pts
A. Moo Decomposition
太简单。\(L = 1\) 时倒序枚举串中的 \(\texttt{M}\),用组合数算一下就可以了。\(L > 1\) 时,必须保证每个 \(\texttt{M}\) 对应的 \(\texttt{O}\) 是在它所在的那一段中,所以其实各个段互不影响,答案就是 \(L = 1\) 时的答案的 \(L\) 次方。Code
B. Election Queries
题意可以转化为:给定一个可重数集,把它划分成两个集合,使得两个集合的众数的绝对值之差最大。“众数”定义为出现次数最多的数,如果有多个,则可以任选一个。
考虑对于二元组 \((x, y)\),什么情况下 \(x\) 和 \(y\) 能分别成为两个集合的众数,如果可以,称 \((x, y)\) “合法”。贪心地把所有 \(x\) 放到 \(A\) 中,把所有 \(y\) 放到 \(B\) 中,对于剩下的每个元素 \(c\),我们要使得 \(c\) 在 \(A\) 和 \(B\) 中的出现次数分别都不超过 \(x\) 和 \(y\) 的出现次数。设 \(\operatorname{cnt}(i)\) 表示 \(i\) 的出现次数, \(m\) 是 \(\operatorname{cnt}\) 的最大值,则当 \(\operatorname{cnt}(x) + \operatorname{cnt}(y) \ge m\) 时 \((x, y)\) 才合法。暴力枚举 \((x, y)\) ,就得到了单次询问 \(O(n^2)\) 的做法。
想想怎么优化。我们可以对每个 \(x\),求出最大的 \(y\),满足 \(y < x\) 且 \((x, y)\) 合法。则当 \(\operatorname{cnt}(x) \neq m\) 时,\(y\) 需要满足 \(\operatorname{cnt}(y) \ge m - \operatorname{cnt}(x)\);否则只需满足 \(\operatorname{cnt}(y) > 0\)。这两个情况可以合并写成 \(\operatorname{cnt}(y) \ge m - \operatorname{cnt}(x) + [\operatorname{cnt}(x) = m]\)。记 \(d = m - \operatorname{cnt}(x) + [\operatorname{cnt}(x) = m]\),那么我们就是要找第一个满足 \(\operatorname{cnt}(y) \ge d\) 的 \(y\)。预处理前缀最大值以后二分即可。这样单次询问的时间复杂度就变成了 \(O(n \log n)\)。
Code
#include<bits/stdc++.h>
using namespace std;
int n, q;
vector<int> a, cnt;
int solve() {
int mx = *max_element(cnt.begin() + 1, cnt.end());
vector<int> pre(n + 1);
for(int i = 1; i <= n; i++) {
pre[i] = max(pre[i - 1], cnt[i]);
}
int res = 0;
for(int x = 1; x <= n; x++) {
if(!cnt[x]) continue;
int d = mx - cnt[x] + (cnt[x] == mx);
// 找到最小的 y,满足 cnt[y] >= d
auto it = lower_bound(pre.begin() + 1, pre.begin() + x, d);
if(it == pre.begin() + x) continue;
int y = (int)distance(pre.begin(), it);
res = max(res, x - y);
}
return res;
}
int main() {
cin.tie(nullptr) -> sync_with_stdio(false);
// freopen("x.in", "r", stdin);
cin >> n >> q;
a.resize(n + 1), cnt.resize(n + 1);
for(int i = 1; i <= n; i++) {
cin >> a[i];
cnt[a[i]]++;
}
for(int i = 1, x, y; i <= q; i++) {
cin >> x >> y;
cnt[a[x]]--, cnt[y]++, a[x] = y;
cout << solve() << '\n';
}
return 0;
}
现在我们已经能足够快地求出一组询问的答案,但询问次数太多了,我们可以考虑的方向是:首先预处理出没有修改时的答案,然后对于每次修改,快速地得到修改操作对答案的影响。(我看了题解之后发现)很不幸,这种思路行不通,而且上面那个 \(O(n \log n)\) 的做法对正解的启发性不大。
换一种思路,我们不再以编号为切入点,而以出现次数为切入点。容易发现出现次数相同的元素对于合法性来说是等价的。记 \(s_i\) 表示出现次数为 \(i\) 的元素构成的集合,从小到大枚举 \(i\),设 \(s_i\) 中最大的元素为 \(x\),\(j = m - i\) 是最小的满足 \(i + j \ge m\) 的数,则 \(S = s_j \cup s_{j + 1} \cup \cdots \cup s_{n}\) 中的元素可以和 \(s_{i}\) 中的元素组成合法的二元组。记 \(y\) 是 \(S\) 中的最小元素,用 \(x - y\) 更新答案。
关键的结论在于:由于所有元素的 \(\operatorname{cnt}\) 的和为 \(n\),所以不同的 \(\operatorname{cnt}\) 只有不超过 \(2\sqrt{n}\) 种。我们用 map
维护所有的 \(s_i\),然后在从小到大枚举 \(i\) 的同时用一个反向的指针维护能和 \(s_i\) 配对的集合,同时记录最小值。这样就可以在 \(O(\sqrt{n})\) 的时间内计算答案。(注意枚举 map
中的元素是线性的,查询 set
中元素的最值是 \(O(1)\) 的。)
Code
#include<bits/stdc++.h>
using namespace std;
int n, q;
vector<int> a, cnt;
map<int, set<int>> s;
// s[i] 维护出现次数为 i 的数的集合
int solve() {
int res = 0, m = s.rbegin() -> first;
auto p = s.rbegin();
int y = n + 1;
for(auto it = s.begin(); it != s.end(); it++) {
int i = it -> first;
while(p != s.rend() && (p -> first) + i >= m) {
y = min(y, *(p -> second).begin());
p++;
}
if(p == s.rbegin()) {
continue;
}
int x = *((it -> second).rbegin());
int tmp = x - y;
res = max(res, tmp);
}
return res;
}
int main() {
cin.tie(nullptr) -> sync_with_stdio(false);
cin >> n >> q;
a.resize(n + 1), cnt.resize(n + 1);
for(int i = 1; i <= n; i++) {
cin >> a[i];
cnt[a[i]]++;
}
for(int i = 1; i <= n; i++) {
if(cnt[i]) {
s[cnt[i]].insert(i);
}
}
for(int i = 1, x, y; i <= q; i++) {
cin >> x >> y;
if(a[x] != y) {
s[cnt[a[x]]].erase(a[x]);
if(s[cnt[a[x]]].empty()) {
s.erase(cnt[a[x]]);
}
if(cnt[a[x]] > 1) {
s[cnt[a[x]] - 1].insert(a[x]);
}
if(cnt[y] > 0) {
s[cnt[y]].erase(y);
if(s[cnt[y]].empty()) {
s.erase(cnt[y]);
}
}
s[cnt[y] + 1].insert(y);
cnt[a[x]]--, cnt[y]++, a[x] = y;
}
int ans = solve();
cout << ans << '\n';
}
return 0;
}
C. OohMoo Milk
先转化一下问题。可以发现 John 每次操作前 \(A\) 大的值,Nhoj 每次操作前 \(B\) 大的值,分别是双方的最优策略。综合来看相当于每天选择第 \(B + 1 \sim A\) 大的值操作。暴力模拟是 \(O(D N \log N)\) 的,我们要做的就是加速这个过程。