碎片装箱问题的贪心下界

装箱问题是这样一个问题：有 \(n\) 个物品，大小分别为 \(s_1,s_2,\ldots,s_n\)，其中 \(0 < s_i \le 1\)，每个箱子的容量为 \(1\)，目标是把所有物品放进若干箱子，使得每个箱子内物品大小之和不超过 \(1\)，并最小化箱子数量。

这个问题很适合讲近似算法。它足够简单，简单到你可以在十分钟内写出好几个贪心版本；但它也足够刁钻，刁钻到“看起来很合理”的策略会在某些输入上稳定翻车。

这是一个 NP-hard 问题

严格地说，优化版本的 Bin Packing 是 NP-hard；对应的判定版本是：给定物品大小和整数 \(B\)，是否能用不超过 \(B\) 个箱子装下所有物品？这个判定版本属于 NP，因为验证答案显然很简单。而证明 NP-hard 可以从 Partition 问题归约。

Partition 的输入是一组正整数 \(a_1,a_2,\ldots,a_n\)，它们的总和为 \(2T\)，问题是能否选出一部分数，使其和恰好为 \(T\)。已知这个问题是 NP-hard。把每个整数 \(a_i\) 变成一个物品，容量设为 \(T\)，问能不能用 \(2\) 个箱子装下所有物品。这个构造和原问题等价：如果存在一个和为 \(T\) 的子集，就把这个子集放进第一个箱子，剩下的总和也是 \(T\)，放进第二个箱子；反过来，如果所有物品能放进两个容量为 \(T\) 的箱子，由于总大小是 \(2T\)，两个箱子都必须刚好装满，于是其中一个箱子里的物品就对应一个和为 \(T\) 的子集。即 Partition 可以平凡地归约为 \( K=2\) 的 Bin Packing，

它说明 Bin Packing 至少是弱 NP-hard。而更深一步，通过 3-Partition 归约，还可以证明 Bin Packing 是强 NP-hard。

Next Fit：只记住当前箱子的贪心

对这样一个最小化问题，近似比通常写成 \(A(I) \le \rho \cdot \mathrm{OPT}(I)\)，其中 \(A(I)\) 是算法求出的解，\(\mathrm{OPT}(I)\) 是最理论优解。

Next Fit 是最简单的在线算法。它只维护当前正在使用的箱子：新物品来了，如果能放进当前箱子就放进去；如果放不进去，就关闭当前箱子，打开一个新箱子。它的实现几乎不需要数据结构，扫描一遍即可，时间复杂度 \(O(n)\)，额外空间也很低。

问题在于，它一旦关闭某个箱子，就再也不会回头看。对输入 \(0.51,0.51,0.49,0.49\)，Next Fit 会先把第一个 \(0.51\) 放进第一个箱子；第二个 \(0.51\) 放不进去，于是开第二个箱子；随后 \(0.49\) 可以放进第二个箱子，使第二个箱子刚好满；最后一个 \(0.49\) 又只能开第三个箱子。它用了 \(3\) 个箱子，而最优只需要 \(2\) 个。

不过 Next Fit 并不是完全没有理论保证。可以证明 \(A(I) \le 2\mathrm{OPT}(I)-1\)。每次开新箱子，说明当前物品放不进上一个箱子，因此相邻两个箱子的装载量之和会超过 \(1\)。把箱子两两配对，就能得到算法使用的箱子数不会超过最优解的大约两倍。当然，这个界也太粗，太宽了。

First Fit 和 Best Fit：重新利用旧箱子

First Fit 比 Next Fit 多做了一件事：新物品到来时，从前往后扫描已有箱子，把它放进第一个能容纳它的箱子；如果没有箱子能放下，才打开新箱子。Best Fit 则换了一个选择标准：把物品放入能够容纳它且剩余空间最小的箱子，尽量把某个箱子填紧。

这两个算法都可以在线运行，因为它们不需要提前知道未来物品。用平衡树或 multiset 维护剩余容量，每次找不小于当前物品大小的剩余空间（可以找最小的），然后更新该箱子的剩余容量，整体可以做到 \(O(n\log n)\) 量级。

从近似比看，First Fit 和 Best Fit 的经典渐近近似比都是 \(1.7\)。也就是说，可以认为它们在最坏情况下满足类似 \(A(I) \le 1.7\mathrm{OPT}(I)+O(1)\) 的，比 Next Fit 的 \(2\) 好，而“选择剩余最小的”也不会带来渐进性质的改善。不过，这个证明要复杂得多。当然，算法的实际表现通常比最坏情况好，不会一直顶着上界。

要构造较坏的例子，思路是按顺序喂给算法几批尺寸层级不同的物品：先给一批很小的物品，再给稍大一点的物品，让算法把早期开出的箱子填成一些看似还行、但剩余空间形状很差的状态；随后再给中等物品和大物品，使它们无法回填前面的空隙，只能不断开新箱子。例如，假设我们有 \(6n\) 个大小为 0.15 的物品， \(6n\) 个大小为 0.34 的物品，以及 \(6n\) 个大小为 0.51 的物品。最优的装箱方法显然是将一个 0.15、一个 0.34 和一个 0.51 的物品放在一个箱子里，因为它们加起来正好是 1。这样，\(6n\) 个箱子就能装下所有物品。

而 First Fit 的装箱过程：

处理 0.15 的物品：First Fit 会将每 6 个 0.15 的物品放入一个箱子，共使用 \(n\)个箱子。每个箱子被占用 0.9 的空间，无法再放入任何剩余物品。
处理 0.34 的物品：此时，之前装 0.15 物品的箱子已经无法再放入东西，因此 0.34 的物品只能放入新箱子。First Fit 会将每 2 个 0.34 的物品放入一个箱子，共使用 \(3n\) 个新箱子。这些箱子占用 0.68 的空间，也无法放入 0.51 的物品。
处理 0.51 的物品：前面的箱子都已无法再容纳任何物品，因此每个 0.51 的物品都必须单独占用一个新箱子，共使用 \(6n\) 个箱子。

First Fit 总共使用的箱子数为 \(n + 3n + 6n = 10n\)。因此，其近似比为 \(\frac{10n}{6n} = \frac{5}{3}\)。First Fit 的实际最坏情况 1.7 比率构造思路类似但更加复杂。

First Fit 受箱子顺序影响，Best Fit 受“尽量填满”这个目标影响；它们都没有真正理解未来会不会出现一批刚好能填补缝隙的小物品。在线算法无法预知未来，这个限制不是实现技巧能消掉的。

Decreasing：排序改变了整个问题

如果允许离线处理，也就是所有物品一开始就已知，一个自然改进是先按大小从大到小排序，再运行 First Fit 或 Best Fit。这就得到 First Fit Decreasing，简称 FFD；以及 Best Fit Decreasing，简称 BFD。

排序的作用很朴素：先处理大物品，避免它们在后期无处可放。小物品更灵活，可以用来填缝。这个思路在装箱问题里尤其有效，因为大小超过 \(1/2\) 的物品每个都必须占据不同箱子，大小超过 \(1/3\) 的物品每个箱子至多放两个。越大的物品越强地约束最终结构，越应该早点决定位置。

FFD 的经典保证是 \(A(I) \le \frac{11}{9}\mathrm{OPT}(I)+1\)，BFD 也有同阶的渐近保证。这个常数已经比在线贪心的 \(1.7\) 明显更好，离最优解已经很近了，而实现成本只是在原贪心前面加了一次排序。

这个界限的证明非常非常难。需要将可能出现的物品大小组合划分成上百种不同的“模式”，然后逐一分析装箱过程中“浪费”的空间。大物品限制了箱子的数量，小物品填充了空隙。但小物品的排列组合方式极其多样，必须证明最坏情况恰好发生在物品大小集中在 \(1/2\) 和 \(1/3\) 附近，且这种组合造成的浪费刚好卡在 \(2/9\) 的空间上。

算法	是否在线	典型实现复杂度	近似保证
Next Fit	是	\(O(n)\)	不超过 \(2\mathrm{OPT}-1\)
First Fit	是	朴素 \(O(nm)\)，可优化	渐近比 \(1.7\)
Best Fit	是	通常 \(O(n\log n)\)	渐近比 \(1.7\)
First Fit Decreasing	否	排序后贪心	不超过 \(\frac{11}{9}\mathrm{OPT}+1\)
Best Fit Decreasing	否	排序后贪心	渐近比 \(11/9\) 级别

总结：缝隙和耐心

这个具体的动作实际上可以抽象成一个困难的组合优化问题。Next Fit 像一个没有耐心的人，只看眼前的箱子；First Fit 和 Best Fit 愿意回头翻旧箱子，但仍然被输入顺序牵着走；FFD 和 BFD 先把大块头安排好，再让小物品填补缝隙，于是一下子跨过了很多坏情况。他们都是贪心算法，虽然得不到最优解，但经过思路优化，已经有很近的界限了。

posted @ 2026-06-26 16:49 Ofnoname 阅读(62) 评论(0) 收藏举报

刷新页面返回顶部

Ofnoname

万水千山只等闲