碎片装箱问题的贪心下界
装箱问题是这样一个问题:有 \(n\) 个物品,大小分别为 \(s_1,s_2,\ldots,s_n\),其中 \(0 < s_i \le 1\),每个箱子的容量为 \(1\),目标是把所有物品放进若干箱子,使得每个箱子内物品大小之和不超过 \(1\),并最小化箱子数量。
这个问题很适合讲近似算法。它足够简单,简单到你可以在十分钟内写出好几个贪心版本;但它也足够刁钻,刁钻到“看起来很合理”的策略会在某些输入上稳定翻车。
这是一个 NP-hard 问题
严格地说,优化版本的 Bin Packing 是 NP-hard;对应的判定版本是:给定物品大小和整数 \(B\),是否能用不超过 \(B\) 个箱子装下所有物品?这个判定版本属于 NP,因为验证答案显然很简单。而证明 NP-hard 可以从 Partition 问题归约。
Partition 的输入是一组正整数 \(a_1,a_2,\ldots,a_n\),它们的总和为 \(2T\),问题是能否选出一部分数,使其和恰好为 \(T\)。已知这个问题是 NP-hard。把每个整数 \(a_i\) 变成一个物品,容量设为 \(T\),问能不能用 \(2\) 个箱子装下所有物品。这个构造和原问题等价:如果存在一个和为 \(T\) 的子集,就把这个子集放进第一个箱子,剩下的总和也是 \(T\),放进第二个箱子;反过来,如果所有物品能放进两个容量为 \(T\) 的箱子,由于总大小是 \(2T\),两个箱子都必须刚好装满,于是其中一个箱子里的物品就对应一个和为 \(T\) 的子集。即 Partition 可以平凡地归约为 \( K=2\) 的 Bin Packing,
它说明 Bin Packing 至少是弱 NP-hard。而更深一步,通过 3-Partition 归约,还可以证明 Bin Packing 是强 NP-hard。
Next Fit:只记住当前箱子的贪心
对这样一个最小化问题,近似比通常写成 \(A(I) \le \rho \cdot \mathrm{OPT}(I)\),其中 \(A(I)\) 是算法求出的解,\(\mathrm{OPT}(I)\) 是最理论优解。
Next Fit 是最简单的在线算法。它只维护当前正在使用的箱子:新物品来了,如果能放进当前箱子就放进去;如果放不进去,就关闭当前箱子,打开一个新箱子。它的实现几乎不需要数据结构,扫描一遍即可,时间复杂度 \(O(n)\),额外空间也很低。
问题在于,它一旦关闭某个箱子,就再也不会回头看。对输入 \(0.51,0.51,0.49,0.49\),Next Fit 会先把第一个 \(0.51\) 放进第一个箱子;第二个 \(0.51\) 放不进去,于是开第二个箱子;随后 \(0.49\) 可以放进第二个箱子,使第二个箱子刚好满;最后一个 \(0.49\) 又只能开第三个箱子。它用了 \(3\) 个箱子,而最优只需要 \(2\) 个。

不过 Next Fit 并不是完全没有理论保证。可以证明 \(A(I) \le 2\mathrm{OPT}(I)-1\)。每次开新箱子,说明当前物品放不进上一个箱子,因此相邻两个箱子的装载量之和会超过 \(1\)。把箱子两两配对,就能得到算法使用的箱子数不会超过最优解的大约两倍。当然,这个界也太粗,太宽了。
First Fit 和 Best Fit:重新利用旧箱子
First Fit 比 Next Fit 多做了一件事:新物品到来时,从前往后扫描已有箱子,把它放进第一个能容纳它的箱子;如果没有箱子能放下,才打开新箱子。Best Fit 则换了一个选择标准:把物品放入能够容纳它且剩余空间最小的箱子,尽量把某个箱子填紧。
这两个算法都可以在线运行,因为它们不需要提前知道未来物品。用平衡树或 multiset 维护剩余容量,每次找不小于当前物品大小的剩余空间(可以找最小的),然后更新该箱子的剩余容量,整体可以做到 \(O(n\log n)\) 量级。
从近似比看,First Fit 和 Best Fit 的经典渐近近似比都是 \(1.7\)。也就是说,可以认为它们在最坏情况下满足类似 \(A(I) \le 1.7\mathrm{OPT}(I)+O(1)\) 的,比 Next Fit 的 \(2\) 好,而“选择剩余最小的”也不会带来渐进性质的改善。不过,这个证明要复杂得多。当然,算法的实际表现通常比最坏情况好,不会一直顶着上界。
要构造较坏的例子,思路是按顺序喂给算法几批尺寸层级不同的物品:先给一批很小的物品,再给稍大一点的物品,让算法把早期开出的箱子填成一些看似还行、但剩余空间形状很差的状态;随后再给中等物品和大物品,使它们无法回填前面的空隙,只能不断开新箱子。例如,假设我们有 \(6n\) 个大小为 0.15 的物品, \(6n\) 个大小为 0.34 的物品,以及 \(6n\) 个大小为 0.51 的物品。最优的装箱方法显然是将一个 0.15、一个 0.34 和一个 0.51 的物品放在一个箱子里,因为它们加起来正好是 1。这样,\(6n\) 个箱子就能装下所有物品。
而 First Fit 的装箱过程:
- 处理 0.15 的物品:First Fit 会将每 6 个 0.15 的物品放入一个箱子,共使用 \(n\)个箱子。每个箱子被占用 0.9 的空间,无法再放入任何剩余物品。
- 处理 0.34 的物品:此时,之前装 0.15 物品的箱子已经无法再放入东西,因此 0.34 的物品只能放入新箱子。First Fit 会将每 2 个 0.34 的物品放入一个箱子,共使用 \(3n\) 个新箱子。这些箱子占用 0.68 的空间,也无法放入 0.51 的物品。
- 处理 0.51 的物品:前面的箱子都已无法再容纳任何物品,因此每个 0.51 的物品都必须单独占用一个新箱子,共使用 \(6n\) 个箱子。
First Fit 总共使用的箱子数为 \(n + 3n + 6n = 10n\)。因此,其近似比为 \(\frac{10n}{6n} = \frac{5}{3}\)。First Fit 的实际最坏情况 1.7 比率构造思路类似但更加复杂。

First Fit 受箱子顺序影响,Best Fit 受“尽量填满”这个目标影响;它们都没有真正理解未来会不会出现一批刚好能填补缝隙的小物品。在线算法无法预知未来,这个限制不是实现技巧能消掉的。
Decreasing:排序改变了整个问题
如果允许离线处理,也就是所有物品一开始就已知,一个自然改进是先按大小从大到小排序,再运行 First Fit 或 Best Fit。这就得到 First Fit Decreasing,简称 FFD;以及 Best Fit Decreasing,简称 BFD。
排序的作用很朴素:先处理大物品,避免它们在后期无处可放。小物品更灵活,可以用来填缝。这个思路在装箱问题里尤其有效,因为大小超过 \(1/2\) 的物品每个都必须占据不同箱子,大小超过 \(1/3\) 的物品每个箱子至多放两个。越大的物品越强地约束最终结构,越应该早点决定位置。
FFD 的经典保证是 \(A(I) \le \frac{11}{9}\mathrm{OPT}(I)+1\),BFD 也有同阶的渐近保证。这个常数已经比在线贪心的 \(1.7\) 明显更好,离最优解已经很近了,而实现成本只是在原贪心前面加了一次排序。
这个界限的证明非常非常难。需要将可能出现的物品大小组合划分成上百种不同的“模式”,然后逐一分析装箱过程中“浪费”的空间。大物品限制了箱子的数量,小物品填充了空隙。但小物品的排列组合方式极其多样,必须证明最坏情况恰好发生在物品大小集中在 \(1/2\) 和 \(1/3\) 附近,且这种组合造成的浪费刚好卡在 \(2/9\) 的空间上。
| 算法 | 是否在线 | 典型实现复杂度 | 近似保证 |
|---|---|---|---|
| Next Fit | 是 | \(O(n)\) | 不超过 \(2\mathrm{OPT}-1\) |
| First Fit | 是 | 朴素 \(O(nm)\),可优化 | 渐近比 \(1.7\) |
| Best Fit | 是 | 通常 \(O(n\log n)\) | 渐近比 \(1.7\) |
| First Fit Decreasing | 否 | 排序后贪心 | 不超过 \(\frac{11}{9}\mathrm{OPT}+1\) |
| Best Fit Decreasing | 否 | 排序后贪心 | 渐近比 \(11/9\) 级别 |
总结:缝隙和耐心
这个具体的动作实际上可以抽象成一个困难的组合优化问题。Next Fit 像一个没有耐心的人,只看眼前的箱子;First Fit 和 Best Fit 愿意回头翻旧箱子,但仍然被输入顺序牵着走;FFD 和 BFD 先把大块头安排好,再让小物品填补缝隙,于是一下子跨过了很多坏情况。他们都是贪心算法,虽然得不到最优解,但经过思路优化,已经有很近的界限了。

浙公网安备 33010602011771号