分割等和子集(416)


2020-10-11

416.分割等和子集

题目

给定一个只包含正整数非空数组。是否可以将这个数组分割成两个子集,使得两个子集的元素和相等

示例:

输入:[1, 5, 11, 5]

输出:true

分析

这道题可以换一种表述:给定一个只包含正整数的非空数组 nums[0],判断是否可以从数组中选出一些数字,使得这些数字的和等于整个数组的元素和的一半。

因此这个问题可以转换成「0−1 背包问题」。这道题与传统的「0−1 背包问题」的区别在于,传统的「0−1 背包问题」要求选取的物品的重量之和不能超过背包的总容量,这道题则要求选取的数字的和恰好等于整个数组的元素和的一半。类似于传统的「0−1 背包问题」,可以使用动态规划求解。

在使用动态规划求解之前,首先需要进行以下判断:

  • 根据数组的长度 n 判断数组是否可以被划分。如果 n<2,则不可能将数组分割成元素和相等的两个子集,因此直接返回 false。
  • 计算数组的元素和 sum 。如果sum 是奇数,则不可能将数组分割成元素和相等的两个子集,因此直接返回 false。
  • 计算数组最大元素 maxNum。如果最大元素比 sum / 2 还大,直接返回false

动态规划求解

创建二维数组 dp[i] [j],表示从数组nums的 0~i 下标范围内选取若干个元素,是否存在一种选取方案使得被选取的元素的和等于 j(子集元素和,也即是背包的容量) 。例如 dp[0] [nums[0]] = true,当i=0,只有nums[0]可以被选取,因此返回true。

此时有两种情况需要考虑:

  • 不选nums[i],只从 i 前选取元素来满足背包容量 j,则 dp[i] [j] = dp[i-1] [j];

  • 选取nums[i],此时从i 前选取元素来满足剩下的背包容量 j-nums[i],则 dp[i] [j] = dp[i-1] [j - nums[i]];

得出状态转移方程如下:
dp[i] [j]=max{ dp[i-1] [j] | dp[i-1] [j-nums[i] ] }

空间优化

1.降维

其实还可以简化为:dp[j] = dp[j] | dp[j - nums[i]],因为当前行每次只参考了上一行的值。

  • 只需要 找到元素与背包容量相等(如果原始集合有一个元素等于所有元素和的一半,那么可以直接将此元素与其他元素分成两个子集);
  • 或者找到元素 x 满足x + nums[i] = j-nums[i] ,比如 1 + 5 = 11 - 5。

target = sum / 2 == 11;true:T;false:略

0 1 2, 3, 4 5 6 7, 8, 9 10 11
nums[0]:1 T T
nums[1]:1、5 T T T T
nums[2]:1、5、11 T T T T T
nums[3]:1、5、11、5 T T T T T T
2.逆序

观察上表,如果逆序,从target最大值11开始,一旦 target < nums[i] 马上退出当前循环,可以减少很多重复计算。

代码如下:

class Solution {
    public boolean canPartition(int[] nums) {
        int len = nums.length;
        if (len < 2) {
            return false;
        }
        int sum = 0, maxNum = 0;
        for (int num : nums) {
            sum += num;
            maxNum = Math.max(maxNum, num);
        }
        if (sum % 2 != 0) {
            return false;
        }
        int target = sum / 2;
        if (maxNum > target) {
            return false;
        }

        // 动态规划求解阶段
        boolean[] dp = new boolean[target + 1];
        dp[0] = true;

        // i最多到背包容量减一,否则就无法分成两个子集了
        for (int i = 0; i < len; i++) {
            int num = nums[i];

            // j由大到小递减,一旦小于num,立马跳出循环
            for (int j = target; j >= num; --j) {
                dp[j] |= dp[j - num];
            }
        }
        return dp[target];
    }
}

复杂度分析

  • 时间复杂度:O(len × target),其中 n 是数组的长度,target 是整个数组的元素和的一半。需要计算出所有的状态,每个状态在进行转移时的时间复杂度为 O(1)。
  • 空间复杂度:O(target),其中 target 是整个数组的元素和的一半。空间复杂度取决于dp 数组,在不进行空间优化的情况下,空间复杂度是 O(len × target)。在进行空间优化的情况下,将二维数组降到一维,空间复杂度可以降到 O(target)。

0-1背包问题

背包九讲pdf 已由作者上传至github,完全公开。背包九讲

这里仅对0-1背包问题先做了解,剩下的等看完在发。

题目

有N件物品和一个容量为V的背包。第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使价值总和最大。

基本思路

这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。

用子问题定义状态:即 “F[i] [v]”表示前 i 件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是:

f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}

这个方程非常重要,基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下:“将前i件物品放入容量为v的背包中”这个子问题,若只考虑第i件物品的策略(放或不放),那么就可以转化为一个只牵扯前i-1件物品的问题。

如果不放第i件物品:那么问题就转化为“前i-1件物品放入容量为v的背包中”,价值为”F[i-1] [v]”;

如果放第i件物品:那么问题就转化为“前i-1件物品放入剩下的容量为v-c[i]的背包中”,此时能获得的最大价值就是F[i-1] [v-c[i] ]再加上通过放入第i件物品获得的价值w[i]。

优化空间复杂度

以上方法的时间和空间复杂度均为O(VN),其中时间复杂度应该已经不能再优化了,但空间复杂度却可以优化到O。

先考虑上面讲的基本思路如何实现,肯定是有一个主循环i=1..N,每次算出来二维数组f[i] [0..V]的所有值。那么,如果只用一个数组f[0..V],能不能保证第i次循环结束后f[v]中表示的就是我们定义的状态f[i] [v]呢?f[i] [v]是由f[i-1] [v]和f[i-1] [v-c[i]]两个子问题递推而来,能否保证在推f[i][v]时(也即在第i次主循环中推f[v]时)能够得到f[i-1] [v]和f[i-1] [v-c[i]]的值呢?事实上,这要求在每次主循环中我们以v=V..0的顺序推f[v],这样才能保证推f[v]时f[v-c[i]]保存的是状态f[i-1] [v-c[i]]的值。伪代码如下:

for i=1..N
    for v=V..0
        f[v]=max{f[v],f[v-c[i]]+w[i]};

其中的f[v]=max{f[v],f[v-c[i]]}一句恰就相当于我们的转移方程f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]},因为现在的f[v-c[i]]就相当于原来的f[i-1] [v-c[i]]。如果将v的循环顺序从上面的逆序改成顺序的话,那么则成了f[i][v]由f[i][v-c[i]]推知,与本题意不符,但它却是另一个重要的背包问题最简捷的解决方案,故学习只用一维数组解01背包问题是十分必要的。

事实上,使用一维数组解01背包的程序在后面会被多次用到,所以这里抽象出一个处理一件01背包中的物品过程,以后的代码中直接调用不加说明。

过程ZeroOnePack,表示处理一件01背包中的物品,两个参数cost、weight分别表明这件物品的费用和价值。

procedure ZeroOnePack(cost,weight)
    for v=V..cost
        f[v]=max{f[v],f[v-cost]+weight}

注意这个过程里的处理与前面给出的伪代码有所不同。前面的示例程序写成v=V..0是为了在程序中体现每个状态都按照方程求解了,避免不必要的思维复杂度。而这里既然已经抽象成看作黑箱的过程了,就可以加入优化。费用为cost的物品不会影响状态f[0..cost-1],这是显然的。

有了这个过程以后,01背包问题的伪代码就可以这样写:

for i=1..N
    ZeroOnePack(c[i],w[i]);

初始化的细节问题

我们看到的求最优解的背包问题题目中,事实上有两种不太相同的问法。有的题目要求“恰好装满背包”时的最优解,有的题目则并没有要求必须把背包装满。一种区别这两种问法的实现方法是在初始化的时候有所不同。

如果是第一种问法,要求恰好装满背包,那么在初始化时除了f[0]为0其它f[1..V]均设为-∞,这样就可以保证最终得到的f[N]是一种恰好装满背包的最优解。

如果并没有要求必须把背包装满,而是只希望价格尽量大,初始化时应该将f[0..V]全部设为0。

为什么呢?可以这样理解:初始化的f数组事实上就是在没有任何物品可以放入背包时的合法状态。如果要求背包恰好装满,那么此时只有容量为0的背包可能被价值为0的nothing“恰好装满”,其它容量的背包均没有合法的解,属于未定义的状态,它们的值就都应该是-∞了。如果背包并非必须被装满,那么任何容量的背包都有一个合法解“什么都不装”,这个解的价值为0,所以初始时状态的值也就全部为0了。

这个小技巧完全可以推广到其它类型的背包问题,后面也就不再对进行状态转移之前的初始化进行讲解。

一个常数优化

前面的伪代码中有 for v=V..1,可以将这个循环的下限进行改进。

由于只需要最后f[v]的值,倒推前一个物品,其实只要知道f[v-w[n]]即可。以此类推,对以第j个背包,其实只需要知道到f[v-sum{w[j..n]}]即可,即代码中的

for i=1..N
    for v=V..0

可以改成

for i=1..n
    bound=max{V-sum{w[i..n]},c[i]}
    for v=V..bound

这对于V比较大时是有用的。

小结

01背包问题是最基本的背包问题,它包含了背包问题中设计状态、方程的最基本思想,另外,别的类型的背包问题往往也可以转换成01背包问题求解。故一定要仔细体会上面基本思路的得出方法,状态转移方程的意义,以及最后怎样优化的空间复杂度。


  TOC