P40-预测赢家-动态规划

//预测赢家
/*
 * 给定一个表示分数的非负整数数组。玩家1从数组任意一端拿取一个分数，随后玩家2继续从剩余数组任意一端拿取分数，
 * 然后玩家1拿，......。每次一个玩家只能拿取一个分数，分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。
 * 最终获得分数总和最多的玩家获胜
 * 给定一个表示分数的数组，预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。
 *
 * 扩展：石子游戏
 * */
public class P40 {
    public static void main(String[] args) {

//        int[] arr = new int[]{5,200,2,3};    //扩展知识：当数量是偶数的时候，先手是会存在必赢策略的（大于等于后手）
        int[] arr = new int[]{5,200,2,3,5};
        System.out.println(maxScore(arr,0, arr.length-1));
        System.out.println(dp(arr));
        System.out.println(dp2(arr));
    }

    //递归
    //递归出口 只有一个元素或两个元素，返回最大的值，之后的都是通过max来判断
    //p1 max(fun(l), fun(r))
    //p2 max(fun(l), fun(r))
    //max(p1, p2)

    //l是左指针，r是右指针
    /*
     * 公式计算
     * 假设p1取l，p2剩下l+1和r可以取，
     *       假设p2取l+1，p1剩下l+2和r可以取
     *       假设p2取r，p1剩下l+1和r-1可以取
     *           之后p2怎么取，都是这两个公式 {l+2和r}、{l+1和r-1} （前提是l和r要重新指向）
     *           但p2是聪明的，假设{l+2和r}能让p1更大时，p2就会取r，导致你只能在{l+1和r-1}中取，让你处于不利状态
     * 假设p1取r，p2剩下l和r-1可以取
     *       假设p2取l，p1剩下l+1和r-1可以取
     *       假设p2取r-1，p1剩下l和r-2可以取
     *           之后p2怎么取，都是这两个公式 {l+1和r-1}、{l和r-2} （前提是l和r要重新指向）
     *
     * */
    public static int maxScore(int[] arr, int l, int r) {
        if (l == r) {       //如果只剩一个元素，只能选择它了
            return arr[l];
        }

        //假设先手去左边元素，这个时候后手就会获取{l+1,r}的最大值
        //然后判断 先手的数 - 后手的数
        //因为是递归，最终公式变为 p1 - (p2 - (p1 - (p2 - p1)))     //假设5个元素的就是这样，一直递归
        // p1 - p2 + p1 - p2 + p1，就得到p1取左边的数时，能否比p2的值大
        int left = arr[l] - maxScore(arr, l+1, r);
        //右边同理
        int right = arr[r] - maxScore(arr, l, r-1);

        return Math.max(left, right);   //结果大于0就是赢，小于0就是输
    }

    //更一步优化，动态规划
    //上方两个maxScore调用，假如结果是left，相当于right白计算
    /*
    * maxScore(arr, l+1, r)存储到 二维数组[i][j]
    * 往左移，i+1，往右移 j-1，叫做dp数组
    * 初始化：
    * if (l == r) {       //如果只剩一个元素，只能选择它了
          return arr[l];
      }
    * */
    public static boolean dp(int[] arr){
        int length = arr.length;
        int[][] dp = new int[length][length];

        //初始化
        for(int i=0; i<length; i++){
            dp[i][i] = arr[i];
        }


        //最大范围去到长度-2，因为假设一直都是取左边的数，最后剩下2个数的时候，i=length-2，已经知道结果了
        for(int i=length-2; i>=0; i--){
            for(int j=i+1; j<length; j++){
                dp[i][j] = Math.max(arr[i] - dp[i+1][j], arr[j] - dp[i][j-1]);
                /*
                 * 来自上方的公式
                 * arr[l] - maxScore(arr, l+1, r) ==> arr[i] - dp[i+1][j]
                 * arr[r] - maxScore(arr, l, r-1) ==> arr[j] - dp[i][j-1]
                 * 相当于把递归的结果保存起来
                 * */
            }
        }

        //i的位置到j的位置，先手与后手的差值
        return dp[0][length-1] >= 0;
    }

    //可以使用一维数组优化
    /*
     * arr[l]-maxScore(arr, l+1, r) ==> arr[i]-dp[i+1][j] ==> arr[i]-dp[j][j] ==> arr[i]-arr[j]
     * arr[r]-maxScore(arr, l, r-1) ==> arr[j]-dp[i][j-1] ==> arr[j]-dp[j-1][j-1] ==> arr[j]-arr[j-1]
     * */
    public static boolean dp2(int[] arr){
        int length = arr.length;
        int[] dp = new int[length];

        //初始化
        for(int i=0; i<length; i++){
            dp[i] = arr[i];
        }


        //最大范围去到长度-2，因为假设一直都是取左边的数，最后剩下2个数的时候，i=length-2，已经知道结果了
        for(int i=length-2; i>=0; i--){
            for(int j=i+1; j<length; j++){
                dp[j] = Math.max(arr[i] - dp[j], arr[j] - dp[j-1]);

            }
        }

        //i的位置到j的位置，先手与后手的差值
        return dp[length-1] >= 0;
    }

}
posted @ 2022-04-11 14:22 YonchanLew 阅读(43) 评论(0) 收藏举报
刷新页面返回顶部
YonchanLew

P40-预测赢家-动态规划

公告