关于《河边捡石头》问题的深夜随想

深夜郁闷失眠,见到同事UU在讨论河边捡石头的问题,随手写下个程序。

这个问题主要同爱情婚姻有关,但表现形式已经出现N多个版本了,果园摘苹果,麦田捡稻穗等等,总觉得是应试作文害的...UU版本的问题是这样的:

  沿着河走捡石头,不能回头,只能捡一次,捡了就不能换,捡尽量大(当时理解是最重)的那颗回来。

最近感情方面有所感触,一时兴起写下以下用于该问题策略可行性的检测程序。有想法的人只需要实现接口IStrategy描述自己的策略, 通过Test执行后可得到在该策略下如 多次运行的平均值,最优值等结果以验证其策略的合理性。测试代码大致说明如下:

  1. 河边共有STONE_NUM = 1000个石头

  2. 通过TEST_TIMES = 500轮随机测试得出结果,其中每轮的石头通过随机算法重新生成, 石头重量符合正态分布, 最大可能值为1000。

  3. 为了防止无意识下的作弊(某人一上手就默认最大的石头为1000而且乐于作弊ya囧),于是每轮石头的最大重量也是在1 - 1000之间随机的。

  4. 由3策略的存在,使用石头重量作为评分标准不大合理。于是想了个新的评分标准:每轮石头按重量升序排序,最大的石头分数p最高线性分布且归一化,p ε [0,1]。最小的石头分数应该是1/STONE_NUM的,而当一轮内放弃所有石头才拿到0。

  5. 代码中有两个策略实现示例:SimpleStrategy2捡第一个石头...  SimpleStrategy1将前一半的石头作为统计样本,在后半段中见到比前半段最好的石头更好时就捡掉。

 

策略接口

1 public interface IStrategy {
2     /** index为石头序号, stone的值即非负数重量 */
3     public boolean isPickup(int index, double stone);
4 
5     /** 为了strategy对象多次运行,需要重置环境 */
6     public void reset();
7 }

测试主程序

  1 import java.util.Random;
  2 
  3 /**
  4  * 石头的得分gold由其重量排名决定,0 <= gold <= 1 </br>
  5  * 通过实现IStrategy改写策略,见main函数 </br>
  6  * 实验会通过多次计算得到, avgGold平均值,0 <= avgGold <= 1.0 </br>
  7  * @author cjy
  8  */
  9 public class Test {
 10     public static final int STONE_NUM = 300; // 1k个石头的假设
 11     public static int TEST_TIMES = 500; // 测试100次
 12     public static double MAX_STONE = 100; // 石头重量的最大可能值
 13 
 14     public static void main(String[] args) {
 15         test(new SimpleStrategy1(0.5)); // 在此处定制策略
 16     }
 17 
 18     public static void test(IStrategy strategy) {
 19         Test test = new Test(strategy);
 20         long b = System.currentTimeMillis();
 21         test.run();
 22         long e = System.currentTimeMillis();
 23         System.out.println("run time:" + (e - b));
 24         System.out.println("avgGold = " + test.avgGold());
 25         System.out.println("maxGold = " + test.maxGold());
 26     }
 27 
 28     private double[] stones = new double[STONE_NUM]; // 石头,以double类型表示其大小
 29     private double[] stoneGolds = new double[STONE_NUM]; // 石头对应的分数, 通过排序决定.
 30     private double[] goldsInEachTime = new double[TEST_TIMES];
 31 
 32     final IStrategy strategy;
 33 
 34     public Test(IStrategy strategy) {
 35         if (strategy == null) {
 36             throw new NullPointerException("ya?");
 37         }
 38         this.strategy = strategy;
 39     }
 40 
 41     public void run() {
 42         for (int i = 0; i < TEST_TIMES; i++) {
 43             resetRiverEnv();
 44             this.goldsInEachTime[i] = riverTrav();
 45         }
 46     }
 47 
 48     public double avgGold() {
 49         if (goldsInEachTime == null) {
 50             throw new IllegalArgumentException("please run.");
 51         }
 52         double sum = 0;
 53         for (double gold : goldsInEachTime) {
 54             sum += gold;
 55         }
 56         return sum / TEST_TIMES;
 57     }
 58 
 59     public double maxGold() {
 60         if (goldsInEachTime == null) {
 61             throw new IllegalArgumentException("please run.");
 62         }
 63         double max = 0;
 64         for (double gold : goldsInEachTime) {
 65             if (gold > max) {
 66                 max = gold;
 67             }
 68         }
 69         return max;
 70     }
 71 
 72     private void resetRiverEnv() {
 73         resetStones();
 74         resetStoneGolds();
 75         strategy.reset();
 76     }
 77 
 78     private void resetStones() {
 79         Random r = new Random();
 80         double baseStone = r.nextDouble() * MAX_STONE;
 81         double rNum;
 82         for (int i = 0; i < STONE_NUM; i++) {
 83             while (Math.abs(rNum = r.nextGaussian()) > 3)
 84                 ;
 85             stones[i] = (rNum + 3) / 6 * baseStone;
 86         }
 87     }
 88 
 89     // 请用力吐槽
 90     private void resetStoneGolds() {
 91         int t;
 92         boolean loopOver;
 93         int[] goldIndex = new int[STONE_NUM];
 94         for (int i = 0; i < STONE_NUM; i++) {
 95             goldIndex[i] = i;
 96         }
 97         for (int i = STONE_NUM; i > 0; i--) {
 98             loopOver = true;
 99             for (int j = 0; j < i - 1; j++) {
100                 if (stones[goldIndex[j]] > stones[goldIndex[j + 1]]) {
101                     t = goldIndex[j];
102                     goldIndex[j] = goldIndex[j + 1];
103                     goldIndex[j + 1] = t;
104                     loopOver = false;
105                 }
106             }
107             if (loopOver) {
108                 break;
109             }
110         }
111 
112         for (int i = 0; i < STONE_NUM; i++) {
113             int gold = i;
114             int index = goldIndex[i];
115             while (gold > 0 && (stones[goldIndex[gold]] == stones[goldIndex[gold - 1]])) {
116                 gold--;
117             }
118             stoneGolds[index] = gold;
119         }
120 
121         for (int i = 0; i < STONE_NUM; i++) {
122             stoneGolds[i] = (stoneGolds[i] + 1) / STONE_NUM; // 归一化
123         }
124     }
125 
126     private double riverTrav() {
127         try {
128             for (int i = 0; i < STONE_NUM; i++) {
129                 double stone = stones[i];
130                 if (strategy.isPickup(i, stone)) {
131                     return stoneGolds[i];
132                 }
133             }
134             return 0.0;
135         } catch (Throwable t) {
136             t.printStackTrace();
137             return 0.0;
138         }
139     }
140 }

两个简单的策略示范

 1 public class SimpleStrategy1 implements IStrategy {
 2     double max = Double.MIN_VALUE;
 3     final double rate;
 4 
 5     public SimpleStrategy1(double rate) {
 6         this.rate = rate;
 7     }
 8 
 9     @Override
10     public boolean isPickup(int index, double stone) {
11         if (index == Test.STONE_NUM - 1) {
12             return true;
13         }
14         if (index <= Test.STONE_NUM * rate) {
15             max = Math.max(stone, max);
16             return false;
17         } else {
18             if (stone >= max) {
19                 return true;
20             } else {
21                 return false;
22             }
23         }
24     }
25 
26     @Override
27     public void reset() {
28         this.max = Double.MIN_VALUE;
29     }
30 }
31 
32 public class SimpleStrategy2 implements IStrategy {
33     @Override
34     public boolean isPickup(int index, double stone) {
35         return true;
36     }
37 
38     @Override
39     public void reset() {
40     }
41 }

策略2的平均得分是0.5,策略1的平均得分为0.75。据说策略1的rate值取1/e时最优,实测是到0.08左右最优,得分为0.91

欢迎大家提交各自的策略及测试结果。

在邹欣老师的建议对博文做出了修改,谢谢。

-------------------------华丽分割线以上是程序,以下是牢骚----------------------------

这个问题可以用概率论来解决的,不过想了一段时间无果后放弃了。

方案有很多,UU的3分样本和示例中的2分样本感觉没有很大区别。甚至还可以递归2分,每次取一半作为样本啊取1/4做研究对象之类的。

某人的作弊是将第n轮的结果应用到第n + 1轮~~~咋就那么可爱捏~  逼得我改出个这么长的程序~

 

该问题原本是用于描述爱情与婚姻的,简单来说就是人的一生会碰上很多个人,苏格拉底以这个故事来隐喻选择过程中的各种困惑。

最近朋友受困于该问题(高富帅STONE_NUM大运行时间更长),而我则受困于另一个同属爱情婚姻的问题。刚好看到UU的微博于是苦闷的想到爱情与婚姻是个复杂的问题,哲学家苏格拉底将其模块化划分后得出的其中一个子模块就经已如此复杂.. 于是写个程序给大家YY一下自己的选择。

不过我的观点就如同UU所说,子问题的最优解并不代表它就能给出系统最优解。另感情不像石头苹果麦穗一般捡了就完,而是需要培养灌溉况且每段感情的可发展区间还不一样,这个事情确实难,编程简单多了思密达。

posted @ 2012-06-10 01:11  startle妖妖  阅读(485)  评论(0)    收藏  举报