SP1026 FAVDICE - Favorite Dice
Label
期望DP经典例题
Description
一个n面的骰子,求期望掷几次能使得每一面(每一种点数)都被掷到。
数据范围: n ≤ 1000 n\leq 1000 n≤1000,共 t ( t ≤ 1000 ) t(t\leq 1000) t(t≤1000)组数据。
Solution
一种正确但不可行的想法
一开始想着设 d p [ i ] [ j ] dp[i][j] dp[i][j]为投掷了 i i i次骰子后扔到过 j j j个不同面所经过次数的期望,那么这个转移式还是比较好想的:
d p [ i ] [ j ] = n − ( j − 1 ) n d p [ i − 1 ] [ j − 1 ] + j n d p [ i − 1 ] [ j ] ( d p [ 1 ] [ 1 ] = 1 ) dp[i][j]=\frac{n-(j-1)}{n}dp[i-1][j-1]+\frac{j}{n}dp[i-1][j](dp[1][1]=1) dp[i][j]=nn−(j−1)dp[i−1][j−1]+njdp[i−1][j](dp[1][1]=1)
a n s = ∑ i = n ∞ d p [ i ] [ n ] ans=\sum_{i=n}^{\infty}dp[i][n] ans=∑i=n∞dp[i][n]
d p [ i ] [ j ] dp[i][j] dp[i][j]由两种情况转移而来:1、 d p [ i − 1 ] [ j ] dp[i-1][j] dp[i−1][j]:扔了一次骰子还是已出现过的 j j j面中的一种, p = j n p=\frac{j}{n} p=nj;2、 d p [ i − 1 ] [ j − 1 ] dp[i-1][j-1] dp[i−1][j−1]:扔了一次骰子不是已出现过的 j − 1 j-1 j−1面中的一种, p = n − ( j − 1 ) n p=\frac{n-(j-1)}{n} p=nn−(j−1)。
但是,这种正向推导的方法有一种显然的问题:理论上存在扔无限次骰子而始终无法使得每一面都被掷到的可能性,故此答案没法统计( a n s ans ans收敛于何处实在难求),故我们考虑不依赖于步数的新状态。
正推?
设 d p [ i ] dp[i] dp[i]表示恰好投出 i i i种不同点数的期望投掷次数,初始状态为 d p [ 1 ] = 1 dp[1]=1 dp[1]=1,问题来了: d p [ i ] dp[i] dp[i]由何转移得到?应由 d p [ i − 1 ] dp[i-1] dp[i−1]和 d p [ i ] dp[i] dp[i]。到了这里, d p [ i − 1 ] dp[i-1] dp[i−1]到 d p [ i ] dp[i] dp[i]的概率为 n − i + 1 n \frac{n-i+1}{n} nn−i+1, d p [ i ] dp[i] dp[i]到 d p [ i ] dp[i] dp[i]的概率为 i n \frac{i}{n} ni,概率和不为1,不可行。
逆推
设 d p [ i ] dp[i] dp[i]表示当前已投出过 i i i种不同点数后投掷的期望次数,那么考虑在 f [ i ] f[i] f[i]状态下投掷一次骰子,显然有 i n \frac{i}{n} ni的概率又扔到原有的 i i i面骰子, f [ i ] f[i] f[i]转移到 f [ i ] f[i] f[i],有 n − i n \frac{n-i}{n} nn−i的概率扔到原来没扔到的 n − i n-i n−i面骰子, f [ i ] f[i] f[i]转移到 f [ i + 1 ] f[i+1] f[i+1],所以:
d p [ i ] = i n ( d p [ i ] + 1 ) + n − i n ( d p [ i + 1 ] + 1 ) dp[i]=\frac{i}{n}(dp[i]+1)+\frac{n-i}{n}(dp[i+1]+1) dp[i]=ni(dp[i]+1)+nn−i(dp[i+1]+1)
其中, d p [ n ] = 0 dp[n]=0 dp[n]=0
化为标准递归公式的形式,即为: d p [ i ] = d p [ i + 1 ] + n n − i dp[i]=dp[i+1]+\frac{n}{n-i} dp[i]=dp[i+1]+n−in
(别忘了转移的时候我们扔了一次骰子!)
Code
#include<cstdio>
#include<iostream>
#define ri register int
using namespace std;
const int MAXN=1020;
int t,n;
double dp[MAXN],ans;
int main()
{
scanf("%d",&t);
for(ri opt=1;opt<=t;opt++)
{
scanf("%d",&n);
dp[n]=0;
for(ri i=n-1;i>=0;i--)
dp[i]=dp[i+1]+(double)n/(double)(n-i);
printf("%.2f\n",dp[0]);
}
return 0;
}