码迷,mamicode.com
首页 > 其他好文 > 详细

bzoj 1419 Red is good - 动态规划 - 概率与期望

时间:2017-12-16 23:05:23      阅读:132      评论:0      收藏:0      [点我收藏+]

标签:out   body   pos   gpo   小数   sam   c++   style   return   

Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.


  (题目太简洁,不需要大意)

  这道题和poj的Collecting Bugs有些类似,一样是倒推。

  用f[i][j]表示i张红牌和j张黑白时的最优答案。

  对于初值显然有 f[i][0] = 0  ,对于转移,根据题目意思转移就好了,考虑是摸到红牌还是黑牌,然后和0取max。

Code‘

 1 /**
 2  * bzoj
 3  * Problem#1419
 4  * Accepted
 5  * Time: 1388ms
 6  * Memory: 1368k
 7  */
 8 #include <bits/stdc++.h>
 9 using namespace std;
10 #define smax(_a, _b) _a = (_a > _b) ? (_a) : (_b)
11 
12 const int N = 5005;
13 
14 int R, B;
15 double f[2][N];
16 
17 inline void init() {
18     scanf("%d%d", &R, &B);
19 }
20 
21 inline void solve() {
22     int t = 0;
23     for(int i = 1; i <= R; i++) {
24         t ^= 1;
25         f[t][0] = i;
26         for(int j = 1; j <= B; j++) {
27             f[t][j] = (f[t ^ 1][j] + 1.0) * i + (f[t][j - 1] - 1.0) * j;
28             f[t][j] /= i + j;
29             if(f[t][j] < 0)
30                 f[t][j] = 0;
31         }
32     }
33     printf("%.6lf", f[t][B] - 5e-7);
34 }
35 
36 int main() {
37     init();
38     solve();
39     return 0;
40 }

bzoj 1419 Red is good - 动态规划 - 概率与期望

标签:out   body   pos   gpo   小数   sam   c++   style   return   

原文地址:http://www.cnblogs.com/yyf0309/p/8047813.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!