算法----bonus dumplings

时间：2014-12-28 20:54:37 阅读：271 评论：0 收藏：0 [点我收藏+]

标签：dp

题目描述

过年了，妈妈做了100只饺子，其中有10只饺子里面有1块的硬币。
小明依次吃这100只饺子，如果小明连续吃到k个硬币，那么小明得到k-1个硬币。

e.g. 110111表示6只饺子，1表示有硬币，0表示没有。11表示连续吃到2个饺子，那么小明得1个硬币；111连续迟到3个，小明得2个硬币；故，小明共得到3个硬币。

问小明得到的硬币的期望值是多少？

分析

期望定义： E(X)=∑iXiP(Xi)

在本题中，随机事件X即为小明最终得到的硬币数目，x∈[0,9]

计算P(Xi)=cases(x=i)allcases
计算期望

那么原问题就简化为小明得到硬币k,所有可能的cases的数目。

采用动态规划，子问题定义如下

f[i][j][k]——前i个饺子，含j个有硬币的饺子，得分是k，且第i个饺子不含硬币，所有可能的情况的总数。
g[i][j][k]——前i个饺子，含j个有硬币的饺子，得分是k，且第i个饺子含硬币，所有可能的情况的总数。

那么递推公式如下,

f[i][j][k]—-第i个饺子不包含硬币，所以不用第i个饺子
- f[i][j][k] = f[i-1][j][k] + g[i-1][j][k]
g[i][j][k]—-第i个饺子包含硬币，那么这个硬币能够得到，取决于第i-1个饺子是否包含硬币
- g[i][j][k] = f[i-1][j-1][k] + g[i-1][j-1][k-1]

代码

1.DP

#!/usr/bin/env python
import sys
def compute(m,n,f,g):
    if n > m: return -1
    for i in range(m+1):
        f[i][0][0] = 1
    for j in range(n+1):
        f[0][j][0] = 0
        g[0][j][0] = 0
    f[0][0][0] = 1
    g[0][0][0] = 1
    for i in range(1,m+1):
        for j in range(1,min(i,n)+1):
            for k in range(0,j):
                f[i][j][k] = f[i-1][j][k] + g[i-1][j][k]
                if k != 0: g[i][j][k] = f[i-1][j-1][k] + g[i-1][j-1][k-1]
                else: g[i][j][k] = f[i-1][j-1][k]
    cnt = [0 for i in range(n)]
    for k in range(0,n):
        cnt[k] = f[100][10][k] + g[100][10][k]
    print cnt[1:]
    #(100, 10)
    allSum = 1.0
    for i in range(91,101):  allSum = allSum * i
    for i in range(1,11): allSum /= i
    allSum2 = 0
    for i in range(1,n): allSum2 += (i * cnt[i])
    print allSum2/float(allSum)
if __name__ == "__main__":
    m = 100
    n = 10
    k = n-1
    f = [[[0 for k in range(k+1)] for j in range(n+1)] for i in range(m+1)]
    g = [[[0 for k in range(k+1)] for j in range(n+1)] for i in range(m+1)]
    compute(m,n,f,g)

2.模拟

可以用计算机模拟下，

#!/usr/bin/python
import random
def helper(vec):
    flag = False
    count = 0
    for i in range(len(vec)):
        if vec[i]:
            if flag: count +=1
            else: flag = True
        else:
            flag = False
    return count
N = 100000
score = 0
cnt = [0 for i in range(100)]
for i in range(N):
    count = 0
    for i in range(len(cnt)): cnt[i] = 0
    while count < 10:
        index = random.randrange(0,100)
        if cnt[index]: continue
        count += 1
        cnt[index] = 1
    score += helper(cnt)
print float(score) / N

结果大约是0.9左右。

后话

其实，这题的结果在某种程度上有一点违背直觉。期望在0.9左右，也就是说，平均情况下，会有两个连续的1.

其实跟这个题目类似，数学上，有一个有名的悖论：生日悖论。

生日悖论，指如果一个房间里有23个或23个以上的人，那么至少有两个人的生日相同的概率要大于50%。

算法----bonus dumplings

标签：dp

原文地址：http://blog.csdn.net/shoulinjun/article/details/42217067

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行