听过一些小伙伴被问到一个问题,题目就是:
给你一个字符串,还有这些字符串出现的权重,让你随机生成字符串,并且字符的权重越高,出现的概率越大。
分析:
假设有三个字符:a , b ,c ,它们的权重分别是2,3,5。我们要生成的字符串中的字符必须是这三个字符之一,因为但是权重不同,a,b,c分别占总权重的比例是:20%,30%,50%,这也是它们生成的概率,概率都出来了,那就得根据概率多的,命中的概率越多,于是,来分配一个数字区间[1,10],然后按照出现的概率来分每个字母占用的子区间,概率高的,占用的就越高,可以这样分配:a-[1,2] , b-[3,5],c-[6,10],我们用rand()来生成一个随机数,如果生成的数不是[1,10]之内的,就丢弃掉,这样就可以使在[1,10]之间生成每个数的概率都是一样的,然后根据每次生成的数字去找属于哪个字符的,就选用哪个字符。伪代码如下:
def procedure:
a<-[1,2], b<-[3,5], c<-[6,10]
num <-rand()
if num in [1, 10]:
if num in [1, 2]:
return a
else if num in [3, 5]:
return b
else return c
else return procedure
原文地址:http://blog.csdn.net/kamsau/article/details/39549065