随机数生成算法的研究

随机数生成算法的研究


发布日期: 2016-10-24 更新日期: 2016-11-17 编辑:xuzhiping 浏览次数: 4269

标签:

摘要: 在数据结构、算法分析与设计、科学模拟等方面都需要用到随机数。由于在数学上,整数是离散型的,实数是连续型的,而在某一具体的工程技术应用中,可能还有数据值的范围性和是否可重复性的要求。因此,我们就整数随机数和实数随机数,以及它们的数据值的范围性和是否可重复性,分别...

在数据结构、算法分析与设计、科学模拟等方面都需要用到随机数。由于在数学上,整数是离散型的,实数是连续型的,而在某一具体的工程技术应用中,可能还有数据值的范围性和是否可重复性的要求。因此,我们就整数随机数和实数随机数,以及它们的数据值的范围性和是否可重复性,分别对其算法加以分析和设计。以下以Visual Basic 语言为工具,对整数随机数生成问题加以阐述,而对于实数随机数生成问题,只要稍加修改就可转化为整数随机数生成问题。 

根据整数随机数范围性和是否可重复性,可分为: 

(1)某范围内可重复。 

(2)某范围内不可重复。 

(3)枚举可重复。

(4)枚举不可重复。 

所谓范围,是指在两个数n1和n2之间。例如,在100和200之间这个范围,那么,只要产生的整数随机数n满足100≤n≤200,都符合要求。所谓枚举,是指有限的、已知的、若干个不连续的整数。例如,34、20、123、5、800这5个整数就是一种枚举数,也就是单独可以一个个确定下来。

1.某范围内可重复 

在Visual Basic 语言中,有一个随机数函数Rnd。 语法:Rnd[(number)]。  参数number 可选,number 的值决定了 Rnd 生成随机数的方式。Rnd 函数返回小于 1 但大于或等于 0 的值。 

在调用 Rnd 之前,先使用无参数的 Randomize 语句初始化随机数生成器,该生成器具有一个基于系统计时器的种子。  若要生成某给定范围内的随机整数,可使用以下公式: Int((upperbound - lowerbound + 1) * Rnd + lowerbound)  这里,upperbound 是此范围的上限,而 lowerbound 是范围的下限。

2.某范围内不可重复 

要产生一定范围内不可重复的随机数,按通常的设计是把曾经生成的随机数保存起来作为历史数据。产生一个新的随机数后在历史数据搜索,若找到就重新产生一个新的再重复数据搜索;否则就认为已经找到了一个新的不同随机数。 

例如,要由计算机随机产生10个101~200之间互不相同的数。

运行结果:199  174  147  126  120  190  192  146  122  111 

粗看起来,上面的程序似乎没有什么问题,在执行过程中程序也能够通过。但,仔细分析我们就会发现问题出在一个新产生的随机数是否已经存在的判定上。既然是随机数,那么从数学的角度来说在概率上,每次产生的随机数 r就有可能相同,尽管这种可能性很小,但确是一个逻辑性与正确性的问题。因此,每次产生的新的随机数r都有可能是数组random的前i-1个数中的某一个,也就是说程序在运行过程中由此可能会导致死循环,那么,能否找到一个不在数组random中的随机数r的工作就变得不确定了。从算法的角度来讲,在理论上,程序失去了有穷性、有效性和确定性。 

什么是算法?通常人们将算法定义为一个有穷的指令集,这些指令为解决某一特定任务规定了一个运算序列。一个算法应当具有以下特征: 

(1)输入:一个算法必须有0个或多个输入。它们是算法开始运算前给予算法的量。这些输入取自于特定的对象的集合。它们可以使用输入语句由外部提供,也可以使用置初值语句或赋值语句在算法内提供。 

(2)输出:一个算法应有1个或多个输出,输出的量是算法计算的结果。 

(3)确定性:算法的每一步都应确切地、无歧义地定义。对于每一种情况,需要执行的动作都应严格地、清晰地规定。 

(4)有穷性:一个算法无论在什么情况下,都应在执行有穷步后结束。 

(5)有效性:算法中每一条运算都必须是足够基本的。就是说,它们原则上都能精确地执行,甚至人们只用纸和笔做有限次运算就能完成。 

一般来说,我们所编写的程序都是在特定算法基础上设计出来的,程序常常与算法是相互对应的,在没有特殊的情况下,程序也应当具有以上五个特征。但,也有一些程序在设计中,人们由于疏忽会想当然地认为,程序只要编写出来一般都会自然地符合算法的五个特征,这是应当引为注意的。  那么,应该如何对其进行改进,使其符合算法的五个特征呢? 

仍然以上述由计算机随机产生10个101~200之间互不相同的数为例进行阐述。

首先,把要产生的所有数放到一个数组a中。令upperbound 是此范围的上限,而 lowerbound 是范围的下限。 

第二,每次随机生成数组a的一个下标subscript,然后取出它所对应的数据,将数组a的最后一个数放到下标subscript的位置,同时将数组a长度减1。尽管前若干次生成的下标subscript随机数有可能相同,但,因为每一次都把最后一个数填到取出的位置,因此,相同下标subscript对应的数却绝不会相同,每一次取出的数都不会一样,这样,就保证了算法的确定性、有效性、有穷性。

4枚举可重复 

这种随机数的生成比较简单,只要把各个枚举数放入一个数组中保存起来,然后随机生成数组的下标,最后取出对应下标下的数组的值即可。 流程图和程序可参考前面的论述。

5枚举不可重复 

首先把各个枚举数放入一个数组中保存起来,其它的处理方法完全类似于某范围内不可重复随机数的方法。

6结束语 

上述算法具有很高的应用价值与理论价值。在计算机数据结构、算法分析与设计、科学模拟等方面需要随机数的应用中,都可使用该算法。

关注公众号
获取免费资源

随机推荐


Copyright © Since 2014. 开源地理空间基金会中文分会 吉ICP备05002032号

Powered by TorCMS

OSGeo 中国中心 邮件列表

问题讨论 : 要订阅或者退订列表,请点击 订阅

发言 : 请写信给: osgeo-china@lists.osgeo.org