标准正态分布函数的快速计算方法
标准正态分布的分布函数ΦxΦx可以说是统计计算中非常重要的一个函数,基本上有正态分布的地方都或多或少会用上它。在一些特定的问题中,我们需要大量多次地计算这个函数的取值,比如我经常需要算正态分布与另一个随机变量之和的分布,这时候就需要用到数值积分,而被积函数就包含ΦxΦx。如果ZN01XfxZN01Xfx,ff是XX那么ZXZX的分布函数就是的密度函数,
PZX≤t∫∞∞ΦtxfxdxPZX≤t∫∞∞Φtxfxdx我们知道,ΦxΦx没有简单的显式表达式,所以它需要用一定的数值方法进行计算。在大部分的科学计算软件中,计算的精度往往是第一位的,因此其算法一般会比较复杂。当这个函数需要被计算成千上万次的时候,速度可能就成为了一个瓶颈。当然有问题就会有对策,一种常见的做法是略微放弃一些精度,以换取更简单的计算。在大部分实际应用中,一个合理的误差大小,例如107107,一般就足够了。在这篇文章中,给大家介绍两种简单的方法,它们都比R中自带的在107107的级别。p
orm更快,且误差都控制
f第一种办法来自于经典参考书Abramowitza
dStegu
Ha
dbookofMathematicalFu
ctio
s
的公式26217。其基本思想是把ΦxΦx表达成正态密度函数ΦxΦx和一个有理函数的乘积。这种办法可以保证误差小于75×10875×108,一段C实现可以在这里找到。(代码中的常数与书中的略有区别,是因为代码是针对误差函数erfxerfx编写的,它与ΦxΦx相差一些常数)我们来对比一下这种方法与R中其精度。
libraryRcppsourceCpp