大数定律

作者：一名来源：文库发布时间：2013-3-28 11:20:16 点击数：

导读:大数定律又称大数法则、大数律，是个数学与统计学的概念，意指数量越多，则其平均就越趋近期望值。人们发现，在重复试验中，随着试验次数的增加，事件发生的频率趋于一个稳定值；人们同时也发现，在对物理量的测量实践…

大数定律又称大数法则、大数律，是个数学与统计学的概念，意指数量越多，则其平均就越趋近期望值。

人们发现，在重复试验中，随着试验次数的增加，事件发生的频率趋于一个稳定值；人们同时也发现，在对物理量的测量实践中，测定值的算术平均也具有稳定性。

大数定律通俗一点来讲，就是样本数量很大的时候，样本均值和真实均值充分接近。这一结论与中心极限定理一起，成为现代概率论、统计学、理论科学和社会科学的基石之一，重要性在本人看来甚至不弱于微积分。（有趣的是，虽然大数定律的表述和证明都依赖现代数学知识，但其结论最早出现在微积分出现之前。而且在生活中，即使没有微积分的知识也可以应用。例如，没有学过微积分的学生也可以轻松利用excel或计算器计算样本均值等统计量，从而应用于社会科学。）

最早的大数定律的表述可以追溯到公元1500年左右的意大利数学家Cardano。1713年，著名数学家James (Jacob) Bernouli正式提出并证明了最初的大数定律。不过当时现代概率论还没有建立起来，测度论、实分析的工具还没有出现，因此当时的大数定律是以“独立事件的概率”作为对象的。后来，历代数学家如Poisson（“大数定律”的名字来自于他）、Chebyshev、Markov、Khinchin（“强大数定律”的名字来自于他）、Borel、Cantelli等都对大数定律的发展做出了贡献。直到1930年，现代概率论奠基人、数学大师Kolgomorov才真正证明了最后的强大数定律。

下面均假设X, X_1,...,X_n是独立同分布随机变量序列，均值为u。独立同分布随机变量和的大数定律常有的表现形式有以下几种。

初等概率论

(1). 带方差的弱大数定律：若E(X^2)小于无穷，则S_n/n-u依概率收敛到0。

证明方法：Chebyshev不等式即可得到。这个证明是Chebyshev给出的。

(2). 带均值的弱大数定律：若u存在，则S_n/n-u依概率收敛到0。

证明方法：用Taylor展开特征函数，证明其收敛到常数，得到依分布收敛，然后再用依分布收敛到常数等价于依概率收敛。

现代概率论

(3). 精确弱大数定律：若xP(|X|>x) 当x趋于无穷时收敛到0，则S_n/n-u_n依概率收敛到0，其中u_n=E[X 1_{|X|<n}]. （在这个定理里，不需要u存在。）

证明方法：需要用到截断随机变量 X 1_{|X|<n}. 然后要用的三角阵列的依概率收敛定理和Fubini定理分析积分变换。

(4). 带4阶矩的强大数定律：若E(X^4)小于无穷，则S_n/n-u几乎必然收敛到0.

证明方法：与(1)类似，先用Chebyshev不等式。然后因为4阶矩的存在，得到P(S_n>nt)对任意常数t的收敛速度足够快，满足Borel-Cantelli的要求，用Borel-Cantelli引理得到大数定律。

(5). 带方差的强大数定律：若E(X^2)小于无穷，则S_n/n-u几乎必然收敛到0.

证明方法：用Kolgoromov三级数定理和Kronecker引理。

(6). 精确强大数定律：若u存在，则S_n/n-u几乎必然收敛到0.

证明方法：这个大数定律的证明确实有几种不同的方法。最早的证明是由数学大师Kolgoromov给出的。Durrett (2010)的书上用的是Etemadi (1981)的方法，需要截断X，用到现代概率论的知识如Borel-Cantelli引理、Kolgomorov三级数定理、Fubini定理等。（感谢读者指出，Durrett的书在倒向鞅一章中给出了大数定律的倒向鞅方法证明，只需要用到倒向鞅的知识和Hewitt-Savage 0-1律，不过这也是现代概率论的知识。）

此外，还有很多不同的大数定律，不同分布的，不独立的序列等。定律也不一定是关于随机变量的，也可以是关于随机函数的，甚至随机集合的等等。以数学家命名的也有Khinchin大数定律(不独立序列的强大数定律)、Chebyshev大数定律(弱大数定律(1))、Poisson大数定律(不同概率的随机事件序列的大数定律)、Bernoulli大数定律(随机事件的大数定律)、Kolgomorov大数定律(强大数定律(6))等等……

以上(1-6)是常见的独立同分布序列的大数定律。其中，(3)和(6)是最严格也是最精妙的结果，证明所涉及的高等概率论知识也最多。它们成立的条件不仅是充分条件，也是必要条件，因此它们算是完结了大数定律的发展。大数定律的发展符合数学的一般规律：想证明某一结论，条件越弱（弱大数定律：2阶矩条件->1阶矩条件->没矩条件；强大数定律：4阶矩条件->2阶矩条件->1阶矩条件），证明也就变得越难。

虽然只有(3)和(6)是最精确的结果，但是必须认识到，数学的发展是一个循序渐进的过程，如果没有前面那些更强条件下的定理，也无法得到最后的大数定律。从最开始的自然界观察到大数定律的存在，到最后证明最终形式，历时数百年，现代概率论也在这个过程中建立起来。此外，虽然(3)和(6)比前面的(1)和(5)强很多，但是(1)和(5)的条件仅仅是2阶矩（或方差）的存在，因此他们在几百年间早就被广泛使用，对于一般的社会科学问题、统计问题等已经足足够用了。

总之，大数定律包含概率论里核心的知识。“大数定律的四种证法”尽管表述模糊，原意也充满调侃，但并不是真如《孔乙己》里"回字四种写法"所暗示的那样迂腐或毫无价值。作为概率或统计专业的研究生，弄懂这些定理表述的区别和证明方法的区别和联系，了解前代数学家的工作，对于深刻理解现代概率论是很有好处的。当然，任何人也不应去死记硬背这些证法（我自己也记不住这些证法），只要能理解、弄清其中微妙即可。

上一篇：从合约角度看公司与市场下一篇：问题定律、守恒定律等

没有找到相关文章！

首席专家

首席专家王科峰