本福特定律的介绍

2024-05-06 18:49

1. 本福特定律的介绍

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。

本福特定律的介绍

2. 本福特定律的解释

1881年,天文学家西蒙·纽康伯发现对数表包含以1起首的数那首几页较其他页破烂。可是,亦可以以任何书起首数页也会较破烂这个观点解释。这个故事可能是虚构的。1938年,物理学家法兰克·本福特重新发现这个现象,还通过了检查许多数据来证实这点。2009年,西班牙数学家在素数中发现了一种新模式,并且惊讶于为何那时才为人发现。虽然素数一般被认为是随机分布的,但西班牙数学家发现素数数列中每个素数的首位数字有明显的分布规律,它可以被描述了素数的本福德法则。这项新发现除了提供对素数属性的新洞见之外,还能应用于欺骗检测和股票市场分析等领域。数字统计的一种内在规律,指所有自然随机变量,只要样本空间足够大,每一样本首位数字为1至9各数字的概率在一定范围内具有稳定性。见右图。即以1开首的样本占样本空间的0.3,以2开首的样本占样本空间0.17-0.19,而以9或8开首的样本始终只占0.05左右。世界上千千万万的数据的开头数字是1到9中的任何一个数字,而且每个数字打头的概率本应该差不多,但如果你统计的数据足够多,就会惊讶地发现,打头数字是1的数据最多。1935年,美国的一位叫做本福特的物理学家在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时被更多的人翻阅。本福特再进一步研究后发现,只要数据的样本足够多,数据中以1为开头的数字出现的频率并不是1/9,而是30.1%。而以2为首的数字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,只有4.6%。本福特开始对其它数字进行调查,发现各种完全不相同的数据,比如人口、物理和化学常数、棒球统计表以及斐波纳契数列数字中,均有这个定律的身影。1961年,一位美国科学家提出,本福特定律其实是数字累加造成的现象,即使没有单位的数字。比如,假设股票市场上的指数一开始是1000点,并以每年10%的程度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由2000点上升到3000点只需要4年多时间;但是,如果要让指数从10000点上升到20000点,还需要等7年多的时间。因此我们看到,以1为开头的指数数据比以其他数字打头的指数数据要高很多。2001年,美国最大的能源交易商安然公司宣布破产,当时传出了该公司高层管理人员涉嫌做假账的传闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。

3. 本福特定律的含义


本福特定律的含义

4. 本福特定律的说明

本福特定律说明在b进位制中,以数n起头的数出现的机率为logb(n + 1) − logb(n) .本福特定律不但适用于个位数字,连多位的数也可用。在十进制首位数字的出现机率(%,小数点后一个位):  d  p  1  30.1%  2  17.6%  3  12.5%  4  9.7%  5  7.9%  6  6.7%  7  5.8%  8  5.1%  9  4.6%

5. 本福特定律的定义

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。

本福特定律的定义

6. 本福特定律原理是什么

本福特定律原理是什么:
本福特定律 ,也称为 本福特法则 ,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现 概率 约为总数的三成,接近直觉得出之 期望值 1/9的3倍。

不完整解释:
一组平均增长的数据开始时,增长得较慢,由最初的数字a增长到另一个数字 a+1起首的数的时间,必然比a+1起首的数增长到a+2,需要更多时间,所以出现率就更高了。
从数数目来说,顺序从1开始数,1,2,3,...,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,...,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。

应用:它能用于在会计、金融甚至选举中出现的数据。该定律被华盛顿邮报上的一篇文章引用,该文章以此为基础声称2009年伊朗总统大选中有造假。
历史:
1881年,天文学家西蒙·纽康发现对数表包含以1起首的数那首几页较其他页破烂。可是,亦可以以任何书起首数页也会较破烂这个观点解释。这个故事可能是虚构的。
1938年,物理学家法兰克·本福特重新发现这个现象,还通过了检查许多数据来证实这点。

7. 知识|本福特定律

先问大家一个问题:
  
 如果你的回答是1/9,那么恭喜你,你是正常人,点开这篇文章是你正确的选择!
  
 1935年的某一天,物理学家富兰克.本福特(Frank.Benford)在图书馆查阅资料,他在翻阅对数表时,发现对数表的头几页要比后面的页脏一些。
  
 话说聪明的脑袋是一样的,愚笨的脑袋各式各样。牛顿的脑袋被苹果砸中,于是发现了万有引力。本福特也是如此,他拍了一下脑袋,发现了“本福特定律”。
  
 对数表的前几页比后面的脏,这说明有更多的人查阅头几页,这说明以1、2、3开头的数据比7、8、9开头的数据多。
  
 本福特搜集了人口、地理、经济等许多统计数据进一步分析,发现自然数据源,只要样本足够多,数据中以1为打头的数字出现的频率并不是1/9,而是30.1%。以2开头的数字出现的频率是17.6%。往后出现频率依次减少,以9为首的数字出现的频率最低,只有4.6%。
  
 本福特定律的应用条件是:
  
 会计师怎样利用本福特定律呢?
  
 我们知道会计数据是以货币计量的信息,这些从小到大自然累加的数据必然是符合“本福特定律”的。我们通过分析一家公司的财务数据,对照上面的表格,基本可以判断这些财务数据是否经过“人为修饰”。
  
 2001年12月,全球500强中排名第七的安然公司在股价持续下跌的情况下向法庭申请破产,并向美国证监会承认会计造假。
  
 安然事件引起公众对会计数据造假的关注,直接导致了2002年8月《萨班斯法案》的诞生。
  
 事后,有好事者发现安然公司公布的财务数据不符合“本福特定律”,这证明安然公司的高层确实改动过财务数据。

知识|本福特定律

8. 本福特定律如何证明?

1938年,本福特发现了统计报表中的这样一个规律:

    一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用於检查各种数据是否有造假。

在十进制首位数字的出现机率(%,小数点后一个位):

 
1  30.1%
2  17.6%
3  12.5%
4  9.7%
5  7.9%
6  6.7%
7  5.8%
8  5.1%
9  4.6%


证明如下:假设我们有一个很大的样本空间,有随机变量x�6�9,x�6�0,...,x_{n},这里n足够大。x�6�9,x�6�0,...,x_{n}的演化规律可以用上边所讲的指数方程来模拟。

如果我们对于指数定律的解两边取以10为底的对数,我们就会得到lg x(t)正比于时间t的结论。
 
如果我们问变量x介于80-90的概率有多大,我们只需要求出x(t=80)时t的解t�6�9,和x(t=90)时t的解t�6�0. 那么占总时间T的比率(t�6�0-t�6�9)/T即为x介于80-90的概率。

那么如果我们问首位数字是8的概率呢?多亏了duanx和zhuww的想法,我们只需要关心lg x的小数部分介于lg 8和lg 9之间的长度为多少即可。

这是由于关于10的对数lg x的整数部分决定着x是几位数(整数部分是1,说明是两为数;整数部分是2,说明是3位数……)。而lg x的小数部分则决定着x的每位数字是什么。

如果画一个lg x的小数部分关于时间t的图像,实际上就相当于把lg x的图像折叠到[lg 0,lg 10]区间。这样,我们就不需要关心时间T有多大,因为时间轴也被折叠了。那么首位数字为D的概率即为 [lg(D+1)-lg(D)]/(lg 10-lg 1)=lg(D+1)-lg(D)。

以上结果即为本福特发现的规律
最新文章
热门文章
推荐阅读