• 我们认为极不可能发生的事情实际上一直在我们周围发生。真正大数的数学定律以及组合定律有助于解释原因。
  • 房间里只有 23 个人,其中两人生日相同的概率为 0.51,大于 50%。
  • 保加利亚彩票于2009年9月6日随机抽取了中奖号码4、15、23、24、35、42。四天后,又抽取了相同的号码。北卡罗来纳州 Cash 5 彩票在 2007 年 7 月 9 日至 11 日产生了相同的中奖号码。奇怪吗?不是按照概率。

1b809d39-c8dc-4196-b480-f79ebaaa90db.png

改编自David J. Hand的《非概率原理:为什么每天都会发生巧合、奇迹和罕见事件》,最初发表于《科学美国人》310, 2, 72-75(2014 年 2 月),标题为“Never Say Never”,doi:10.1038/scientificamerican0214-72

我称之为“非概率原理”的一组数学定律告诉我们,我们不应该对巧合感到惊讶。事实上,我们应该期待巧合的发生。该原理的关键之一是真大数定律。该定律规定,只要有足够的机会,我们就应该预期特定事件会发生,无论每次机会发生的可能性有多大。但有时,当机会确实很多时,看起来却相对较少。这种误解导致我们严重低估了事件发生的概率:我们认为某件事极不可能发生,而实际上它很有可能,甚至几乎可以肯定。

非概率原理(Improbability Principle)是David J. Hand对一系列概率法则的统称。这个原理体现在几个层面,其中一些涉及宇宙构建的基本法则;另一些则取决于概率的本质属性;还有一些涉及人类心理学层面,即大脑不是简单的记忆工具。这些法则包括:必然法则、巨数法则、选择法则、概率杠杆法则和够近法则。在适当的情况下,任何一条法则发挥作用,都有可能导致少见的事件发生。

大量的机会怎么会出现而人们却没有意识到它们的存在呢?组合定律(非概率原理的相关部分)指明了道路。它说:相互作用元素的组合数量随着元素数量呈指数增长。“生日问题”就是一个众所周知的例子。

生日问题提出了以下问题:一个房间里必须有多少人才能使其中两个人的生日更有可能相同?

答案是 23。如果房间里有 23 人或更多人,那么很有可能两个人的生日相同。

现在,如果您以前没有遇到过生日问题,这可能会让您感到惊讶。二十三听起来似乎是一个太小的数字。也许您的推理如下:任何特定的人与我生日相同的可能性只有三百六十五分之一。因此,任何特定的人都有 364/365 的机会与我的生日不同。如果房间里有n个人,其他n -1 个人与我生日不同的概率为 364/365,那么所有n -1 人与我生日不同的概率为 364/365 × 364/365 × 364/365 × 364/365 … × 364/365,其中 364/365 相乘n − 1 次。如果n为 23,则为 0.94。

因为这是他们中没有人与我生日相同的概率,所以他们中至少有一个人与我生日相同的概率仅为 1 − 0.94。(由此推断,要么有人与我同一天生日,要么没有人与我同一天生日,因此这两个事件的概率加起来必须为 1)现在,1 − 0.94 = 0.06。那是非常小的。

然而,这是一个错误的计算,因为这个概率(某人与你生日相同的概率)并不是问题所要求的。它询问同一房间内任意两个人生日相同的概率。这包括其他人之一与您生日相同的概率(这是我在上面计算的),但也包括其他两个或更多人生日相同但与您不同的概率。

这就是组合发挥作用的地方。虽然只有n − 1 个人可能与您生日相同,但房间里总共有n × ( n − 1)/2 对人。随着n变大,该对的数量迅速增长。当n等于 23 时,它是 253,是n − 1 = 22的 10 倍多。也就是说,如果房间里有 23 个人,则可能有 253 对人,但只有 22 对包括你。

那么我们来看看房间里 23 个人没有同一天生日的概率。对于两个人来说,第二个人与第一个人生日不同的概率是 364/365。那么这两个不同并且第三个与他们中的任何一个生日不同的概率是 364/365 × 363/365。同样,这三个人生日不同,而第四个生日与前三个人生日不同的概率为 364/365 × 363/365 × 362/365。如此下去,23个人中没有一个生日相同的概率为364/365 × 363/365 × 362/365 × 361/365 … × 343/365。

这等于 0.49。因为 23 个人中没有一个生日相同的概率为 0.49,所以其中一些人生日相同的概率仅为 1 − 0.49,即 0.51,大于一半。

赢得彩票

77138d1e-946c-40b1-a244-471f9e8a59a4.jpg

对于看似不可能的事件实际上很有可能发生的另一个例子,让我们看看彩票。2009年9月6日,保加利亚彩票随机选出4、15、23、24、35、42作为中奖号码。这些号码并没有什么奇怪的。组成数字的数字都是低值——1、2、3、4或5——但这并不罕见。此外,还有一对连续的值,23 和 24,尽管这种情况发生的频率比通常理解的要高得多(例如,如果您要求人们从 1 到 49 中随机选择六个数字,他们选择连续对的频率比纯数字要低)有机会的话)。

令人惊讶的是四天后发生的事情:9月10日,保加利亚彩票随机选出了4、15、23、24、35、42作为中奖号码——与上周完全相同的号码。该事件当时引起了媒体风暴。“这在彩票 52 年的历史上还是第一次发生。看到如此反常的巧合,我们感到非常震惊,但它确实发生了,”路透社 9 月 18 日的一篇文章援引一位发言人的话说。保加利亚时任体育部长斯维伦·内科夫下令进行调查。是否存在大规模欺诈行为?之前的数字是否被复制了?

事实上,这个相当令人震惊的巧合只是非概率原理的另一个例子,其形式是由组合定律放大的真正大数定律。首先,许多彩票是在世界各地进行的。其次,它们一次又一次、年复一年地发生。这迅速增加了彩票号码重复的大量机会。第三,组合法则生效:每次抽奖结果都可能包含与之前任何一次抽奖中产生的相同的数字。一般来说,与生日情况一样,如果您进行n次抽奖,则有n × ( n − 1)/2 对抽奖可能具有匹配的数字字符串。

2009 年重复号码的保加利亚彩票是 49 中的 6 彩票,因此任何一组特定的 6 个号码出现的机会是 13,983,816 分之一。这意味着任何特定的两次平局匹配的机会是 13,983,816 分之一。但是三场抽签中的两场抽签相匹配的概率又如何呢?或者 50 次抽奖中,有两次抽奖相匹配的几率是多少?

3 次抽签中可能有 3 对,但 50 次抽签中可能有 1,225 对。组合法则正在发挥作用。如果我们更进一步,在 1,000 次抽奖中,有 499,500 个可能的对。换句话说,如果我们将抽奖次数乘以 20,从 50 增加到 1,000,对配对数量的影响要大得多,几乎乘以 408,从 1,225 增加到 499,500。我们正在进入真正大数的领域。

需要抽多少次才能使两次抽中相同的六个数字的概率大于二分之一,这样该事件的可能性就更大?使用我们在生日问题中使用的相同方法得到的答案是 4,404。

如果每周进行两次抽签,一年就进行104次,这样的抽签次数将需要不到43年。这意味着 43 年后,彩票机抽出的 6 个号码中,有两个号码很可能会完全匹配。这让保加利亚女发言人的评论变得截然不同,称这是一个奇怪的巧合!

这只是一张彩票的费用。当我们考虑到世界各地彩票的数量时,我们发现如果抽奖不偶尔重复,那将是令人惊奇的。因此,您不会惊讶地发现,在以色列的 Mifal HaPayis 国家彩票中,2010 年 10 月 16 日抽出的号码(13、14、26、32、33、36)与几周前抽出的号码完全相同, 9 月 21 日。你不会对此感到惊讶,但大量的人涌入以色列的谈话广播节目,抱怨彩票被操纵。

保加利亚的彩票结果很不寻常,因为连续抽奖中出现了重复的号码。但是,真正的大数字定律,再加上世界各地有许多彩票定期推出他们的数字这一事实,意味着我们不应该太惊讶——所以我们不应该在听到这件事发生时感到惊讶前。例如,北卡罗来纳州 Cash 5 彩票在 2007 年 7 月 9 日至 11 日产生了相同的中奖号码。

1980 年莫琳·威尔科克斯 (Maureen Wilcox) 身上发生的事情说明了组合法则产生彩票匹配的另一种相当令人沮丧的方式。她购买了包含马萨诸塞州彩票和罗德岛彩票中奖号码的彩票。然而,对她来说不幸的是,她的马萨诸塞州彩票中奖号码包含罗德岛彩票的中奖号码,反之亦然。如果您购买 10 张彩票,您就有 10 次中奖机会。但 10 张彩票意味着 45 对彩票,因此 10 张彩票中的一张与 10 次抽奖中的一次相匹配的机会比您中奖的机会大四倍多。出于显而易见的原因,

当有许多相互作用的人或物体时,组合法则适用。举例来说,假设我们班有 30 名学生。他们可以通过多种方式进行互动。可以个人工作:有30人;他们可以成对工作——有 435 个不同的对;它们可以组合成三元组——有 4,060 种可能的不同三元组;依此类推,当然,直到他们全部一起工作——所有 30 名学生中有一组一起工作。

总共,可以组成的不同学生群体的数量为 1,073,741,823。这个数字超过 10 亿,全部来自 30 名学生。一般来说,如果一个集合有n 个元素,则可以形成2 n − 1 个可能的子集。如果n = 100,结果为 2 100 − 1,约等于 10 30,对任何人来说都是一个真正的大数。

但如果 10 30对您来说还不够大,请考虑一下万维网的影响,万维网拥有大约 25 亿用户,任何用户都可以与其他用户进行交互。这给出了 3 × 10 18对和 10 750,000,000个可能的交互成员组。如果你给它们很多发生的机会,即使是概率很小的事件也几乎是确定的。

下次当你遇到看似奇怪的巧合时,请想想非概率原理。

VIA https://www.scientificame……

本文由 CulmartPlay 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论