什么是概率?

社区文章 发布于2024年1月8日

我又回来写博客了,这次是关于探索和交流复杂话题的。这次选择的话题是《概率》。

在我本科的时候,我从未被给予概率的直觉。我认为 Chris Piech 在他的课程 CS-109 中对这个话题做得非常出色。请随时跳过这篇博客文章,直接前往免费提供的 YouTube 讲座

在我们开始概率之旅之前,需要强调两个术语:

1. 样本空间

样本空间是实验所有可能结果的集合。考虑掷骰子。样本空间是所有可能的结果:{1, 2, 3, 4, 5, 6}。

2. 事件空间

它是样本空间的一个子集。本质上,事件空间指的是样本空间中有多少个结果满足某个语义事件。如果我们对掷出偶数感兴趣,那么事件空间是样本空间的一个子集:{2, 4, 6}。

现在我们已经解决了这些术语,我们可以开始理解概率到底是什么了。

概率是一个介于 0 和 1 之间的术语,我们赋予它某种意义。

花点时间思考一下。它没有提出一个具体的想法,它只是一个松散的(如果你愿意)解释。这里的关键思想是我们如何赋予概率以意义。

想象一下你要无限次重复一个实验。你计算你想要的事件发生的次数。将计数归一化到 0 和 1 之间,我们就得到了事件的概率。

P(E)=limnn(E)n P(E) = \lim_{n \to \infty} \frac{n(E)}{n}

这里,n(E)n(E) 表示事件 E 发生的次数,而 nn 是实验的总次数。随着我们重复实验的次数越来越多,这些数字的比率会接近事件的真实概率。

这种对概率的直觉并没有谈论事件发生的确定性,而是宇宙为我们带来的不确定性。概率可以被认为是一种表达事件不确定性的语言(太哲学了?)。

概率公理

在了解了概率的最基本知识之后,我们现在进入分析概率的世界。要解决所有分析概率问题,我们只需要知道以下三个公理。

公理 1:0P(E)10 \leq P(E) \leq 1

公理 2:P(S)=1P(S)=1

恒等式 3:P(Ec)=1P(E)P(E^{c}) = 1 - P(E)

等可能事件

在谈论概率时,理解我们如何定义样本空间——即所有可能结果的集合——至关重要。在某些情况下,例如公平的抛硬币,样本空间中的所有结果都是等可能的。但在许多其他情况下,并非如此,假设如此可能会导致不正确的结论。

以彩票为例。我们可能认为样本空间只包含两个结果:中奖或不中。但如果说中奖概率是 50%,那会产生误导,因为并非所有结果都等可能。中彩票的概率远低于不中。

现在,让我们考虑一个结果确实等可能的场景:掷两个骰子。

掷两个骰子的样本空间

当我们掷两个骰子时,每个骰子有 6 个面,所以总共有 36 种可能的组合(第一个骰子的 6 个面乘以第二个骰子的 6 个面)。这些组合都是等可能的。因此,我们的样本空间由表示每个骰子结果的对组成,如下所示:

[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
 (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
 (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
 (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
 (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
 (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)]

计算特定事件的概率

假设我们对两个骰子的和等于 7 的事件感兴趣。满足此条件的组合是:

(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)

有 6 种结果使和为 7。由于总共有 36 种可能的结果,此事件的概率为 6/36,即 1/6。

设置样本空间时常见的错误

理解样本空间的结构是正确计算概率的关键。让我们来看看一些常见的错误:

  1. 只考虑和:如果我们只看可能的和(2 到 12),我们的样本空间将是 [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],事件空间只有 [7]。这样计算概率得到 1/11,这是不正确的。发生此错误是因为每个和并非等可能;例如,掷出 7 的方式比掷出 2 的方式更多。

  2. 假设骰子不可区分:如果我们把骰子看作不可区分的,我们的样本空间会变小,只包含唯一的对,例如:

{{1, 1}, {1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6},
         {2, 2}, {2, 3}, {2, 4}, {2, 5}, {2, 6},
                 {3, 3}, {3, 4}, {3, 5}, {3, 6},
                         {4, 4}, {4, 5}, {4, 6},
                                 {5, 5}, {5, 6},
                                         {6, 6}}

在这种情况下,事件空间是 {1, 6}, {2, 5}, {3, 4}。然后概率似乎是 3/21,这是错误的。这里的错误是没有认识到像 {1, 2} 和 {2, 1} 这样的结果是不同的,应该分开计算。

  1. 正确的方法——可区分的骰子:准确的方法是将每个骰子视为可区分的,从而得到正确的样本空间和概率,正如我们最初讨论的那样。

重要启示

在概率论中,正确理解和定义样本空间至关重要。当结果并非等可能时(如彩票),对样本空间的假设可能导致不正确的概率。相反,对于两个可区分的骰子,每个结果都是等可能的,这使得计算变得简单。

致谢

感谢 Sohini Sengupta 对本博客文章的初步审阅。

社区

注册登录 评论