什么是概率?
我又回来写博客了,这次是关于探索和交流复杂话题的。这次选择的话题是《概率》。
在我本科的时候,我从未被给予概率的直觉。我认为 Chris Piech 在他的课程 CS-109 中对这个话题做得非常出色。请随时跳过这篇博客文章,直接前往免费提供的 YouTube 讲座。
在我们开始概率之旅之前,需要强调两个术语:
1. 样本空间
样本空间是实验所有可能结果的集合。考虑掷骰子。样本空间是所有可能的结果:{1, 2, 3, 4, 5, 6}。
2. 事件空间
它是样本空间的一个子集。本质上,事件空间指的是样本空间中有多少个结果满足某个语义事件。如果我们对掷出偶数感兴趣,那么事件空间是样本空间的一个子集:{2, 4, 6}。
现在我们已经解决了这些术语,我们可以开始理解概率到底是什么了。
概率是一个介于 0 和 1 之间的术语,我们赋予它某种意义。
花点时间思考一下。它没有提出一个具体的想法,它只是一个松散的(如果你愿意)解释。这里的关键思想是我们如何赋予概率以意义。
想象一下你要无限次重复一个实验。你计算你想要的事件发生的次数。将计数归一化到 0 和 1 之间,我们就得到了事件的概率。
这里, 表示事件 E 发生的次数,而 是实验的总次数。随着我们重复实验的次数越来越多,这些数字的比率会接近事件的真实概率。
这种对概率的直觉并没有谈论事件发生的确定性,而是宇宙为我们带来的不确定性。概率可以被认为是一种表达事件不确定性的语言(太哲学了?)。
概率公理
在了解了概率的最基本知识之后,我们现在进入分析概率的世界。要解决所有分析概率问题,我们只需要知道以下三个公理。
公理 1:
公理 2:
恒等式 3:
等可能事件
在谈论概率时,理解我们如何定义样本空间——即所有可能结果的集合——至关重要。在某些情况下,例如公平的抛硬币,样本空间中的所有结果都是等可能的。但在许多其他情况下,并非如此,假设如此可能会导致不正确的结论。
以彩票为例。我们可能认为样本空间只包含两个结果:中奖或不中。但如果说中奖概率是 50%,那会产生误导,因为并非所有结果都等可能。中彩票的概率远低于不中。
现在,让我们考虑一个结果确实等可能的场景:掷两个骰子。
掷两个骰子的样本空间
当我们掷两个骰子时,每个骰子有 6 个面,所以总共有 36 种可能的组合(第一个骰子的 6 个面乘以第二个骰子的 6 个面)。这些组合都是等可能的。因此,我们的样本空间由表示每个骰子结果的对组成,如下所示:
[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)]
计算特定事件的概率
假设我们对两个骰子的和等于 7 的事件感兴趣。满足此条件的组合是:
(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)
有 6 种结果使和为 7。由于总共有 36 种可能的结果,此事件的概率为 6/36,即 1/6。
设置样本空间时常见的错误
理解样本空间的结构是正确计算概率的关键。让我们来看看一些常见的错误:
只考虑和:如果我们只看可能的和(2 到 12),我们的样本空间将是
[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
,事件空间只有[7]
。这样计算概率得到 1/11,这是不正确的。发生此错误是因为每个和并非等可能;例如,掷出 7 的方式比掷出 2 的方式更多。假设骰子不可区分:如果我们把骰子看作不可区分的,我们的样本空间会变小,只包含唯一的对,例如:
{{1, 1}, {1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6},
{2, 2}, {2, 3}, {2, 4}, {2, 5}, {2, 6},
{3, 3}, {3, 4}, {3, 5}, {3, 6},
{4, 4}, {4, 5}, {4, 6},
{5, 5}, {5, 6},
{6, 6}}
在这种情况下,事件空间是 {1, 6}, {2, 5}, {3, 4}
。然后概率似乎是 3/21,这是错误的。这里的错误是没有认识到像 {1, 2} 和 {2, 1} 这样的结果是不同的,应该分开计算。
- 正确的方法——可区分的骰子:准确的方法是将每个骰子视为可区分的,从而得到正确的样本空间和概率,正如我们最初讨论的那样。
重要启示
在概率论中,正确理解和定义样本空间至关重要。当结果并非等可能时(如彩票),对样本空间的假设可能导致不正确的概率。相反,对于两个可区分的骰子,每个结果都是等可能的,这使得计算变得简单。
致谢
感谢 Sohini Sengupta 对本博客文章的初步审阅。