趣学贝叶斯统计:量化
概率理论不仅仅是一个数学概念,更是一种对随机性和不确定性的理解方式。通过量化我们对事件发生的信念,我们能够更准确地预测和解释各种现象。在本章中,我们将探讨事件概率与信念概率,为我们的理论和分析工具箱增添新的维度。
事件概率
计算概率最常见的方法是对事件结果计数。对事件来说,有两组结果很重要。第一组是一个事件(event)的所有可能结果(事件概率)。第二组是你感兴趣的结果的计数(信念概率)。
计算机通常将“真”表示为1,将“假”表示为0。概率同样可以使用这个模型:P(X=0)等同于X=假,P(X=1)则等同于X为真。在0和1之间,存在无限多可能的取值。概率值接近0意味着我们更确定某件事情为假,而概率值接近1则意味着我们更确定某件事情为真。值得注意的是,概率为0.5意味着完全不能确定某件事情是真还是假。
举例:
就以掷硬币这个简单例子来说,可能的结果是硬币落地后正面朝上或反面朝上。第一步是对所有可能的事件进行统计,在这个例子中,有两个:出现正面或出现反面
Ω
=
{
正面,反面
}
\Omega={\{正面,反面\}}
Ω={正面,反面}
P
(
正面
)
=
{
正面
}
{
正面
,
反面
}
P(正面)=\frac{ \{正面\}} {\{正面,反面\}}
P(正面)={正面,反面}{正面}
复杂版:
掷2枚硬币时,至少出现一个正面的概率是多少?
Ω
=
{
(
正面,正面
)
,
(
正面,反面
)
,
(
反面,反面
)
,
(
反面,正面
)
}
\Omega=\{(正面,正面),(正面,反面),(反面,反面),(反面,正面)\}
Ω={(正面,正面),(正面,反面),(反面,反面),(反面,正面)}
为了计算出至少出现一个正面的概率,需要确认有多少组合符合条件:
(
正面
,
正面
)
,
(
正面
,
反面
)
,
(
反面
,
正面
)
{(正面, 正面), (正面, 反面), (反面, 正面)}
(正面,正面),(正面,反面),(反面,正面)
我们关心的事件集合中有3个元素,所有可能的组合则有4种。所以:
P
(
正面
)
=
3
4
P(正面)=\frac{3}{4}
P(正面)=43
信念概率
定义:度量事件稳健性。“我在多大程度上相信下一次掷硬币会出现正面”。
前提:
1
−
P
(
x
)
=
¬
P
(
x
)
1 - P(x) = \neg P(x)
1−P(x)=¬P(x)
举例:
曼德拉效应
“曼德拉效应”:人们的记忆被混淆。以为他入狱去世,其实他出狱后当了南非总统,2013年才去世。
P
(
H
没有相关文章
)
P
(
H
有相关文章
)
=
20
\frac{ P(H没有相关文章)} {P(H有相关文章)} =20
P(H有相关文章)P(H没有相关文章)=20
计算:
① 1 − P ( H 有相关文章 ) = P ( H 没有相关文章 ) 1 - P(H有相关文章) = P(H没有相关文章) 1−P(H有相关文章)=P(H没有相关文章)
② P ( H 没有相关文章 ) P ( H 有相关文章 ) = 100 5 = 20 \frac{ P(H没有相关文章)} {P(H有相关文章)} =\frac{100}{5}=20 P(H有相关文章)P(H没有相关文章)=5100=20
(1)解不等式,保留P(H没有相关文章)
P(H有相关文章)=1-P(H没有相关文章)
(2)把P(H有相关文章)代入②
解得:
P(H没有相关文章)=
20
21
\frac{20}{21}
2120
(3)抽象化:
P ( H ) = O ( H ) 1 + O ( H ) = 20 { P(H)}=\frac {O(H)}{1+O(H)} =20 P(H)=1+O(H)O(H)=20
符号O(H)通常表示"Hypothesis H的几率比"或者"Hypothesis H的几率(odds)”
投硬币
前提:
① H(正面)=H(反面)
②P(H正面)=1-P(H反面)
用①②计算:
P
正面
P
反面
\frac{P正面}{P反面}
P反面P正面
我认为结果为正面的可能性是为反面的可能性的多少倍
结果:
1
2
\frac {1}{2}
21
验证了
P
(
H
)
=
O
(
H
)
1
+
O
(
H
)
=
20
{ P(H)}=\frac {O(H)}{1+O(H)} =20
P(H)=1+O(H)O(H)=20
小练习
(1) 对于两个六面骰子的情况,点数之和大于7的组合有:(2,6), (3,5), (4,4), (4,5), (4,6), (5,3), (5,4), (5,5), (5,6), (6,2), (6,3), (6,4), (6,5), (6,6)。总共有14种组合。骰子的总共可能组合为6 * 6 = 36。因此,概率为:
P ( 点数之和大于 7 ) = 14 36 P(点数之和大于7) = \frac{14}{36} P(点数之和大于7)=3614
(2) 对于三个六面骰子的情况,点数之和大于7的组合有很多,但我们可以通过列举出来并计算其概率。类似地,总共可能组合为 (6^3)。计算这些组合的概率将给出所需的结果。
(3) 纽约洋基队与波士顿红袜队这两支职业棒球队正在比赛。你是波士顿红袜队的铁杆粉丝,并和朋友打赌他们会赢。如果波士顿红袜队输了,你会给朋友30美元;而如果他们赢了,朋友则给你5美元。请问,直觉上你认为波士顿红袜队会赢的概率有多大?
本题中波士顿红袜队会赢的概率是通过考虑赔率来估计的
P ( 波士顿红袜队赢 ) = 5 30 + 5 = 1 7 P(波士顿红袜队赢)=\frac{5}{30+5}=\frac{1}{7} P(波士顿红袜队赢)=30+55=71
总结
本章探讨了两种不同类型的概率:事件的概率和信念的概率。我们将概率定义为我们所关心的结果与所有可能结果的数量之比。