18-1 用一个数值来代表概率分布

在贝叶斯推理中,可以计算出各个类别的后验概率。例如,第2讲中,可以根据检查结果呈阳性,计算出“患癌症的后验概率为4.5%”“身体健康的后验概率为95.5%”。如果将患癌症设为数值1、身体健康设为数值0的话,这与在x=0,1时计算出的概率分布情况相同,因此也可以视为一个问题得到了解决。

但是,第4讲的案例:根据某对夫妇第一胎为女孩的事实,来计算“第二胎也是女孩的后验概率”,这种情况又需要另当别论。第4讲中,将该夫妇生女孩的概率设为“0.4”、“0.5”、“0.6”三种,并计算这三种情况各自的可能性。通过贝叶斯推理得出的结论是:“0.4”的后验概率为27%,“0.5”的后验概率为33%,“0.6”的后验概率为40%。也就是说,设定x=0.4、0.5、0.6时,计算得出的概率分布分别为0.27、0.33、0.4。但是,上述结论并不能解答“该夫妇第二胎也是女孩的概率”的问题,而是提供一个用数值来回答问题的方法,这个数值就是所谓的“期待值”。第4讲中虽然讲解了期待值的计算方法,但并没有详细说明期待值的含义。现在,我们已经掌握了概率分布的思考方式,所以可以详细地了解一下“期待值”的相关知识。

18-2 期待值的计算方法

下面,通过具体事例来讲解,用一个数值来代表概率分布“期待值”的计算方法。首先,第14讲中关于天气的概率模型为例,其基本事件的集合为:

{晴天,阴天,雨天,雪天}

将其概率分布设定为:

p({晴天})=0.3、p({阴天})=0.4、p({雨天})=0.2、p({雪天})=0.1

为了制作概率分布图,在这里需要将基本事件设为数值。设定天气越恶劣,数值越大,即:

晴天→1、阴天→2、雨天→3、雪天→4

概率分布图如图表18-1所示。

图表18-1 天气的概率分布图

该图表体现了各种天气出现的频率。我们想要了解的是“该地区的天气情况大致如何”的问题,即“如何用一个数值来表示该地区的天气”。这个数值也就是期待值,计算方法如下:

(概率分布的期待值)=(数值)×(取该数值的概率)的合计

如果将该公式运用到上述天气概率分布的具体例子中,则为:

(天气的概率分布的期待值)=1×0.3+2×0.4+3×0.2+4×0.1=2.1

具体到概率分布图18-1中,即“横轴数值与纵轴数值乘积的合计”。

如果使用语言来解释得到的结果数值2.1的话,那就是“该地区的天气从阴天轻微偏向雨天”。

在期待值的计算中,(数值)×(得到该数值的概率)这一乘法运算意味着“加权”。例如,数值“3”表示“雨天”,其发生比率占整体的0.2,所以“将3的影响力弱化至0.2倍后再相加”,这种计算方式被称为“加权平均”。

18-3 长期来看,期待值是与实际情况相符的

首先,对期待值的数值含义进行说明。

就上一节中天气的例子来思考,如果设定每天的天气为:

晴天→1、阴天→2、雨天→3、雪天→4

然后进行N天的长期记录,那么,根据概率为:

p({晴天})=0.3、p({阴天})=0.4、p({雨天})=0.2、p({雪天})=0.1

可以得知,晴天大概有0.3N天、阴天大概有0.4N天、雨天大概有0.2N天、雪天大概有0.1N天。因此,记录下的数值之和合计约为:

1×0.3N+2×0.4N+3×0.2N+4×0.1N

=(1×0.3+2×0.4+3×0.2+4×0.1)N

=2.1N

回想一下之前计算出的期待值也是2.1。因此可以得出:

(实际点数的N天量的合计)≈(N个期待值的合计)

也就是说,“如果每天都对期待值进行统计,那么长期来看,结果与实际情况是基本保持一致的”。这意味着“从长期的角度来看,期待值的合计结果与实际情况一致”。以上就是针对“期待值”含义的最直观的说明。

18-4 期待值可以作为使概率分布图保持平衡的支点

以下,针对如何理解期待值的图像进行说明。结论是,期待值可以作为使概率分布图保持平衡的支点。可以使用瓦楞纸板支等制成图表18-2所示的具体天气概率分布图的立体模型,类似两臂平伸姿势的挑担偶人玩具。此时,如果将表示期待值的点作为支点,左右两侧将保持平衡,模型整体会处于稳定状态。

图表18-2 期待值处为平衡支点

能够保持平衡的原因如下:

以m为支点,那么x处的旋转力(专业上称为力矩)为:

(纵轴的高度)×(x-m)

正向的旋转力为顺时针方向,负向的旋转力为逆时针方向。例如,在点1处,逆时针方向的旋转力为0.3×(1-m)。

图表18-3 挑担偶人上的旋转力

“挑担偶人保持平衡稳定的状态”,是指旋转力的和为0(正反两个方向都不受力)。因此,使以下等式成立的m,就是“平衡的支点”。

0.3×(1-m)+0.4×(2-m)+0.2×(3-m)+0.1×(4-m)=0

该式可转化为,

1×0.3+2×0.4+3×0.2+4×0.1=(0.3+0.4+0.2+0.1)m

在进行计算时,根据标准化条件得知,等号右边的括号中各项之和为1,而毫无疑问,等号左边为期待值,即:

(x的期待值)=m

也就是说,如果将期待值的数值作为支点m,就可以使两侧的旋转力之和为0,实现平衡。这一原理在所有的概率分布中都成立。

18-5 计算掷骰子和生女孩案例中的期待值

我们已经了解了期待值的概念和含义,下面来试着计算以下两个例子中的期待值,并用图来表示。

第一个例子,掷骰子的期待值。基本事件为:

{1,2,3,4,5,6}

概率为:

依据期待值的定义进行计算:

如果沿着“使挑担偶人保持平衡”的思路来思考,甚至不需要进行计算。如图表18-4所示,由于掷骰子的概率分布图是左右对称的,那么在挑担偶人模型中,平衡的支点必须为正中。因此,期待值为3.5。

图表18-4 掷骰子的期待值

下面,我们来回顾一下第4讲中关于“某对夫妇第二胎生女孩的概率”这一案例,来计算该例中的概率分布期待值。

在这个例子中,设定x=0.4、0.5、0.6时的概率分布为0.27、0.33、0.4。

由此可计算出期待值为:

(x的期待值)=0.4×0.27+0.5×0.33+0.6×0.4=0.513(见图表4-8)。

我们再思考一下关于该模型的问题:已经该夫妇的第一胎为女儿,那么,设定问题为“该夫妇生的第二胎依然是女孩的概率是0.4?0.5?还是0.6?”之后根据贝叶斯推理,计算出对于0.4、0.5、0.6的后验概率分别为0.27、0.33、0.4。这意味着,“第二胎依然是女孩”的概率为0.4的可能性是0.27,概率为0.5的可能性是0.33,为0.6的可能性是0.4。而这些数值作为“概率的概率”这样一种双重概率,也就是“关于概率的概率分布”。

图表18-5 某夫妇生的第二胎依然是女孩的概率的期待值

虽然我们已经知道了0.4、0.5、0.6这三种概率分别对应的可能性数值,但其实我们真正想要的是“该夫妇生的第二胎依然是女孩的概率究竟是多少”的答案。而对此进行估算时,期待值可以作为一个合适的指标。因为期待值是代表概率分布的数值。因此,根据图表18-5可以进行如下推算:

(第一胎生女孩的夫妇,第二胎依然是女孩的概率)=0.513

在没有获得任何信息时,认为概率是0.5的想法是妥当的;而在已知第一胎是女孩的情况下,通过贝叶斯推理可以估算出:第二胎依然是女孩的概率要略大于0.5。

18-6 通过贝塔分布来计算期待值

学习完上述知识后,下面我们来思考连续型概率分布的期待值。在连续型概率分布中,由于已经给出了连续无限个数值的概率密度,所以很难通过各个数值来掌握其存在方式,而只有通过图表的形状来把握才比较现实。在这个前提下,能够通过一个数值来代表分布的期待值的作用就更为重要了。

下面以贝塔分布为例,来讲解连续型概率分布期待值的知识点。即便如此,在连续型的情况下,如果要定义并计算其期待值,依然需要进行积分计算,因此本书仅对其结果进行介绍。

第17讲中讲解过,贝塔分布中,将α、β设为大于1的常数,如下所示:

y=(常数)×xa-1(1-x)β-1 (0≤x≤1)

x为基本事件的数值,y为概率密度。贝塔分布的期待值的公式如下:

具体解说可参照“补讲”部分。

下面,针对第17讲中列举出的贝塔分布,使用该公式计算其期待值,并试着用图表示出来。

首先,α=β=1时,贝塔分布的常数函数为:

y=1 (0≤x≤1)

其期待值为:

由于其概率分布图是左右对称的,所以挑担偶人的支点一定在正中间。

图表18-6 α=1、β=1时贝塔分布的期待值

α=2、β=1时,贝塔分布的一次函数为

y=2x(0≤x≤1)

其期待值为:

此时,如果取2/3处作为支点,挑担偶人将保持平衡。观察图表18-7,可以理解其原因。

图表18-7 α=2、β=1时贝塔分布的概率分布图

α=1、β=2时,贝塔分布的一次函数为

y=2(1-x)(0≤x≤1)

其期待值为:

我们可以清楚地看到,该图即为上一个例子左右颠倒后的图像。因此,挑担偶人的平衡方式,也与上一个例子呈左右调转状。

图表18-8 α=1、β=2时贝塔分布的期待值

α=2、β=2时,贝塔分布的二次函数为

y=6x(1-x)(0≤x≤1)

其期待值为:

该概率分布图为左右对称的抛物线,因此挑担偶人的支点在正中间。

图表18-9 α=2、β=2时贝塔分布的期待值

最后,α=4、β=3时,贝塔分布的函数为

y=60x3(1-x)2(0≤x≤1)

其期待值为:

图表18-10 α=4、β=3时贝塔分布的期待值

第18讲·小结

1.期待值,即为通过该数值,可以代表概率分布的数值。

2.期待值的计算方法为:(数值)×(取该值时的概率)的合计

3.无数个期待值的合计值,与实际趋于一致。即,(N次计算出的数值的合计)=(期待值的N倍) 在N的取值足够大的情况下成立。

4.期待值,为挑担人偶型概率分布图保持平衡时的支点。

5.α、β为常数时,贝塔分布的期待值为α/(α+β)

练习题

答案参见此处

(1)已知:中一等奖10000日元的概率为0.01,中二等奖5000日元的概率为0.03,中三等奖100日元的概率为0.1。则奖金的期待值为:

()×()+()×()+()×()=()日元

(2)贝塔分布y=1320x7(1-x)3的期待值为:

专栏 column 何为“主观概率”?

“主观概率”一词并不很常见,但作为关于概率的一种思考方法,有着确切的起源。用数学方法来思考概率问题,是在17世纪法国数学家帕斯卡和费尔马的研究之后才开始的,但“准确性”这一思考方法,在很久之前就已经诞生了。所谓“准确性”,是指“有多大的可信度”“其证据有多大的说服力”等“主观性”的东西。

17世纪,德国数学家莱布尼茨认为,这样的“可信性”“证据能力”,也就是“概率”。同时,莱布尼茨也是一位法学家,他对审判时的推论进行了研究:在审判中,需要用证据来证明被告人的罪行。而此时,被告人有罪一事的“可信性”,就构成了主观概率。

第13讲后的专栏中介绍过20世纪美国的萨维奇,将主观概率设立为明确的数学理论。萨维奇运用的是经济学的传统方法:假设,若事件A发生,可获得1万元的f奖;若事件B发生,可获得1万元的g奖。现在的问题是:你想要哪一种?假设你的回答是f奖。那么经济学上将这个答案记做fg。此时,相比于B,你更相信A的“准确性”,这一点是无疑的。如果将所有的事件都做成上述调查问卷的形式,那么根据你的答案,就可以判断出所有事物的准确性的大小关系,而这个“关系”就可以被定义为“概率”。在刚才的例子中,则显示为p(A)p(B),而这个概率不等式,是根据你的主观判断而得来的。萨维奇主张,像这样得来的便是“主观概率”。