5-1 实际上,贝叶斯统计学比一般的统计学历史更为悠久
在前面的4讲中,已经对贝叶斯推理的具体方法进行了解释说明。相信各位读者对于贝叶斯推理的过程也已经有所了解。那么接下来,我为大家解说“贝叶斯推理的逻辑构造”的问题。
首先,特别要做的一件事是,将贝叶斯推理与标准的统计推理(称为“内曼-皮尔逊统计学”)之间的区别予以明确。内曼和皮尔逊这两位统计学家共同构筑了现代统计学的形式。还有一位名叫费希尔的统计学者,对统计学也做出了重大的贡献。因此,也有“费希尔?内曼?皮尔逊统计学”这样的名称。本书统一采用通用名称——“内曼-皮尔逊统计学”。
一般的统计学教科书中,对于内曼-皮尔逊统计学都会进行解释说明。“假说检验”“区间估计”等,都是极具代表性的方法论。但令人意外的是,它的历史很短,大约完成于19世纪末到20世纪初左右。
相反,贝叶斯统计学的历史则较为悠久。创始人贝叶斯出生于18世纪,贝叶斯推理的构想也早已于18世纪完成(参考第4讲专栏)。然而,贝叶斯推理遭到了众多学者的批判,尤其是在19世纪末期,由于费希尔等人的强烈批判,致使贝叶斯推理在相当长的一段时间里被学会排除在外。
到了20世纪中期,贝叶斯推理再次受到瞩目。萨维奇等统计学家构筑了“主观概率”的理论(参考第13讲专栏)。此后,在内曼-皮尔逊统计学的发展收获了一定成果的同时,贝叶斯统计学也随之有了显著的发展进步。
5-2 何为推论
一般来说,“推论”是指对于尚不明确的事件,通过掌握的某些证据进行推理、并且查明其事实的行为。每个领域都有该领域固有的科学推论方法。
在这些方法当中,最典型的推论方法是“逻辑推论性”。这里的“逻辑性”中的“逻辑”,可以理解为数学证明题中所说的“逻辑”,也就是用简单的例子进行说明。
例如,现在你的面前放着一个壶。已知:这个壶不是A壶就是B壶,一定属于这二者之一,但是单从外观上,无法判断该壶究竟是哪一个。那么,这就是一个“不明确的事件”。另一方面,假定对于A、B两个壶,你还掌握了一些其他的情况:A壶里面装了10个球,且全是白球;B壶里也装了10个球,且全是黑球。
之后,从面前的壶中取出1个球,发现是黑球。那么,这个黑球就成为推测的“证据”。然而从这个证据中,我们能判断出这个壶究竟是A还是B吗?
这个推论十分简单,任何一个人都能得出“这是B壶”的结论。关于这个推论,不需要特别地进行解释说明,大家也一定能明白。但为了弄清楚“什么是推论”这一概念,接下来,我将为大家详细地描述一下推论的过程。
5-3 逻辑推理的过程
首先,将已知的事实关系简单明了地列举如下。
事实1 要么是A要么是B
事实2 若是A则是白球
事实3 若是B则是黑球
事实4 黑球(不是白球)
那么,从这4个事实可以推断出“B”这个结论。当然,普通人凭借第一感觉就知道答案是B。但是,在数学证明(逻辑演绎)中,推理方法是受到限制的,不能随心所欲。
代表性的证明方法有“自然演绎”,它属于演绎系统之一。在这里,我们将自然演绎的过程设定为解答要求,特意“舍近求远”地导出结果。(关于自然演绎的定义,可以参照拙作《数学推理改变世界》NHK出版,2012年)
首先,设定结果为A。从假定的A和事实2出发,可以推导出“白球”这个结论。另一方面,从事实4可以知道,结论为“黑球(不是白球)”。那么,“白球”和“不是白球”则自相矛盾。因此得知,A的假定是矛盾的,正确的结果应该为“不是A”。从“不是A”这个结论出发,可以推导出结论为B。
严格写出每一步推理过程,的确是非常舍近求远的推理方法。这当中所用到的演绎,都是在数学上已被严格证明(或是逻辑学上的演绎)所认可的方法,没有任何一步是跳跃性的推理。也就是说,电脑也只是通过使用能够编程出来的规则来推导结论。因此,所得出的结论均为逻辑性结论。
在这里,事实3并没有用于推理,这是为了与下一节内容进行比较,而提前提出罢了。
5-4 概率推理的过程
在上节的逻辑性推理之后,接下来我们来看概率推理的模板。我们需要考虑以下问题。
面前有一个壶。虽然我们知道这个壶不是A壶就是B壶,但仅从外观上,完全无法确定究竟是A壶还是B壶。同时,我们还知道:A壶中有9个白球和1个黑球,B壶中有2个白球8个黑球。现在,如果从壶里取出一个球,结果是黑球,那么,眼前这个壶究竟是A还是B呢?
在这个案例中,由于事实2和事实3不成立,因此上节的逻辑推理也就不再适用了。因此,需要将事实2改成以下列出的事实2’,事实3改成以下列出的事实3’,然后再进行推理。
事实1 要么是A要么是B
事实2’ 若是A,则抽出的可能是白球
事实3’ 若是B,则抽出的可能是黑球
事实4 黑球(不是白球)
那么,从这4个事实中,我们可以推导出哪些结论呢。一般来说,正常人都会得出“大概是B”这个结论吧。而现在的问题是,结论中的“大概”一词该如何解释为好呢?
通过对于“大概”一词的解释,我们能够明显地看出标准统计学(内曼-皮尔逊统计学)与贝叶斯统计学之间的立场差异。
在标准统计学的推导中,“大概是B”这一结论,是基于“虽然可能出错,但还是确定结论为B”的考虑而确定的。这是在了解风险的情况下,从两种可能性中选出一种的立场。
而在贝叶斯推理中,“大概是B”这一结论,是基于“可能为A,也可能为B,而B的可能性更大一些”的考虑而确定的。这样,既不确定是A,也不确定是B,而是认为两者都有可能;与此同时,对于A和B的重视程度有所不同,这就是贝叶斯推理的立场。
之后,还会设置单独的一讲,对标准统计学与贝叶斯统计学在结构方面的差异进行详细解说。
第5讲·小结
1.逻辑性推理(自然演绎)是由逻辑学演绎法经过严密推导得出的结论。
2.在已知的事实中如果存在不确定的部分,则需要概率推理。
3.概率推理一般会得出“大概是**”这样的结论。
4.概率推理包括标准统计学推理和贝叶斯推理两种方法。
5.标准统计推理是在一定风险上以“是**”这样的形式将结论集中到一点。
6.贝叶斯推理中,则是以“每种可能性都有,但**的可能性更高”的形式,得出两者都有可能的结论。
练习题
答案参见此处
在世界上有“马马虎虎的人”也有“踏实认真的人”。请在以下括号里填上适合的词。
(1)假定“马马虎虎的人”肯定会犯错,而“踏实认真的人”绝对不会犯错。现在,如果新员工A犯错了,那么从逻辑性推理来看,A是属于()。
(2)假定“马马虎虎的人”频繁犯错,而“踏实认真的人”基本不犯错。现在,如果B没有犯错,用贝叶斯推理方法可判断出:B大概属于(),也可能属于(),而()的可能性应该会更大。