条件概率的陷阱-辛普森案中的概率谎言

可能你的直觉并不准

维基百科有一个有意思的案例。

某警察用劣质检测器测试酒驾,假设检测器有5%的概率把一个正常司机判断为酒驾,已知有0.1%的司机会酒驾。假设警察拦下一个司机,做呼气测试,检测器显示酒驾,该司机究竟有多大概率真的酒驾?

90%?50%?真实的结果不到2%!是的,你没看错,

如果我们不通过其他方法(如闻司机身上的酒味),仅仅凭这个检测器结果来判断,其准确性非常低。

贝叶斯定理是计算这类条件概率问题的绝佳的方法。我们记P(A|B)表示事件B发生时事件A也发生的概率。

贝叶斯数学表达式:P(A|B)=P(A)P(B|A)/P(B)

我们记事件A为司机真正酒驾,事件B为检测器显示司机酒驾,则P(A|B)表示观察到仪器显示司机酒驾时,司机真正酒驾的概率。P(A)表示司机真正酒驾的概率,这是先验条件,案例中P(A)=0.1%,P(B|A)表示司机真正醉驾时仪器显示醉驾的概率,从案例中可知P(B|A)=100%

P(B)表示仪器显示酒驾的概率,这包括两部分,真正醉驾的和正常司机仪器显示醉驾的

由贝叶斯定理可得P(A|B)=0.1%*100%/(0.1%*100%+(1-0.1%)*5%)=1.96%

结果不到2%,和我们自然认为的差距很大,是不是很意外?

所以啊,我们看新闻,查酒驾的时候,不会单凭酒精测试仪来判断,都会把人拉去医院抽血检查!

我们看一下当年引起轰动的辛普森杀妻案

辛普森是当年著名的橄榄球明星,因为涉嫌杀害自己的妻子被起诉,引起轩然大波,本来警方在案件现场收集到了很多证据,包括带血的手套、血迹、现场DNA检验。为了证实辛普森是有意图杀害自己妻子的,警方还特意收集了大量辛普森长期殴打虐待妻子的证据。似乎辛普森难逃被定罪伏法的命运,可是辩护律师们通过各种方法一一化解掉了检方的所有证据,护律师团还宣称洛杉矶警察局有其他失职行为。但是在经历了长达9个月的审判后,辛普森被宣判无罪。

原来他的律师提到一个概率问题:

美国400万被虐待的妻子中只有1432名被其丈夫杀死。所以得出,辛普森杀死妻子的概率只有1432/400万,即1/2500。即辛普森杀死妻子的概率是非常低的事件,即辛普森几乎不可能杀死她的妻子。

他认为检方的说法不靠谱。

辩词似乎听起来挺有道理,检察官一时反应不过来,提不出好的理由进行反驳。

律师谈论的概率其实是以妻子被虐待(A),然后是被丈夫杀害(B)的概率P(A|B),也就是常说的条件概率!

但是事实上是,妻子已经被虐待致死,所以律师的原假设不成立,应该是这样的:

A:妻子被虐待并致死

B:凶手是丈夫

这样一来,虽说美国有400万被虐待的妻子,但是被虐待致死的妻子人数并非400万,可能是一个未知数N,而被丈夫杀死的妻子人数是1432。

那么被丈夫虐待致死的概率P=被丈夫杀死的妻子人数/被虐待致死的妻子人数=1432/N,远非律师说的1/2500。

因为律师偷偷把虐待致死人数转换成虐待人数!把前提条件改变了

事实上,统计得到N约为1600,即P=432/1600,大约为90%,也就是说辛普森是凶手的概率约为90%

本页共28段,1308个字符,3461 Byte(字节)