彼得•多纳利:迷惑陪审团的统计数据

本周的Monday@TEDtoChina栏目介绍牛津大学统计学教授彼得•多纳利(Peter Donnelly)在TEDGlobal 2005年大会的演讲。这个每日专栏由王韫千主持。如果你有兴趣在周一专栏发表你撰写的TED演讲稿件,请发邮件至Monday at TEDtoChina dot com联络她。今天的稿件由韫千撰写。

王韫千
Monday@TEDtoChina专栏主持人

王韫千毕业于华东政法大学英语(涉外法律)专业,目前在美国宾夕法尼亚大学攻读跨文化交流专业。她相信文字与传媒的力量,喜欢生活中美好的事物与思想,喜欢与人分享,希望用自己的力量尽可能多地帮助他人。

联络方式:Monday at TEDtoChina dot com

彼得•多纳利(Peter Donnelly)现任牛津大学统计学教授,他不仅是概率理论的专家,还将统计学方法运用于基因研究中,推动了疾病治疗领域的发展。同时,他也擅长DNA分析,并提倡将合理的统计分析方法引入法庭。在TEDGlobal 2005年大会上,他为大家讲述了错误的统计数据是如何迷惑陪审团,导致错误判定结果的。

在旁人看来,统计学也许是枯燥无趣的。彼得告诉大家,当晚在牛津大学自然历史博物馆将举办一场酒会。他假想,当现场有人问你是做什么的时候,如果你告诉对方你是统计学家,那么可能他不是借口发现了自己久未相见的兄弟姐妹,就是借口去拿点东西填饥或解渴,离你而去。不过,话说回来,那个留下来和你谈话的人,一定是真正想要和你交流的人。

虽然统计学家并不是人们邀请的常客,但对概率知识的运用却在我们的日常生活中随处可见。彼得以投硬币为例,他问观众,是连续出现“正-反-正”还是“正-反-反”的可能性大?大多数观众都会回答概率一样大。但其实,正确答案是掷出“正-反-反”的概率更大。原因在于,虽然两种结果在最后一局时,都有50%的成功可能性,但“正-反-正”如果变成“正-反-反”,那么就需要再投出一次“正”,才能重新开始。而“正-反-反”如果没投中,就是“正-反-正”,那么下一轮马上就能开始。彼得指出,其实大多数人都错误地理解了这个简单的概率事件。

彼得随后将话题引入了他感兴趣的遗传学领域。与投掷硬币类似的是,当我们观察DNA时,我们能观察到DNA分子四种碱基A、G、C、T的序列。当有某中特定序列组合出现时,类似于化学剪刀的限制性内切酶就会剪切DNA分子。这时,问题就和投掷硬币类似——反复出现某种序列组合的概率是多少?

彼得认为,我们利用计算机建模、数学建模或统计技术能够揭开许多人类奥秘。其中他还提及了自己参与的两个宏伟计划:试图找出人类共性的人类基因计划(Human Genome Project)和试图理解人类差异的国际单体型图计划(HapMap Project)。他们的最终目的是想要了解,不同的基因如何导致不同的疾病,从而找到更好的疾病治疗方法或预防途径。


TED.com: Peter Donnelly shows how stats fool juries

言归正传回到统计,彼得提醒我们要注意统计的方法与结论。他向大家介绍了一个统计学上常用的例子。假设一万人中只有一人会患一种罕见的疾病,对100万人进行测试,测试结果的准确率高达99%。虽然这个准确率已经很高,但我们同时意识到,由于健康群体的数字庞大,即使是1%的错误率也会导致许多错误结论。

对于测试出来有病的情况,现在有两种:一种是一个人没有患病,测试仪器说他患病;另一种是一个人患病,测试仪器也说他患病。彼得说我们应该做的是通过测试两种不同可能性之间的相互关联,得出最后的概率结果。

彼得提到了一起曾在英国轰动一时的误判案件。当事人Kelly Clarkson的两个孩子分别猝死,她被指控犯谋杀罪。在法庭上,一位著名儿科医生举证,在Kelly Clarkson这样的家庭中(知识分子,无吸烟群体),两个婴儿双双猝死的概率为1/7300万。可他是如何得到这个数据的呢?原来,他从一些研究中了解道,在像Kelly Clarkson这样的家庭中,一个婴儿猝死的概率为1/8500。他将两个婴儿猝死的概率看作投硬币事件中的独立事件概率,于是将两个1/8500相乘得到了最后的结论。可是陪审团并不了解这一结果的前提假设,他们看到的只是1/7300万这样一个数据。

彼得认为这个结论并不准确。我们也许没有意识到诸如环境或者基因等因素对婴儿猝死的影响,如果1/8500的概率中包含着其他因素,我们就不能简单地将两个1/8500相乘。还有媒体宣称,Kelly Clarkson的无罪可能是1/7300万,彼得认为这也存在着逻辑错误。与之前的测试疾病例子相同,现在同样也存在着两种解释,一种是假设Kelly Clarkson无无罪(美国司法系统通常采用无罪假设),而遭受了极小的两个婴儿双双猝死的概率事件;另一种是Kelly Clarkson有罪。我们需要同时衡量这两种可能性,而不是简单地将Kelly Clarkson的无罪率等同于婴儿猝死的概率。

环顾我们的生活,不确定事件、偶发事件和机遇事件无时不在发生,但我们往往对这些事件缺乏理性的逻辑分析。随着统计学逐渐成为各行各业进行质量控制的基本方法,我们应该对这些偶发事件具有掌控力,或者,至少我们应该意识到自己无法掌控而不去妄下论断。如果陪审团能够更准确地解读这些数据,像Kelly Clarkson这样蒙冤入狱的案件也会减少一些吧。

相关链接:

International HapMap Project : http://hapmap.ncbi.nlm.nih.gov/

TEDtoChina signature

您可以通过RSS阅读器订阅“TEDtoChina”的文章:
http://feeds.feedburner.com/tedtochina
欢迎发表评论,参与“TEDtoChina”的讨论组,或者在 twitter 上面 follow我们,以及关注我们的新浪微博(http://t.sina.com.cn/tedtochina)。
参与越多,您也会学到更多。

发表评论

邮箱地址不会被公开。 必填项已用*标注