As other speakers have said, it's a rather daunting experience -- a particularly daunting experience -- to be speaking in front of this audience. But unlike the other speakers, I'm not going to tell you about the mysteries of the universe, or the wonders of evolution, or the really clever, innovative ways people are attacking the major inequalities in our world. Or even the challenges of nation-states in the modern global economy. My brief, as you've just heard, is to tell you about statistics -- and, to be more precise, to tell you some exciting things about statistics. And that's -- (Laughter) -- that's rather more challenging than all the speakers before me and all the ones coming after me. (Laughter) One of my senior colleagues told me, when I was a youngster in this profession, rather proudly, that statisticians were people who liked figures but didn't have the personality skills to become accountants. (Laughter) And there's another in-joke among statisticians, and that's, "How do you tell the introverted statistician from the extroverted statistician?" To which the answer is, "The extroverted statistician's the one who looks at the other person's shoes." (Laughter) But I want to tell you something useful -- and here it is, so concentrate now. This evening, there's a reception in the University's Museum of Natural History. And it's a wonderful setting, as I hope you'll find, and a great icon to the best of the Victorian tradition. It's very unlikely -- in this special setting, and this collection of people -- but you might just find yourself talking to someone you'd rather wish that you weren't. So here's what you do. When they say to you, "What do you do?" -- you say, "I'm a statistician." (Laughter) Well, except they've been pre-warned now, and they'll know you're making it up. And then one of two things will happen. They'll either discover their long-lost cousin in the other corner of the room and run over and talk to them. Or they'll suddenly become parched and/or hungry -- and often both -- and sprint off for a drink and some food. And you'll be left in peace to talk to the person you really want to talk to.
他の講演者の方も話されましたが この観客の前で話すのは 手ごわい経験です しかし 私がお話しするのは 他の方たちの様に 宇宙の謎や 進化の神秘 世界の不平等を解消する 革新的方法や また 現代のグローバル経済における― 国家的課題などではありません 私は統計学について- より正確に言うと 統計学のワクワクするような話をします それは — (笑) 他の講演者たちよりも 随分と努力が必要です (笑) 私が若輩者だった頃 先輩が誇らしげに教えてくれたのは 統計学者は数字が得意だけれども 会計士になれるほど 人格者ではないことです (笑) もう1つ 統計学者が 内輪で言っているジョークが 「性格が内向的な統計学者と 外向的な統計学者を見分けるには?」 答えは 「外向的統計学者は 相手の身なりをよく見ている」です (笑) 今から役立つことを伝えたいので よく聞いてください 今夜 大学の自然史博物館で パーティーがあります お気に召せばいいですが ― 素晴らしい場所で 伝統あるビクトリア時代の象徴です そんな会場に こんな方々と一緒にいても この人とは話したくない という相手もいるかもしれません こうすれば良いのです 「ご職業は?」と聞かれたら 「統計学者です」と答えてください (笑) ここでネタをばらしてしまったので 今回は見え見えになってしまいましたが 普通 次のどちらかのことが起きます 久しぶりのイトコが あそこにいるので 話してきますといって去るか 突然 のどの渇きや空腹が襲ってきて 飲み物や食べ物を急いで取りに行くのです あなたは 落ち着いて 本当に話したい人の元へと向かえます
It's one of the challenges in our profession to try and explain what we do. We're not top on people's lists for dinner party guests and conversations and so on. And it's something I've never really found a good way of doing. But my wife -- who was then my girlfriend -- managed it much better than I've ever been able to. Many years ago, when we first started going out, she was working for the BBC in Britain, and I was, at that stage, working in America. I was coming back to visit her. She told this to one of her colleagues, who said, "Well, what does your boyfriend do?" Sarah thought quite hard about the things I'd explained -- and she concentrated, in those days, on listening. (Laughter) Don't tell her I said that. And she was thinking about the work I did developing mathematical models for understanding evolution and modern genetics. So when her colleague said, "What does he do?" She paused and said, "He models things." (Laughter) Well, her colleague suddenly got much more interested than I had any right to expect and went on and said, "What does he model?" Well, Sarah thought a little bit more about my work and said, "Genes." (Laughter) "He models genes."
統計学者が何をするか説明するのは 努力を要することの1つです 統計学者はパーティーや会談の 主賓としては招待されません 良い説明方法は いまだに見つかっていません 私の妻は まだガールフレンドだった頃に 私よりも上手く その質問を切り抜けたことがありました 付き合い始めた時 彼女はイギリスで BBCに勤めていました 私はその頃 アメリカで働いていました 私が彼女を訪ねに来たときのことです 「彼氏の職業は?」と聞かれたとき 彼女は同僚にこう答えたのです サラは私の説明を一生懸命 思いだそうとしました 当時の彼女は 私の言うことを ちゃんと聞いていましたから (笑) これは内緒にしておいてください 私の仕事は 進化と現代的遺伝学を理解するために 数学的モデルを発展させることだと 彼女は考えていました ですから 彼女は同僚から 「彼氏の職業は?」と聞かれた時 間をおいて こう言いました 「彼はモデルをするの」 (笑) 予期しなかったのですが その同僚は突然 興味津々になり 続けてこう言ったのです 「なんのモデルをしているの?」 で サラはちょっと考えて答えました 「ジーンズ(遺伝子)よ」 (笑) 「彼はジーンズのモデルをするの」
That is my first love, and that's what I'll tell you a little bit about. What I want to do more generally is to get you thinking about the place of uncertainty and randomness and chance in our world, and how we react to that, and how well we do or don't think about it. So you've had a pretty easy time up till now -- a few laughs, and all that kind of thing -- in the talks to date. You've got to think, and I'm going to ask you some questions. So here's the scene for the first question I'm going to ask you. Can you imagine tossing a coin successively? And for some reason -- which shall remain rather vague -- we're interested in a particular pattern. Here's one -- a head, followed by a tail, followed by a tail.
これで本当に彼女が好きになりましたね 統計学者の仕事の話を続けましょう より一般的な事例を挙げて 皆さんに世の中の 不確定で 不規則で 偶然な 出来事を考えてもらい それにどう反応するか 適切に考えることが できるかを検討してほしいのです なので ここで 今までのデートの話で 笑うような気楽な時間は終了です 皆さんには いくつか問題を出したいと思います 第一問 こういう状況です 繰り返しコインを投げます ある理由があって― それには特に触れませんが 私たちはある特徴的パターンに 興味を持ちます これが そのパターンです コインの表が出て 次に裏・裏
So suppose we toss a coin repeatedly. Then the pattern, head-tail-tail, that we've suddenly become fixated with happens here. And you can count: one, two, three, four, five, six, seven, eight, nine, 10 -- it happens after the 10th toss. So you might think there are more interesting things to do, but humor me for the moment. Imagine this half of the audience each get out coins, and they toss them until they first see the pattern head-tail-tail. The first time they do it, maybe it happens after the 10th toss, as here. The second time, maybe it's after the fourth toss. The next time, after the 15th toss. So you do that lots and lots of times, and you average those numbers. That's what I want this side to think about.
コインを何度も 繰り返し投げることにします すると 注目している 表・裏・裏のパターンがここで起こります 数えられますね 1 2 3 4 5 6 7 8 9 10 10回目のコイントスの後の結果です 他にも興味深いことがと思うかもしれません でもちょっとお待ちください 観客を半分に分けて 表・裏・裏のパターンが出るまで 各々がコインを投げると思ってください 1度目には このように10回投げた後の結果はこうなり 2度目は4回のトスで 起こるかもしれません その次は 15回目のトスの後で それを何度も何度も行って 平均回数を出してください それが こちら側の半分の人に やってもらいたいことです
The other half of the audience doesn't like head-tail-tail -- they think, for deep cultural reasons, that's boring -- and they're much more interested in a different pattern -- head-tail-head. So, on this side, you get out your coins, and you toss and toss and toss. And you count the number of times until the pattern head-tail-head appears and you average them. OK? So on this side, you've got a number -- you've done it lots of times, so you get it accurately -- which is the average number of tosses until head-tail-tail. On this side, you've got a number -- the average number of tosses until head-tail-head.
もう半数の観客は 表・裏・裏が好きじゃありません 彼らは深遠な文化的理由から そんなのつまらないと思い 他のパターンの方に興味を持ちました 表・裏・表です こちらの方たちはコインを取り出して トスを何回も繰り返して 表・裏・表が出るまで 投げた回数を数えて その平均を出してください いいですね? こちらの方たちは コイントスを繰り返して 表・裏・裏が出るまでの 平均回数を正確に導きだしてください こちらの皆さんは同様に 表・裏・表の平均回数を出して下さい
So here's a deep mathematical fact -- if you've got two numbers, one of three things must be true. Either they're the same, or this one's bigger than this one, or this one's bigger than that one. So what's going on here? So you've all got to think about this, and you've all got to vote -- and we're not moving on. And I don't want to end up in the two-minute silence to give you more time to think about it, until everyone's expressed a view. OK. So what you want to do is compare the average number of tosses until we first see head-tail-head with the average number of tosses until we first see head-tail-tail.
数学的事実は以下の通りです 2つの平均回数が導き出せたら 次の3つの内1つが真実のはずです 2つとも同じ数か こちら側の数が多いか 反対側の数が多いか さて どうなるでしょう? 皆さんがこの問題を理解して 投票して欲しいと思います それまで 次へは進みません 2分間静かに考えて 全員が答えを出して下さいね もっと時間が必要だ という状況にはしたくありません では 最初に表・裏・表が出た コイントス回数と 表・裏・裏が出た回数を 比べましょう
Who thinks that A is true -- that, on average, it'll take longer to see head-tail-head than head-tail-tail? Who thinks that B is true -- that on average, they're the same? Who thinks that C is true -- that, on average, it'll take less time to see head-tail-head than head-tail-tail? OK, who hasn't voted yet? Because that's really naughty -- I said you had to. (Laughter) OK. So most people think B is true. And you might be relieved to know even rather distinguished mathematicians think that. It's not. A is true here. It takes longer, on average. In fact, the average number of tosses till head-tail-head is 10 and the average number of tosses until head-tail-tail is eight. How could that be? Anything different about the two patterns? There is. Head-tail-head overlaps itself. If you went head-tail-head-tail-head, you can cunningly get two occurrences of the pattern in only five tosses. You can't do that with head-tail-tail. That turns out to be important.
Aが真実だと思う人はいますか? 「平均で表・裏・表の方が 表・裏・裏より回数が多い」です Bが真実だと思う人は? 「平均回数は同じ」 Cが真実だと思う人は? 「平均で表・裏・表の方が 表・裏・裏より回数が少ない」 まだ投票してない人はいますか? それはだめですよ (笑) ほとんどの人が Bを真実だと思っていますので 超優秀な数学者もそう考えると知れば 少しは安心ですよね ところが Aが真実なのです こちらの平均回数の方が多いのです 実は 表・裏・表が出るまで 平均回数は10回で 表・裏・裏の平均は8回です どうしてこうなったのでしょう? 2つのパターンに違いはあるのか? 表・裏・表はそれ自身に 重なっているのです 表・裏・表・裏・表と出たら たった5回のトスで そのパターンが2回発生しています 表・裏・裏ではそんなことは起こりません それが肝です
There are two ways of thinking about this. I'll give you one of them. So imagine -- let's suppose we're doing it. On this side -- remember, you're excited about head-tail-tail; you're excited about head-tail-head. We start tossing a coin, and we get a head -- and you start sitting on the edge of your seat because something great and wonderful, or awesome, might be about to happen. The next toss is a tail -- you get really excited. The champagne's on ice just next to you; you've got the glasses chilled to celebrate. You're waiting with bated breath for the final toss. And if it comes down a head, that's great. You're done, and you celebrate. If it's a tail -- well, rather disappointedly, you put the glasses away and put the champagne back. And you keep tossing, to wait for the next head, to get excited.
そこには2つの考え方があります その1つを説明しましょう 先ほどやったことを思い出してください こちら側の皆さんは 表・裏・裏を期待していました 反対側は表・裏・表を期待していました コインを投げたら 表が出ました 皆さんは椅子に座り直します 何か凄くて素晴らしくて ステキなことが起こりそうだからです 次のトスは裏です 嬉しいですね 氷の上のシャンパンがそばにあります お祝いの冷えたシャンパングラスがあります 息をのんで 最後のトスを待ちます 次に表が出たら素晴らしい! やった!お祝いだ! 裏だったら 少々ガッカリして シャンパングラスを退け シャンパンを返却します そして 次の表が出るまで 興奮するためのコイントスを続けます
On this side, there's a different experience. It's the same for the first two parts of the sequence. You're a little bit excited with the first head -- you get rather more excited with the next tail. Then you toss the coin. If it's a tail, you crack open the champagne. If it's a head you're disappointed, but you're still a third of the way to your pattern again. And that's an informal way of presenting it -- that's why there's a difference. Another way of thinking about it -- if we tossed a coin eight million times, then we'd expect a million head-tail-heads and a million head-tail-tails -- but the head-tail-heads could occur in clumps. So if you want to put a million things down amongst eight million positions and you can have some of them overlapping, the clumps will be further apart. It's another way of getting the intuition.
こちらは違う経験です 最初の2つの結果は同じです 最初に表が出た時は少し興奮します 次に裏が出たらもっと興奮します そして コインを投げます 裏が出たら シャンパンを開けます もし表が出たらガッカリです それでも パターンの 3分の1は達成しているのです くだけた感じの説明でしたが 2つのパターンが違うはこのためです もう1つの考え方は もし 800万回コイントスをして 表・裏・表も 表・裏・裏も 100万回出ると予測しますが 表・裏・表は塊で出ることが可能です 800万ヶ所に 100万個のものを置きたいなら そのいくつかは重なることもできます すると塊はもっと離れることになります これが直感的に理解する もう1つの方法なのです
What's the point I want to make? It's a very, very simple example, an easily stated question in probability, which every -- you're in good company -- everybody gets wrong. This is my little diversion into my real passion, which is genetics. There's a connection between head-tail-heads and head-tail-tails in genetics, and it's the following. When you toss a coin, you get a sequence of heads and tails. When you look at DNA, there's a sequence of not two things -- heads and tails -- but four letters -- As, Gs, Cs and Ts. And there are little chemical scissors, called restriction enzymes which cut DNA whenever they see particular patterns. And they're an enormously useful tool in modern molecular biology. And instead of asking the question, "How long until I see a head-tail-head?" -- you can ask, "How big will the chunks be when I use a restriction enzyme which cuts whenever it sees G-A-A-G, for example? How long will those chunks be?"
お伝えしたいポイントは この問題が 確率における とても単純で簡潔な例題であり ここにいる皆さんまでもが 間違いを犯すものだということです 私が本当に興味を持っている遺伝学にも 同じようなことがあります 遺伝学でも表・裏・表と 表・裏・裏に関連があります 以下の通りです コインを投げると 表・裏の 順番が発生します DNAを観察すると順番がありますが それは表・裏の2つではなく A G C Tの4文字からなるものです そして そこには「制限酵素」と呼ばれる 小さい化学的ハサミがあります このハサミは あるパターンに遭遇すると そこでDNAを切ります 現代分子生物学で このハサミは非常に便利な道具です そして「表・裏・表が出るまでの長さは?」 という質問ではなく 「G-A-A-Gパターンが出た時に 制御酵素で切るとして その塊の長さは?」と― 質問できるわけです
That's a rather trivial connection between probability and genetics. There's a much deeper connection, which I don't have time to go into and that is that modern genetics is a really exciting area of science. And we'll hear some talks later in the conference specifically about that. But it turns out that unlocking the secrets in the information generated by modern experimental technologies, a key part of that has to do with fairly sophisticated -- you'll be relieved to know that I do something useful in my day job, rather more sophisticated than the head-tail-head story -- but quite sophisticated computer modelings and mathematical modelings and modern statistical techniques. And I will give you two little snippets -- two examples -- of projects we're involved in in my group in Oxford, both of which I think are rather exciting. You know about the Human Genome Project. That was a project which aimed to read one copy of the human genome. The natural thing to do after you've done that -- and that's what this project, the International HapMap Project, which is a collaboration between labs in five or six different countries. Think of the Human Genome Project as learning what we've got in common, and the HapMap Project is trying to understand where there are differences between different people.
これは確率と遺伝学の間の 些細な問題ですが 説明する時間が無いのですが そこには もっと深い関連があります だから現代遺伝学は 本当にワクワクする科学分野なのです この後にも同じことについての TEDトークがありますよ 現代の実験技術から生まれた情報で 解明した結果の重要部分は かなり洗練されています 皆さんご安心ください 私の日常の仕事は 表裏よりも もっと高等で有益なことです とても複雑なコンピューターモデリングと 数学的モデリングと 統計学的モデリングをしています では 皆さんにオックスフォード大学の 私の研究チームが 参加している2つのプロジェクトを 少しご説明します 2つともとても面白いですよ ヒトゲノム計画はご存知でしょう それは一人分のゲノム全体を 読み解くことを目的としていました それが完了したので 次は 国際HapMap計画です これは5~6カ国の研究室が 共同で行っています ヒトゲノム計画では 人類共通の遺伝情報について解析しましたが HapMap計画は民族集団の間にある違いを 解明しようとしています
Why do we care about that? Well, there are lots of reasons. The most pressing one is that we want to understand how some differences make some people susceptible to one disease -- type-2 diabetes, for example -- and other differences make people more susceptible to heart disease, or stroke, or autism and so on. That's one big project. There's a second big project, recently funded by the Wellcome Trust in this country, involving very large studies -- thousands of individuals, with each of eight different diseases, common diseases like type-1 and type-2 diabetes, and coronary heart disease, bipolar disease and so on -- to try and understand the genetics. To try and understand what it is about genetic differences that causes the diseases. Why do we want to do that? Because we understand very little about most human diseases. We don't know what causes them. And if we can get in at the bottom and understand the genetics, we'll have a window on the way the disease works, and a whole new way about thinking about disease therapies and preventative treatment and so on. So that's, as I said, the little diversion on my main love.
何故それが必要なのでしょうか? その理由は沢山あります 最も緊急な課題は どの遺伝子の違いが 2型糖尿病や心臓病 脳卒中 自閉症などの 疾患を発症しやすくさせるかということを 解明することです これが1つの大きなプロジェクトです 2番目の大きなプロジェクトは 最近 ウェルカム・トラスト (研究者支援団体)から 研究費提供を受けています 1型および 2型糖尿病 冠動脈性心疾患 双極性障害 など 頻度の高い8つの疾患の それぞれの患者が何千人も協力して その遺伝子を解析するという 大がかりなものです その疾患を引き起こす 遺伝子の違いを解析するのです なぜ そんなことをしたいのか? なぜなら ヒトの疾患について ほとんど 解明されていないからです 疾患の原因を知らないのです もしも 人類が遺伝学について その基本を理解したなら 病気の仕組みが理解できて 治療や予防的措置などについての 考え方が一新するでしょう 前にも言ったようにこれが 私の情熱の一端です
Back to some of the more mundane issues of thinking about uncertainty. Here's another quiz for you -- now suppose we've got a test for a disease which isn't infallible, but it's pretty good. It gets it right 99 percent of the time. And I take one of you, or I take someone off the street, and I test them for the disease in question. Let's suppose there's a test for HIV -- the virus that causes AIDS -- and the test says the person has the disease. What's the chance that they do? The test gets it right 99 percent of the time. So a natural answer is 99 percent. Who likes that answer? Come on -- everyone's got to get involved. Don't think you don't trust me anymore. (Laughter) Well, you're right to be a bit skeptical, because that's not the answer. That's what you might think. It's not the answer, and it's not because it's only part of the story. It actually depends on how common or how rare the disease is. So let me try and illustrate that. Here's a little caricature of a million individuals. So let's think about a disease that affects -- it's pretty rare, it affects one person in 10,000. Amongst these million individuals, most of them are healthy and some of them will have the disease. And in fact, if this is the prevalence of the disease, about 100 will have the disease and the rest won't. So now suppose we test them all. What happens? Well, amongst the 100 who do have the disease, the test will get it right 99 percent of the time, and 99 will test positive. Amongst all these other people who don't have the disease, the test will get it right 99 percent of the time. It'll only get it wrong one percent of the time. But there are so many of them that there'll be an enormous number of false positives. Put that another way -- of all of them who test positive -- so here they are, the individuals involved -- less than one in 100 actually have the disease. So even though we think the test is accurate, the important part of the story is there's another bit of information we need.
もっとありふれた 「不確かさ」について考える問題に戻りましょう 皆さんにもう1つクイズがあります あなたはある病気に対して 完全ではないが かなり良い検査を受けました その検査は99%正確です 私は皆さんの内の1人 もしくは通行人から数人を選んで その検査をしたとします 例えばHIV(エイズウィルス)の 検査だとしましょう そして 検査結果は 陽性(感染あり)だったとします 彼らが本当にHIVに罹っている可能性は? 99%正確なテストですよ 99%と答えるのが当たり前ですね そうだと思う人は? 皆さん参加して下さいよ! 誰一人として 私を信用していないとは思いませんが (笑) 皆さんは 「少し疑った方が良いかも 答えは違うのです」 そう思っているかも知れません 答えは違います 何故なら 話はまだ一部だからです 実は 罹患率の高さで この答えは変わってきます 詳しく説明しましょう ここに100万人を表した図があります 1万人に1人しか罹らない とても罹患率の低い病気を考えましょう 100万人のうち ほとんどは健康で わずかの人数がその患者です 先ほどの罹患率で言えば 100人だけが病気です では 全員を検査するとして どうなるでしょう? 病気にかかっている100人の内で 99%正確な検査なので 99人の検査が陽性となります 残りの病気じゃない人たちにも 99%正確な検査ですので 1%に間違った結果が出ます 結果 多くの数の人たちが 偽陽性になってしまうのです こうも考えられます― 陽性の結果が出た全員の内で ―こちらの人たちです― 実際の患者は 100分の1よりも低い確率です ですから 正確だと思える検査でも そのほとんどの場合で もっと情報が必要なのです
Here's the key intuition. What we have to do, once we know the test is positive, is to weigh up the plausibility, or the likelihood, of two competing explanations. Each of those explanations has a likely bit and an unlikely bit. One explanation is that the person doesn't have the disease -- that's overwhelmingly likely, if you pick someone at random -- but the test gets it wrong, which is unlikely. The other explanation is that the person does have the disease -- that's unlikely -- but the test gets it right, which is likely. And the number we end up with -- that number which is a little bit less than one in 100 -- is to do with how likely one of those explanations is relative to the other. Each of them taken together is unlikely.
これがキーなのです 検査で陽性と出た時に やらなければないけないことは その妥当性や もっともらしさ(尤度)を 対立する2つの仮説から評価することです その仮説にはそれぞれ 少しずつ成立する時としない時があります ランダムに1人を選んだ場合 一方の仮説では その人が病気でない尤度は 非常に高いが 検査結果が間違い(偽陽性)である 尤度は低い もう一方の仮説は その人が病気である尤度は低いが 検査結果が正しい(真陽性) 尤度は高いというものです 最終的に統計学者が出すのは その可能性が100分の1より低いかどうか つまり どちらの仮説が他方より 高い尤度をもつかということです いずれの仮説も総合的には尤度が低いのです
Here's a more topical example of exactly the same thing. Those of you in Britain will know about what's become rather a celebrated case of a woman called Sally Clark, who had two babies who died suddenly. And initially, it was thought that they died of what's known informally as "cot death," and more formally as "Sudden Infant Death Syndrome." For various reasons, she was later charged with murder. And at the trial, her trial, a very distinguished pediatrician gave evidence that the chance of two cot deaths, innocent deaths, in a family like hers -- which was professional and non-smoking -- was one in 73 million. To cut a long story short, she was convicted at the time. Later, and fairly recently, acquitted on appeal -- in fact, on the second appeal. And just to set it in context, you can imagine how awful it is for someone to have lost one child, and then two, if they're innocent, to be convicted of murdering them. To be put through the stress of the trial, convicted of murdering them -- and to spend time in a women's prison, where all the other prisoners think you killed your children -- is a really awful thing to happen to someone. And it happened in large part here because the expert got the statistics horribly wrong, in two different ways.
もっと話題になるような例を出してみましょう イギリス人ならサリー・クラークの 有名な事例をご存知でしょう 彼女には赤ん坊が2人いましたが 突然 亡くなってしまいました 当初 その2人は「コット・デス」 つまり 新生児突然死症候群で 亡くなったと考えられていました しかし いろいろあって サリーは殺人者にさせられたのです 裁判では とても著名な小児科医が こう証言しました 「サリーの様に専門的職業を持ち かつ非喫煙者の家庭にコット・デスが 非犯罪的に2回も起こる確率は 7,300万分の1である」 端折りますが サリーは有罪判決を受けました その後つい最近になって 控訴審で無罪になりました その人の身になって考えてみて下さい 我が子を2人も たて続けに亡くした人が 2人を殺したとして有罪になる この事件が犯罪でなかったとしたら どれだけひどいことでしょう 裁判を通しての精神的重圧や 殺人と判決されること 女性刑務所で過ごす間 他の犯罪者に子どもを殺したと思われることは 当事者にとって 本当に悲劇と言いようがありません そんなことが実際に起こったのです 何故ならその専門家は2つの方法で 統計を間違って解釈したのです
So where did he get the one in 73 million number? He looked at some research, which said the chance of one cot death in a family like Sally Clark's is about one in 8,500. So he said, "I'll assume that if you have one cot death in a family, the chance of a second child dying from cot death aren't changed." So that's what statisticians would call an assumption of independence. It's like saying, "If you toss a coin and get a head the first time, that won't affect the chance of getting a head the second time." So if you toss a coin twice, the chance of getting a head twice are a half -- that's the chance the first time -- times a half -- the chance a second time. So he said, "Here, I'll assume that these events are independent. When you multiply 8,500 together twice, you get about 73 million." And none of this was stated to the court as an assumption or presented to the jury that way. Unfortunately here -- and, really, regrettably -- first of all, in a situation like this you'd have to verify it empirically. And secondly, it's palpably false. There are lots and lots of things that we don't know about sudden infant deaths. It might well be that there are environmental factors that we're not aware of, and it's pretty likely to be the case that there are genetic factors we're not aware of. So if a family suffers from one cot death, you'd put them in a high-risk group. They've probably got these environmental risk factors and/or genetic risk factors we don't know about. And to argue, then, that the chance of a second death is as if you didn't know that information is really silly. It's worse than silly -- it's really bad science. Nonetheless, that's how it was presented, and at trial nobody even argued it. That's the first problem. The second problem is, what does the number of one in 73 million mean? So after Sally Clark was convicted -- you can imagine, it made rather a splash in the press -- one of the journalists from one of Britain's more reputable newspapers wrote that what the expert had said was, "The chance that she was innocent was one in 73 million." Now, that's a logical error. It's exactly the same logical error as the logical error of thinking that after the disease test, which is 99 percent accurate, the chance of having the disease is 99 percent. In the disease example, we had to bear in mind two things, one of which was the possibility that the test got it right or not. And the other one was the chance, a priori, that the person had the disease or not. It's exactly the same in this context. There are two things involved -- two parts to the explanation. We want to know how likely, or relatively how likely, two different explanations are. One of them is that Sally Clark was innocent -- which is, a priori, overwhelmingly likely -- most mothers don't kill their children. And the second part of the explanation is that she suffered an incredibly unlikely event. Not as unlikely as one in 73 million, but nonetheless rather unlikely. The other explanation is that she was guilty. Now, we probably think a priori that's unlikely. And we certainly should think in the context of a criminal trial that that's unlikely, because of the presumption of innocence. And then if she were trying to kill the children, she succeeded. So the chance that she's innocent isn't one in 73 million. We don't know what it is. It has to do with weighing up the strength of the other evidence against her and the statistical evidence. We know the children died. What matters is how likely or unlikely, relative to each other, the two explanations are. And they're both implausible. There's a situation where errors in statistics had really profound and really unfortunate consequences. In fact, there are two other women who were convicted on the basis of the evidence of this pediatrician, who have subsequently been released on appeal. Many cases were reviewed. And it's particularly topical because he's currently facing a disrepute charge at Britain's General Medical Council.
その小児科医は7,300万分の1という数字を どこから出したのでしょう? 彼が読んだいくつかの研究には サリーと似たような家庭内で起こる コット・デスは約8,500分の1とあったのです ですから 彼はこう言いました 「家庭内のコット・デスが一度 起きた場合と 2度目のコット・デスが起こる確率は 変わらないと仮定する」 統計学者はこれを 「事象が独立である」と言い 「コイントスをして 最初に表が出ても 2回目も表が出る確率に影響しない」 と言うことです つまり コインを2回トスして 2回とも表になる可能性は 1回目の確率の50%で 0.5 × 0.5になるのです だから 彼はこう言いました 「2つの出来事は独立していると仮定する 8,500を二乗すれば 7,300万になる」 それが 仮定だとは 裁判で語られませんでしたし 陪審員にも そのように伝えていませんでした とても残念です まず最初に この状況では その仮定が経験的に妥当か確かめるべきでした 第二に それは明白な誤りです 新生児の突然死には 解明されていないことが山ほどあります まだ 発見されていない 環境因子があるかもしれませんし まだ発見されていない 遺伝学的因子により 引き起こされた可能性も高いのです ですから コット・デスが起こった家族は ハイリスク群に属するかも知れません そこには まだ知られていない 環境的危険因子があったり その上 遺伝学的危険因子が あるかもしれないのです こういう情報を知らないかのように 2番目の死亡の確率を語るのは 本当に愚かなことです 愚かであるよりも 実に悪質な科学です それなのに あんなことが裁判で示され 誰もそのことを議論しなかった それが最初の問題です 2番目の問題は7,300万分の1という 数字の意味するところです サリー・クラークが有罪になった後 それが報道で波紋を呼んだというのは 想像に難くありません イギリスで影響力のある新聞社の 記者はこう書きました 「専門家が言うことには― 『この女が無罪である確率は 7,300万分の1』とのこと」 そう これは論理的エラーです この論理的エラーは 先ほどの99%確実な検査なら 病気に罹っている確率も99%だという 論理的エラーと全く同じものです その例から 覚えておくべきことは 2つです 1つはその検査が 正しいか正しくないかの可能性 もう1つは その人が病気にかかっている可能性の推測 この状況では全く同じことです そこにも2段階の説明が必要です 2つの異なった事象の尤度がどれほどか また関連して起こる尤度はどうでしょう? 1つ目の事象はサリーが無罪であること それは常識的に圧倒的に高尤度です ほとんどの母親は我が子を殺しません 2つ目の事象は 彼女がこの非常に低尤度な出来事に 遭遇したこと 7,300万分の1の数字程ではありませんが いずれにしても 起きにくいことです 対する事象はサリーが有罪ということです 今ならそれが普通に考えて 低尤度だと思うでしょう 刑事裁判として 尤度が低いと考えるべきです なぜなら 推定無罪の原則があるからです もしも 彼女が我が子を殺そうとしたのなら 成功しました サリーが無罪である可能性は 7300万分の1ではありません それがどういう数字になるのか分りません サリーを有罪とする 根拠の確からしさと その統計学的根拠で決まります 分かっているのは 子どもたちが死んだことです 争点は2人の死―2つの事象―には どれほど関連が ありうるかということです この2つは両方ともありえないことです そこには本当に理解しがたく 悲劇的結果を生んだ 統計学に関してのエラーでした この小児科医の論拠が採用されて 他にも2人の女性が 有罪にされましたが 裁判によって結果的に釈放されています 多くの事件が再調査されました この小児科医は現在イギリス医学会議で 査問にかけられていることが 話題になっています
So just to conclude -- what are the take-home messages from this? Well, we know that randomness and uncertainty and chance are very much a part of our everyday life. It's also true -- and, although, you, as a collective, are very special in many ways, you're completely typical in not getting the examples I gave right. It's very well documented that people get things wrong. They make errors of logic in reasoning with uncertainty. We can cope with the subtleties of language brilliantly -- and there are interesting evolutionary questions about how we got here. We are not good at reasoning with uncertainty. That's an issue in our everyday lives. As you've heard from many of the talks, statistics underpins an enormous amount of research in science -- in social science, in medicine and indeed, quite a lot of industry. All of quality control, which has had a major impact on industrial processing, is underpinned by statistics. It's something we're bad at doing. At the very least, we should recognize that, and we tend not to. To go back to the legal context, at the Sally Clark trial all of the lawyers just accepted what the expert said. So if a pediatrician had come out and said to a jury, "I know how to build bridges. I've built one down the road. Please drive your car home over it," they would have said, "Well, pediatricians don't know how to build bridges. That's what engineers do." On the other hand, he came out and effectively said, or implied, "I know how to reason with uncertainty. I know how to do statistics." And everyone said, "Well, that's fine. He's an expert." So we need to understand where our competence is and isn't. Exactly the same kinds of issues arose in the early days of DNA profiling, when scientists, and lawyers and in some cases judges, routinely misrepresented evidence. Usually -- one hopes -- innocently, but misrepresented evidence. Forensic scientists said, "The chance that this guy's innocent is one in three million." Even if you believe the number, just like the 73 million to one, that's not what it meant. And there have been celebrated appeal cases in Britain and elsewhere because of that.
では まとめます このことから何を学びましたか? そうです 不規則や不確定 偶然は 日常的によくあることだということです また 皆さんは多くの場合で 集団としてとても特別なのです 皆さんがこれらの例を理解できないのは 当たり前のことです 人々が物事を間違って解釈することは 実証済みです 人は不確実な理由付けで 論理的エラーを犯します 言語の微妙さへの対処は 得意なのですが そこにどのようにして到達したかについては 興味深い進化的問題があります 私たちは 不確かさについて 論証することが苦手なので 日々の生活での難問となります 多くのTEDトークでわかるように 統計学は広範な科学研究を裏付けます その分野は社会科学や 医学だけでなく 多くの産業にも渡ります 生産過程に大きな影響を与えてきた 品質管理は 全て統計に裏付けられています それを理解するのは 私たちが不得意とするところです 私たちはそれを無視しがちですが 最低限認識はすべきです サリー・クラークの裁判に立ち返ると 全ての法律家が 専門家の言いなりになったのです ですから ある小児科医が陪審員に 「私は橋の建設方法を知っています この先に橋を作りましたから その橋を通って帰宅してください」 と言ったら きっとこう返事するでしょう 「小児科医が橋の建設だって? それはエンジニアがすることだ」 それなのに 彼のこんな発言は 説得力を発揮しました 「不確かさの扱いかたを知っています 私は統計を理解しているのですから」 すると 皆はこう言ったのです 「結構ですね 彼は専門家ですから」 ですから 私たちは自分はなにが得意かを 理解する必要があります 全く同じ様な問題がDNA鑑定の 初期に発生しました 科学者も法律家も 時には裁判官たちまでも 何度も証拠を間違えて提示したのです たいてい悪意はなく ―そう願います 誤った証拠を提示したのです 犯罪学者がこう言いました 「無罪である確率は300万分の1だ」 7300万分の1の数字同様 その数字自体を信じたとしても そういう意味ではないのです おかげで イギリスやほかの国でも よく知られた控訴例が続出しています
And just to finish in the context of the legal system. It's all very well to say, "Let's do our best to present the evidence." But more and more, in cases of DNA profiling -- this is another one -- we expect juries, who are ordinary people -- and it's documented they're very bad at this -- we expect juries to be able to cope with the sorts of reasoning that goes on. In other spheres of life, if people argued -- well, except possibly for politics -- but in other spheres of life, if people argued illogically, we'd say that's not a good thing. We sort of expect it of politicians and don't hope for much more. In the case of uncertainty, we get it wrong all the time -- and at the very least, we should be aware of that, and ideally, we might try and do something about it. Thanks very much.
法律制度の話として締めくくりますと 「証拠を提出するのに最善を尽くしましょう」 とはよく言われますが DNA鑑定のような場合 何度も同じようなことが起こります 陪審員は一般人ですし 検証は苦手だと実証されているのに 私たちは陪審員が繰り返し出て来る 論証法に対処できることを期待してしまいます 多分 政治に関する場合を除いて ある生活側面では論理的に議論し 他の側面では論理的でない議論をしたら それは良くないことだと思うでしょう 政治家には起こることかもしれませんが それ以外で起こってほしくはありません しかし 不確かさを扱う場合 私たちはいつも間違いを犯します 私たちは 最低限それに気づく必要があります 理想を言えば 何か策を講じられればよいのですが ありがとうございました