Peter Donnelly: How juries are fooled by statistics

As other speakers have said, it's a rather daunting experience -- a particularly daunting experience -- to be speaking in front of this audience. But unlike the other speakers, I'm not going to tell you about the mysteries of the universe, or the wonders of evolution, or the really clever, innovative ways people are attacking the major inequalities in our world. Or even the challenges of nation-states in the modern global economy. My brief, as you've just heard, is to tell you about statistics -- and, to be more precise, to tell you some exciting things about statistics. And that's -- (Laughter) -- that's rather more challenging than all the speakers before me and all the ones coming after me. (Laughter) One of my senior colleagues told me, when I was a youngster in this profession, rather proudly, that statisticians were people who liked figures but didn't have the personality skills to become accountants. (Laughter) And there's another in-joke among statisticians, and that's, "How do you tell the introverted statistician from the extroverted statistician?" To which the answer is, "The extroverted statistician's the one who looks at the other person's shoes." (Laughter) But I want to tell you something useful -- and here it is, so concentrate now. This evening, there's a reception in the University's Museum of Natural History. And it's a wonderful setting, as I hope you'll find, and a great icon to the best of the Victorian tradition. It's very unlikely -- in this special setting, and this collection of people -- but you might just find yourself talking to someone you'd rather wish that you weren't. So here's what you do. When they say to you, "What do you do?" -- you say, "I'm a statistician." (Laughter) Well, except they've been pre-warned now, and they'll know you're making it up. And then one of two things will happen. They'll either discover their long-lost cousin in the other corner of the room and run over and talk to them. Or they'll suddenly become parched and/or hungry -- and often both -- and sprint off for a drink and some food. And you'll be left in peace to talk to the person you really want to talk to.

Như các diễn giả khác đã nói, diễn thuyết trước đám đông thế này là một trải nghiệm đặc biệt khó khăn. Nhưng không giống họ, tôi sẽ không nói về bí ẩn vũ trụ hay sự kì diệu của tạo hóa, hay những cách thức rất cấp tiến và thông minh mà người ta dùng để công kích những bất bình đẳng lớn trên thế giới. Hoặc thậm chí là những thách thức mà các quốc gia gặp phải trong bối cảnh kinh tế toàn cầu hiện đại. Như vừa giới thiệu, tôi sẽ nói về chủ đề số liệu thống kê, và cụ thể hơn, là vài điều thú vị về nó. (Tiếng cười) Có vẻ hơi khó khăn hơn so với tất cả diễn giả đến trước hoặc sau tôi. (Tiếng cười) Khi tôi mới chập chững vào nghề, một vị đồng nghiệp lâu năm bảo với tôi, với vẻ khá tự hào, rằng các chuyên gia thống kê là những kẻ thích số má nhưng không có kỹ năng cá nhân để trở thành kế toán. (Tiếng cười) Và còn một trò đùa khác trong giới thống kê là, “Làm sao để phân biệt nhà thống kê hướng nội hay hướng ngoại?” Câu trả lời là, “Nhà thống kê hướng ngoại là người luôn nhìn vào giày người khác.” (Tiếng cười) Nhưng tôi muốn nói điều gì đó hữu ích, vậy nên hãy tập trung nhé, đến rồi đây. Tối nay có một buổi lễ tại Bảo tàng Lịch sử Tự nhiên của Trường. Tôi mong bạn sẽ thấy bố trí ở đó tuyệt vời và biểu trưng tuyệt vời cho truyền thống thời Victoria tốt đẹp nhất. Rất khó xảy ra-- trong buổi lễ đặc biệt như thế, với tập hợp những người này-- bạn lỡ gặp một người khiến bạn hối hận vì bắt chuyện với họ. Khi đó bạn làm như sau. Khi họ hỏi bạn, “Bạn làm nghề gì?“. Bạn trả lời, “Tôi là nhà thống kê.” (Tiếng cười) Ừ thì, trừ khi họ đã được cảnh báo trước, và họ sẽ biết bạn đang dựng chuyện. Một trong hai điều sau sẽ xảy ra. Họ bỗng thấy vị họ hàng xa ở góc phòng và chạy tới trò chuyện với người đó. Hoặc họ đột nhiên thấy khát hoặc đói, hoặc thông thường là cả hai, và vội chạy đi tìm chút đồ ăn thức uống. Và bạn sẽ được yên thân để nói chuyện với người bạn thực sự thích.

It's one of the challenges in our profession to try and explain what we do. We're not top on people's lists for dinner party guests and conversations and so on. And it's something I've never really found a good way of doing. But my wife -- who was then my girlfriend -- managed it much better than I've ever been able to. Many years ago, when we first started going out, she was working for the BBC in Britain, and I was, at that stage, working in America. I was coming back to visit her. She told this to one of her colleagues, who said, "Well, what does your boyfriend do?" Sarah thought quite hard about the things I'd explained -- and she concentrated, in those days, on listening. (Laughter) Don't tell her I said that. And she was thinking about the work I did developing mathematical models for understanding evolution and modern genetics. So when her colleague said, "What does he do?" She paused and said, "He models things." (Laughter) Well, her colleague suddenly got much more interested than I had any right to expect and went on and said, "What does he model?" Well, Sarah thought a little bit more about my work and said, "Genes." (Laughter) "He models genes."

Trong ngành của chúng tôi, thật khó để giải thích việc chúng tôi làm. Chúng tôi không hẳn là những vị khách ưu tiên cho buổi tiệc tối và trò chuyện. Tôi chưa từng có đáp án thích đáng cho câu hỏi ấy. Nhưng vợ tôi, hồi còn là bạn gái tôi, giải quyết vấn đề dễ dàng hơn rất nhiều. Nhiều năm trước, giai đoạn mới quen, cô ấy làm ở đài BBC Anh, còn tôi lúc đó làm việc ở Mỹ. Tôi trở lại thăm cô ấy. Cô ấy trả lời câu hỏi từ một đồng nghiệp, “Bạn trai của bạn làm nghề gì?” Sarah nghĩ khá lâu về những điều tôi đã giải thích và thời đó, cô ấy vẫn tập trung lắng nghe tôi. (Tiếng cười) Đừng kể với cô ấy tôi nói thế nhé. Cô ấy nghĩ về các mô hình toán học mà tôi phát triển để tìm hiểu quá trình tiến hóa và di truyền học hiện đại. Thế nên khi người ta hỏi, "Anh ấy làm gì?" Cô ấy ngập ngừng, rồi trả lời: “Anh ấy làm mô hình.” (Tiếng cười) Rồi đồng nghiệp cô ấy đột nhiên tỏ ra thích thú hơn mong đợi của tôi và tiếp tục hỏi, “Anh ấy làm mô hình gì?” Chà, Sarah nghĩ ngợi thêm một chút về công việc của tôi và nói: “Gen.” (Tiếng cười) "Anh ấy tạo hình gen."

That is my first love, and that's what I'll tell you a little bit about. What I want to do more generally is to get you thinking about the place of uncertainty and randomness and chance in our world, and how we react to that, and how well we do or don't think about it. So you've had a pretty easy time up till now -- a few laughs, and all that kind of thing -- in the talks to date. You've got to think, and I'm going to ask you some questions. So here's the scene for the first question I'm going to ask you. Can you imagine tossing a coin successively? And for some reason -- which shall remain rather vague -- we're interested in a particular pattern. Here's one -- a head, followed by a tail, followed by a tail.

Tình đầu của tôi đấy, tôi chỉ kể một chút vậy thôi. Nói chung, điều tôi muốn các bạn làm là suy nghĩ về những điều chưa chắc chắn, ngẫu nhiên và tình cờ trong thế giới này, và cách ta phản ứng với chúng, và ta có nghĩ về chúng đúng hướng không. Từ đầu đến giờ các bạn khá thoải mải, vài trận cười, vài kiến thức về hẹn hò. Bạn cần động não, và tôi sẽ bắt đầu hỏi một số câu. Đây là bối cảnh cho câu hỏi đầu tiên. Thử tưởng tượng bạn tung đồng xu liên tục nhé? Vì vài lý do, dù chúng rất mơ hồ, ta để tâm đến một thứ tự cụ thể. Lần một ngửa, sau đó sấp, rồi lại sấp.

So suppose we toss a coin repeatedly. Then the pattern, head-tail-tail, that we've suddenly become fixated with happens here. And you can count: one, two, three, four, five, six, seven, eight, nine, 10 -- it happens after the 10th toss. So you might think there are more interesting things to do, but humor me for the moment. Imagine this half of the audience each get out coins, and they toss them until they first see the pattern head-tail-tail. The first time they do it, maybe it happens after the 10th toss, as here. The second time, maybe it's after the fourth toss. The next time, after the 15th toss. So you do that lots and lots of times, and you average those numbers. That's what I want this side to think about.

Giả sử chúng ta tung đồng xu liên tục. Thứ tự ngửa - sấp - sấp mà ta đột nhiên chú ý đến xảy ra tại đây. Bạn có thể đếm: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10-- Nó xảy ra vào lần tung thứ 10. Chắc bạn nghĩ còn điều gì đó thú vị hơn, nhưng xin hãy chiều lòng tôi chút. Tưởng tượng nửa số khán giả có đồng xu này trong tay, và tung lên cho tới khi họ thấy cụm ngửa - sấp - sấp. Lần đầu, chuỗi này có thể xuất hiện ở lần tung 10. Lần thứ hai, có thể sau lần tung thứ 4. Lần tiếp theo, sau lần tung thứ 15. Bạn tung rất nhiều lần, rồi tính trung bình của các con số đó. Nửa bên này tôi muốn các bạn nghĩ về viễn cảnh đó.

The other half of the audience doesn't like head-tail-tail -- they think, for deep cultural reasons, that's boring -- and they're much more interested in a different pattern -- head-tail-head. So, on this side, you get out your coins, and you toss and toss and toss. And you count the number of times until the pattern head-tail-head appears and you average them. OK? So on this side, you've got a number -- you've done it lots of times, so you get it accurately -- which is the average number of tosses until head-tail-tail. On this side, you've got a number -- the average number of tosses until head-tail-head.

Nửa số khán giả còn lại không thích thứ tự ngửa - sấp - sấp, họ nghĩ, vì lý do văn hóa, kiểu đó nhàm chán -- và họ thích một chuỗi thứ tự khác: ngửa - sấp - ngửa. Nên phía này, các bạn lấy đồng xu và cứ tung rồi lại tung. Bạn đếm cho đến khi thứ tự ngửa - sấp - ngửa xuất hiện và tính trung bình. Ok? Vậy phía bên này, bạn có con số -- bạn đã tung nhiều lần nên con số chính xác -- tức là trung bình số lần tung xu cho đến khi gặp ngửa - sấp - sấp.

So here's a deep mathematical fact -- if you've got two numbers, one of three things must be true. Either they're the same, or this one's bigger than this one, or this one's bigger than that one. So what's going on here? So you've all got to think about this, and you've all got to vote -- and we're not moving on. And I don't want to end up in the two-minute silence to give you more time to think about it, until everyone's expressed a view. OK. So what you want to do is compare the average number of tosses until we first see head-tail-head with the average number of tosses until we first see head-tail-tail.

Phía bên này là trung bình số lần tung cho đến khi gặp thứ tự ngửa - sấp - ngửa. Một sự thật về toán học thuần túy là nếu bạn tìm ra hai con số, một trong ba điều sau luôn đúng. Hoặc là chúng bằng nhau, hoặc số này lớn hơn số kia, hoặc số kia lớn hơn số này. Vậy, chuyện gì đang xảy ra? Các bạn phải cùng suy nghĩ và biểu quyết, và ta sẽ không chuyển mục đâu. Tôi không muốn dành hai phút im lặng để các bạn có thêm thời gian suy nghĩ tới khi ai cũng bày tỏ quan điểm. Ok? Điều ta cần làm là so sánh số lần tung đồng xu trung bình tới khi lần đầu gặp hai thứ tự nêu trên.

Who thinks that A is true -- that, on average, it'll take longer to see head-tail-head than head-tail-tail? Who thinks that B is true -- that on average, they're the same? Who thinks that C is true -- that, on average, it'll take less time to see head-tail-head than head-tail-tail? OK, who hasn't voted yet? Because that's really naughty -- I said you had to. (Laughter) OK. So most people think B is true. And you might be relieved to know even rather distinguished mathematicians think that. It's not. A is true here. It takes longer, on average. In fact, the average number of tosses till head-tail-head is 10 and the average number of tosses until head-tail-tail is eight. How could that be? Anything different about the two patterns? There is. Head-tail-head overlaps itself. If you went head-tail-head-tail-head, you can cunningly get two occurrences of the pattern in only five tosses. You can't do that with head-tail-tail. That turns out to be important.

Ai nghĩ A đúng rằng trung bình số lần tung ngửa - sấp - ngửa lớn hơn ngửa - sấp - sấp? Ai nghĩ B đúng rằng chúng bằng nhau? Ai nghĩ C đúng, tính trung bình, ta sẽ gặp thứ tự ngửa - sấp - ngửa sớm hơn ngửa - sấp - sấp? Ai chưa chọn nào? Như vậy là hư lắm nhé. Tôi đã bảo phải chọn mà. (Tiếng cười) Vậy, phần lớn chọn B đúng. Bạn sẽ thấy nhẹ nhõm khi biết ngay cả các nhà toán học lỗi lạc cũng nghĩ thế. Nhưng không phải. A mới đúng. Trung bình nó mất nhiều thời gian hơn. Thực tế, trung bình lần tung ngửa - sấp - ngửa là 10 còn trung bình lần tung sấp ngửa - sấp - sấp là 8. Sao có thể như thế? Có gì khác biệt giữa hai thứ tự không? Có đấy. Ngửa - sấp - ngửa có vòng lặp. Nếu bạn tung ra ngửa - sấp - ngửa - sấp - ngửa, bạn có thể dễ thấy thứ tự này xuất hiện hai lần chỉ trong năm lần tung. Ngửa - sấp - sấp không có kiểu lặp lại đó. Điều đó thế mà lại quan trọng.

There are two ways of thinking about this. I'll give you one of them. So imagine -- let's suppose we're doing it. On this side -- remember, you're excited about head-tail-tail; you're excited about head-tail-head. We start tossing a coin, and we get a head -- and you start sitting on the edge of your seat because something great and wonderful, or awesome, might be about to happen. The next toss is a tail -- you get really excited. The champagne's on ice just next to you; you've got the glasses chilled to celebrate. You're waiting with bated breath for the final toss. And if it comes down a head, that's great. You're done, and you celebrate. If it's a tail -- well, rather disappointedly, you put the glasses away and put the champagne back. And you keep tossing, to wait for the next head, to get excited.

Có hai lối suy nghĩ việc này. Tôi sẽ nói cho các bạn một lối nghĩ. Tưởng tượng-- giả sử ta đang tung đồng xu. Hãy nhớ phía này hứng thú với ngửa - sấp - sấp; còn với các bạn là ngửa - sấp - ngửa. Chúng ta tung đồng xu, và nhận được mặt ngửa và các bạn háo hức mong chờ bởi vì điều gì đó kì tích có thể sắp xảy ra. Lần tung tiếp là sấp, bạn cực kì hào hứng. Rượu sâm banh đã sẵn sàng, bạn chỉ cần rót vào ly để ăn mừng. Bạn nín thở chờ đợi lần tung cuối. Và, nếu là mặt ngửa thì tuyệt vời. Xong xuôi, và bạn ăn mừng. Nếu là sấp-- chà, hơi thất vọng, bạn cất ly và cả sâm banh. Bạn tiếp tục tung, đợi tới khi được mặt ngửa để tiếp tục hào hứng.

On this side, there's a different experience. It's the same for the first two parts of the sequence. You're a little bit excited with the first head -- you get rather more excited with the next tail. Then you toss the coin. If it's a tail, you crack open the champagne. If it's a head you're disappointed, but you're still a third of the way to your pattern again. And that's an informal way of presenting it -- that's why there's a difference. Another way of thinking about it -- if we tossed a coin eight million times, then we'd expect a million head-tail-heads and a million head-tail-tails -- but the head-tail-heads could occur in clumps. So if you want to put a million things down amongst eight million positions and you can have some of them overlapping, the clumps will be further apart. It's another way of getting the intuition.

Bên này lại có một trải nghiệm khác. Cả hai lần tung đầu đều như nhau. Bạn vui mừng một chút khi thấy mặt ngửa ở lần đầu, và vui mừng hơn khi thấy nó ở lần hai. Rồi bạn tung đồng xu. Nếu là mặt sấp, bạn khui rượu sâm banh. Nếu là ngửa, bạn thất vọng. Nhưng bạn vẫn đang ở 1/3 quãng đường để lại thấy thứ tự mong muốn. Đó là một cách đơn giản để trình bày về lý do có sự khác biệt. Cách còn lại-- Nếu ta tung đồng xu tám triệu lần, ta chờ mong một triệu lần ngửa - sấp - ngửa và một triệu ngửa - sấp - sấp, nhưng ngửa - sấp - ngửa có thể xuất hiện theo cụm. Nếu bạn muốn phân tán một triệu món đồ giữa tám triệu vị trí và bạn có thể xếp vài món trùng nhau, thì các cụm sẽ xa nhau hơn.

What's the point I want to make? It's a very, very simple example, an easily stated question in probability, which every -- you're in good company -- everybody gets wrong. This is my little diversion into my real passion, which is genetics. There's a connection between head-tail-heads and head-tail-tails in genetics, and it's the following. When you toss a coin, you get a sequence of heads and tails. When you look at DNA, there's a sequence of not two things -- heads and tails -- but four letters -- As, Gs, Cs and Ts. And there are little chemical scissors, called restriction enzymes which cut DNA whenever they see particular patterns. And they're an enormously useful tool in modern molecular biology. And instead of asking the question, "How long until I see a head-tail-head?" -- you can ask, "How big will the chunks be when I use a restriction enzyme which cuts whenever it sees G-A-A-G, for example? How long will those chunks be?"

Đó là một cách khác để nhìn nhận trực giác. Điều tôi muốn ở đây là gì? Đây là một ví dụ rất đơn giản, một câu hỏi dễ giải thích về xác suất, mà ai trong tình huống tương tự cũng trả lời sai. Hơi lái sang đam mê thật sự về gen của tôi một chút. Ngửa - sấp - ngửa và ngửa - sấp - sấp có một mối liên kết trong di truyền, cụ thể như sau. Khi tung đồng xu, bạn sẽ thấy một chuỗi ngửa và sấp. Khi nhìn vào DNA, không chỉ đơn thuần là chuỗi sấp và ngửa mà là bốn chữ cái: A, G, C, T. Có một chất hóa học tựa như cái kéo, gọi là enzyme giới hạn, chúng cắt DNA mỗi khi bắt gặp những thứ tự nhất định. Và chúng là một công cụ vô cùng hữu ích trong sinh học phân tử hiện đại. Thay cho câu hỏi “Mất bao lâu để thấy ngửa - sấp - ngửa?”, ta nghĩ, “Các chuỗi sẽ rộng tới đâu khi dùng enzymes giới hạn cắt ngang mỗi khi chuỗi G - A - A - G xuất hiện? Chuỗi ấy sẽ dài bao nhiêu?"

That's a rather trivial connection between probability and genetics. There's a much deeper connection, which I don't have time to go into and that is that modern genetics is a really exciting area of science. And we'll hear some talks later in the conference specifically about that. But it turns out that unlocking the secrets in the information generated by modern experimental technologies, a key part of that has to do with fairly sophisticated -- you'll be relieved to know that I do something useful in my day job, rather more sophisticated than the head-tail-head story -- but quite sophisticated computer modelings and mathematical modelings and modern statistical techniques. And I will give you two little snippets -- two examples -- of projects we're involved in in my group in Oxford, both of which I think are rather exciting. You know about the Human Genome Project. That was a project which aimed to read one copy of the human genome. The natural thing to do after you've done that -- and that's what this project, the International HapMap Project, which is a collaboration between labs in five or six different countries. Think of the Human Genome Project as learning what we've got in common, and the HapMap Project is trying to understand where there are differences between different people.

Ấy là một điểm giao khá nhỏ giữa xác suất và di truyền. Có mối quan hệ sâu sắc hơn, mà tôi không có thời gian để đào sâu, đó là di truyền học hiện đại, một lĩnh vực rất thú vị của khoa học. Ta sẽ nghe vài bài trình bày trong hội thảo cụ thể về chuyên đề đó. Nhưng hóa ra mở khóa những bí mật trong các thông tin được tạo ra bởi công nghệ thí nghiệm, một phần then chốt khá phức tạp-- Bạn sẽ nhẹ nhõm khi biết rằng tôi làm điều hữu ích trong công việc, còn phức tạp hơn câu chuyện ngửa - sấp - ngửa... Như là mô hình điện toán khá phức tạp và mô hình toán học và kỹ thuật thống kê hiện đại. Và tôi sẽ đưa cho bạn hai trích đoạn nhỏ - hai ví dụ về những dự án chúng tôi đang làm ở Oxford, tôi nghĩ cả hai đều khá thú vị. Bạn hẳn đã biết Dự án Hệ gen Người. Dự án với mục đích đọc bản sao của gen người. Việc làm dĩ nhiên sau khi bạn hoàn thành-- Là dự án này, Dự án HapMap Quốc tế, đó là sự hợp tác giữa các phòng thí nghiệm của năm, sáu quốc gia khác nhau. Dự án Hệ gen Người là nghiên cứu về những điểm chung của ta, và Dự án HapMap nhằm tìm hiểu nơi có sự khác biệt giữa những người khác nhau.

Why do we care about that? Well, there are lots of reasons. The most pressing one is that we want to understand how some differences make some people susceptible to one disease -- type-2 diabetes, for example -- and other differences make people more susceptible to heart disease, or stroke, or autism and so on. That's one big project. There's a second big project, recently funded by the Wellcome Trust in this country, involving very large studies -- thousands of individuals, with each of eight different diseases, common diseases like type-1 and type-2 diabetes, and coronary heart disease, bipolar disease and so on -- to try and understand the genetics. To try and understand what it is about genetic differences that causes the diseases. Why do we want to do that? Because we understand very little about most human diseases. We don't know what causes them. And if we can get in at the bottom and understand the genetics, we'll have a window on the way the disease works, and a whole new way about thinking about disease therapies and preventative treatment and so on. So that's, as I said, the little diversion on my main love.

Tại sao ta quan tâm việc đó? Có rất nhiều lý do. Mà cấp thiết nhất là ta muốn biết làm sao một số khác biệt ấy khiến vài người dễ mắc bệnh, ví dụ tiểu đường tuýp 2 và khiến vài người khác dễ bị bệnh tim, hoặc đột quỵ, tự kỷ và nhiều nữa. Đó là một dự án lớn. Có dự án lớn thứ hai, được tài trợ bởi Quỹ Wellcome ở quốc gia này, liên quan đến các nghiên cứu rất rộng-- hàng ngàn người, mắc một trong tám căn bệnh khác nhau, bệnh thông thường như tiểu đường tuýp 1 và tuýp 2 và bệnh tim mạch vành, rối loạn lưỡng cực và nhiều nữa, để cố hiểu được di truyền. Để thứ tìm hiểu điều gì trong khác biệt di truyền đã gây ra các bệnh. Sao chúng tôi muốn làm thế? Bởi vì ta hiểu rất ít về các bệnh của con người. Ta không biết nguyên nhân gây bệnh. Và nếu ta đi từ căn nguyên và hiểu được di truyền học, ta sẽ nhận thức cách hoạt động của bệnh tật, cũng như cách thức mới để chữa trị bệnh, biện pháp ngăn ngừa, vân vân. Vậy, như đã nói, đó là đôi chút chia sẻ thêm về đề tài tôi đam mê.

Back to some of the more mundane issues of thinking about uncertainty. Here's another quiz for you -- now suppose we've got a test for a disease which isn't infallible, but it's pretty good. It gets it right 99 percent of the time. And I take one of you, or I take someone off the street, and I test them for the disease in question. Let's suppose there's a test for HIV -- the virus that causes AIDS -- and the test says the person has the disease. What's the chance that they do? The test gets it right 99 percent of the time. So a natural answer is 99 percent. Who likes that answer? Come on -- everyone's got to get involved. Don't think you don't trust me anymore. (Laughter) Well, you're right to be a bit skeptical, because that's not the answer. That's what you might think. It's not the answer, and it's not because it's only part of the story. It actually depends on how common or how rare the disease is. So let me try and illustrate that. Here's a little caricature of a million individuals. So let's think about a disease that affects -- it's pretty rare, it affects one person in 10,000. Amongst these million individuals, most of them are healthy and some of them will have the disease. And in fact, if this is the prevalence of the disease, about 100 will have the disease and the rest won't. So now suppose we test them all. What happens? Well, amongst the 100 who do have the disease, the test will get it right 99 percent of the time, and 99 will test positive. Amongst all these other people who don't have the disease, the test will get it right 99 percent of the time. It'll only get it wrong one percent of the time. But there are so many of them that there'll be an enormous number of false positives. Put that another way -- of all of them who test positive -- so here they are, the individuals involved -- less than one in 100 actually have the disease. So even though we think the test is accurate, the important part of the story is there's another bit of information we need.

Quay lại các vấn đề trần tục hơn là suy nghĩ về sự hoài nghi. Và đây là câu hỏi mẹo khác cho các bạn. Giả sử ta nhận được xét nghiệm bệnh, kết quả có thể sai nhưng lại tốt. Khả năng chính xác của nó lên đến 99%. Tôi chọn một người ở đây, hoặc một người trên phố, tôi xét nghiệm xem họ có mang bệnh không. Giả sử đó là xét nghiệm HIV, loại virus gây AIDS và kết quả dương tính. Khả năng mắc bệnh họ là bao nhiêu? Kết quả đúng 99% mọi lúc. Nên câu trả lời mặc nhiên là 99%. Ai thích câu trả lời đó nào? Thôi nào-- mọi người tham gia đi. Các bạn không tin tôi nữa à. (Tiếng cười) Chà, các bạn hoài nghi cũng phải thôi, vì đó không phải là câu trả lời. Đó là điều mà bạn nghĩ. Đó không là câu trả lời, và không phải vì nó chỉ là một phần câu chuyện. Thật ra nó phụ thuộc vào độ phổ biến hay hiếm gặp của căn bệnh. Nên tôi sẽ cố gắng minh họa nó. Đây là tranh biếm họa nhỏ về một triệu cá thể. Nghĩ về một căn bệnh mà nó ảnh hưởng-- nó khá hiếm gặp, chỉ có ở 1 trong số 10.000 người. Trong số triệu người, phần lớn đều khỏe mạnh và một vài người sẽ mắc bệnh. Và thực tế, với mức độ nhiễm bệnh này, khoảng 100 người sẽ mắc bệnh, số người còn lại thì không. Giả sử ta xét nghiệm tất cả mọi người. Chuyện gì sẽ xảy ra? Chà, trong số 100 người mắc bệnh, xét nghiệm luôn đúng 99%, nên sẽ có 99 người dương tính. Trong số những người không mắc bệnh, xét nghiệm cũng chính xác đến 99% và khả năng sai là 1%. Nhưng có rất nhiều người, nên sẽ có nhiều kết quả dương tính giả. Hay nói cách khác, trong số những người dương tính-- họ ở đây, những người có liên quan-- chưa đến 1 trên tổng 100 người thực sự mắc bệnh. Nên mặc dù ta nghĩ xét nghiệm chính xác, phần quan trọng của câu chuyện là ta cần thêm một ít thông tin khác.

Here's the key intuition. What we have to do, once we know the test is positive, is to weigh up the plausibility, or the likelihood, of two competing explanations. Each of those explanations has a likely bit and an unlikely bit. One explanation is that the person doesn't have the disease -- that's overwhelmingly likely, if you pick someone at random -- but the test gets it wrong, which is unlikely. The other explanation is that the person does have the disease -- that's unlikely -- but the test gets it right, which is likely. And the number we end up with -- that number which is a little bit less than one in 100 -- is to do with how likely one of those explanations is relative to the other. Each of them taken together is unlikely.

Và đây là trực giác quan trọng. Điều chúng ta cần làm, khi đã biết kết quả dương tính là cân nhắc độ hợp lý, hay khả năng xảy ra của hai cách giải thích đối nghịch nhau. Mỗi cách giải thích đó đều có một chút khả thi và không khả thi. Cách giải thích rằng người đó không mắc bệnh, điều này rất có thể xảy ra nếu bạn chọn ngẫu nhiên một người-- nhưng kết quả xét nghiệm lại sai, điều mà khó xảy ra. Một giải thích khác là người đó mắc bệnh, điều khó có thể xảy ra, nhưng kết quả lại đúng, điều có khả năng xảy ra cao. Và con số cuối cùng chúng ta có được, con số nhỏ hơn 1/100 một chút thể hiện khả năng hai cách giải thích có liên quan đến nhau. Khả năng hai cách giải thích xảy ra đồng thời là không cao.

Here's a more topical example of exactly the same thing. Those of you in Britain will know about what's become rather a celebrated case of a woman called Sally Clark, who had two babies who died suddenly. And initially, it was thought that they died of what's known informally as "cot death," and more formally as "Sudden Infant Death Syndrome." For various reasons, she was later charged with murder. And at the trial, her trial, a very distinguished pediatrician gave evidence that the chance of two cot deaths, innocent deaths, in a family like hers -- which was professional and non-smoking -- was one in 73 million. To cut a long story short, she was convicted at the time. Later, and fairly recently, acquitted on appeal -- in fact, on the second appeal. And just to set it in context, you can imagine how awful it is for someone to have lost one child, and then two, if they're innocent, to be convicted of murdering them. To be put through the stress of the trial, convicted of murdering them -- and to spend time in a women's prison, where all the other prisoners think you killed your children -- is a really awful thing to happen to someone. And it happened in large part here because the expert got the statistics horribly wrong, in two different ways.

Đây là một ví dụ tương tự mang tính thời sự hơn. Trong số các bạn ai là người Anh ắt sẽ biết về một vụ việc khá nổi tiếng về một phụ nữ tên Sally Clark, có hai người con bị đột tử. Và ban đầu, người ta nghĩ chúng qua đời vì cái gọi là “chết trong nôi”, hay gọi chính thức là “Hội chứng Đột tử ở Trẻ sơ sinh”. Vì nhiều lý do, cô ấy sau đó bị kết án giết người. Tại phiên xét xử cô ấy, một bác sĩ nhi khoa lỗi lạc đã làm chứng rằng khả năng của hai cái chết trong nôi này, cái chết vô tội, trong những gia đình như của cô ấy, tức là có nghề nghiệp ổn định và không hút thuốc, là 1 trong 73 triệu. Để rút ngắn câu chuyện, cô ấy bị kết án tại thời điểm đó. Sau đó, chỉ mới đây, cô ấy được tha bổng-- thực tế, trong lần kháng cáo thứ hai. Và đặt vào tình huống đó, hãy tưởng tượng khủng khiếp đến nhường nào khi một người mất một và rồi hai đứa con, nếu họ vô tội nhưng lại bị kết án giết hại con mình. Trải qua căng thẳng của phiên tòa, bị kết tội giết hại con và nếm cảnh lao tù tại trại giam nữ, nơi các tù nhân khác nghĩ rằng bạn giết hại con ruột. Quả là điều khủng khiếp với một ai đó. Và lỗi ở đây xảy ra phần lớn bởi vì chuyên gia đã thống kê sai hoàn toàn,

So where did he get the one in 73 million number? He looked at some research, which said the chance of one cot death in a family like Sally Clark's is about one in 8,500. So he said, "I'll assume that if you have one cot death in a family, the chance of a second child dying from cot death aren't changed." So that's what statisticians would call an assumption of independence. It's like saying, "If you toss a coin and get a head the first time, that won't affect the chance of getting a head the second time." So if you toss a coin twice, the chance of getting a head twice are a half -- that's the chance the first time -- times a half -- the chance a second time. So he said, "Here, I'll assume that these events are independent. When you multiply 8,500 together twice, you get about 73 million." And none of this was stated to the court as an assumption or presented to the jury that way. Unfortunately here -- and, really, regrettably -- first of all, in a situation like this you'd have to verify it empirically. And secondly, it's palpably false. There are lots and lots of things that we don't know about sudden infant deaths. It might well be that there are environmental factors that we're not aware of, and it's pretty likely to be the case that there are genetic factors we're not aware of. So if a family suffers from one cot death, you'd put them in a high-risk group. They've probably got these environmental risk factors and/or genetic risk factors we don't know about. And to argue, then, that the chance of a second death is as if you didn't know that information is really silly. It's worse than silly -- it's really bad science. Nonetheless, that's how it was presented, and at trial nobody even argued it. That's the first problem. The second problem is, what does the number of one in 73 million mean? So after Sally Clark was convicted -- you can imagine, it made rather a splash in the press -- one of the journalists from one of Britain's more reputable newspapers wrote that what the expert had said was, "The chance that she was innocent was one in 73 million." Now, that's a logical error. It's exactly the same logical error as the logical error of thinking that after the disease test, which is 99 percent accurate, the chance of having the disease is 99 percent. In the disease example, we had to bear in mind two things, one of which was the possibility that the test got it right or not. And the other one was the chance, a priori, that the person had the disease or not. It's exactly the same in this context. There are two things involved -- two parts to the explanation. We want to know how likely, or relatively how likely, two different explanations are. One of them is that Sally Clark was innocent -- which is, a priori, overwhelmingly likely -- most mothers don't kill their children. And the second part of the explanation is that she suffered an incredibly unlikely event. Not as unlikely as one in 73 million, but nonetheless rather unlikely. The other explanation is that she was guilty. Now, we probably think a priori that's unlikely. And we certainly should think in the context of a criminal trial that that's unlikely, because of the presumption of innocence. And then if she were trying to kill the children, she succeeded. So the chance that she's innocent isn't one in 73 million. We don't know what it is. It has to do with weighing up the strength of the other evidence against her and the statistical evidence. We know the children died. What matters is how likely or unlikely, relative to each other, the two explanations are. And they're both implausible. There's a situation where errors in statistics had really profound and really unfortunate consequences. In fact, there are two other women who were convicted on the basis of the evidence of this pediatrician, who have subsequently been released on appeal. Many cases were reviewed. And it's particularly topical because he's currently facing a disrepute charge at Britain's General Medical Council.

theo hai cách khác nhau. Vậy từ đâu mà ông ấy có được con số 1 phần 73 triệu? Ông dựa vào vài nghiên cứu, theo đó khả năng đột tử của một đứa trẻ trong gia đình như của Sally Clark là 1 phần 8.500. Vì thế ông ấy đã nói, “Tôi sẽ giả sử rằng trong gia đình có một đứa trẻ đột tử, khả năng đứa trẻ thứ hai bị đột tử cũng không thay đổi.” Đó là những gì mà các nhà thống kê gọi là giả thiết độc lập. Nó giống như, “Nếu bạn tung một đồng xu và lần đầu xuất hiện mặt ngửa, sẽ không ảnh hưởng khả năng ta sẽ thấy mặt ngửa ở lần thứ hai.” Vì thế nếu bạn tung đồng xu hai lần, xác suất thu về hai mặt ngửa là một nửa (xác suất của lần đầu tiên) nhân với một nửa (xác suất ở lần hai), Vì thế ông ấy nói, “Tôi giả sử rằng những ca đột tử này độc lập với nhau. Khi bạn nhân hai lần 8.500 với nhau, bạn được khoảng 73 triệu.” Và chẳng có giả thiết nào được phát biểu tại tòa hay trình bày trước bồi thẩm đoàn theo cách như thế. Nhưng rủi thay-- và, thật sự đáng tiếc, trước hết, các tình huống tương tự phải được kiểm chứng bằng thực nghiệm. Và thứ hai, nó sai rõ ràng. Có nhiều và rất nhiều thứ mà chúng ta không biết về chứng đột tử ở trẻ em. Có thể có những yếu tố do môi trường mà chúng ta không nhận ra, và rất có khả năng xảy ra trường hợp có các yếu tố di truyền mà ta không biết. Vậy nếu một gia đình có trẻ em đột tử, bạn nên đặt họ vào nhóm có nguy cơ cao. Họ có thể bị tác động bởi yếu tố rủi ro từ môi trường và/hoặc nguy cơ từ di truyền mà ta không biết. Và để biện luận, việc ngó lơ thông tin kia khi tính xác suất ca đột tử thứ hai thật sự ngu xuẩn. Còn tệ hại hơn cả ngu xuẩn-- quả thật là nguỵ biện khoa học. Dù sao, đó là cách nó được trình bày, và tại phiên tòa, không ai phản biện điều đó. Đó là vấn đề đầu tiên. Vấn đề thứ hai là, con số 1 phần 73 triệu có ý nghĩa gì? Vậy, sau khi Sally Clark bị kết án, bạn có thể tưởng tượng, sự việc tạo ra một sự bùng nổ trong cộng đồng. Một trong những nhà báo từ toà soạn danh tiếng tại Anh đã viết về những gì chuyên gia này đã nói là, “Khả năng mà cô ấy vô tội là 1 phần 73 triệu.” Đó là một lỗi logic. Hoàn toàn tương tự sự phi logic khi nghĩ rằng sau lần xét nghiệm bệnh có độ chính xác 99%, khả năng mắc bệnh là 99%. Trong ví dụ về bệnh, ta đã nghĩ đến hai điều, một là khả năng xét nghiệm đúng hoặc sai. Và điều còn lại là khả năng, tiên nghiệm, người đó có mắc bệnh hay không. Điều này cũng tương tự trong tình huống này. Có hai điều liên quan, hai phần của lời giải thích. Ta muốn biết hai cách giải thích khác nhau có khả năng, hoặc tương đối ra sao. Một trong số đó là Sally Clark vô tội -- chính là tiên nghiệm, rất có khả năng xảy ra, hầu hết các bà mẹ không giết con mình. Và phần thứ hai của lời giải thích là cô ấy trải qua một sự kiện cực kỳ khó xảy ra. Không phải là 1 phần 73 triệu, nhưng dù sao cũng khá khó xảy ra. Một giải thích khác là cô ấy có tội. Ta có lẽ nghĩ tiên nghiệm này khó xảy ra. Và ta chắc chắn nên suy xét trong bối cảnh vụ án hình sự, rằng việc đó khó xảy ra, dựa vào suy đoán vô tội. Và nếu có ý định giết con mình, cô ấy đã thành công. Vì thế khả năng cô ấy vô tội không phải là 1 phần 73 triệu. Ta không biết con số cụ thể. Cần cân nhắc những bằng chứng chống lại cô ấy và bằng chứng có thống kê. Ta biết những đứa trẻ đã chết. Bất kể hai giải thích này có khả năng hoặc liên quan đến nhau hay không. Và cả hai đều không hợp lý. Có trường hợp các sai sót trong thống kê gây ra những hậu quả thực sự nghiêm trọng và rất đáng tiếc. Thực tế, có hai phụ nữ khác đã bị kết tội dựa trên lời khai của bác sĩ nhi khoa này, họ chỉ được tuyên trắng án sau kháng cáo. Nhiều vụ án đã được xem xét lại. Và sự việc rất được quan tâm vì ông ấy hiện phải đối mặt với cáo buộc tai tiếng tại Hội đồng Y khoa của Anh.

So just to conclude -- what are the take-home messages from this? Well, we know that randomness and uncertainty and chance are very much a part of our everyday life. It's also true -- and, although, you, as a collective, are very special in many ways, you're completely typical in not getting the examples I gave right. It's very well documented that people get things wrong. They make errors of logic in reasoning with uncertainty. We can cope with the subtleties of language brilliantly -- and there are interesting evolutionary questions about how we got here. We are not good at reasoning with uncertainty. That's an issue in our everyday lives. As you've heard from many of the talks, statistics underpins an enormous amount of research in science -- in social science, in medicine and indeed, quite a lot of industry. All of quality control, which has had a major impact on industrial processing, is underpinned by statistics. It's something we're bad at doing. At the very least, we should recognize that, and we tend not to. To go back to the legal context, at the Sally Clark trial all of the lawyers just accepted what the expert said. So if a pediatrician had come out and said to a jury, "I know how to build bridges. I've built one down the road. Please drive your car home over it," they would have said, "Well, pediatricians don't know how to build bridges. That's what engineers do." On the other hand, he came out and effectively said, or implied, "I know how to reason with uncertainty. I know how to do statistics." And everyone said, "Well, that's fine. He's an expert." So we need to understand where our competence is and isn't. Exactly the same kinds of issues arose in the early days of DNA profiling, when scientists, and lawyers and in some cases judges, routinely misrepresented evidence. Usually -- one hopes -- innocently, but misrepresented evidence. Forensic scientists said, "The chance that this guy's innocent is one in three million." Even if you believe the number, just like the 73 million to one, that's not what it meant. And there have been celebrated appeal cases in Britain and elsewhere because of that.

Để kết luận, thông điệp đáng nhớ từ chuyện này là gì? Chà, ta biết sự ngẫu nhiên và không chắc chắn và tình cờ là một phần rất đỗi thông thường trong đời sống hằng ngày. Cũng đúng-- và, mặc dù, tập thể các bạn rất đặc biệt theo nhiều cách, việc các bạn trả lời sai các ví dụ của tôi là hoàn toàn bình thường. Có nhiều nghiên cứu cho thấy con người mắc sai lầm. Trong các tình huống không chắc chắn, mọi người mắc lỗi logic. Ta có thể xuất sắc đương đầu với sự tinh tế của ngôn ngữ và đặt các câu hỏi có tính xây dựng thú vị về quá trình tiến hóa của mình. Ta lại không giỏi suy đoán những sự không chắc chắn. Đó là vấn đề hằng ngày của ta. Như các bạn đã nghe từ nhiều bài nói, thống kê là cơ sở cho một lượng lớn các nghiên cứu về khoa học, xã hội học, y học và tất nhiên, khá nhiều ngành công nghiệp. Tất cả kiểm định chất lượng, có tác động lớn đến quy trình công nghiệp, đều lấy cơ sở từ số liệu thống kê. Đó là lĩnh vực ta vẫn chưa làm tốt. Ít nhất ta nên thừa nhận điều đó, nhưng ta không muốn làm thế. Trở lại vấn đề luật pháp, tại phiên xét xử Sally Clark, tất cả luật sư đều chấp nhận những gì chuyên gia nhi khoa nói. Vậy nếu một bác sĩ nhi khoa bước ra và nói với bồi thẩm đoàn, “Tôi biết cách xây cầu. Tôi đã xây một cây cầu phía xa kia. Hãy lái xe băng qua cầu để về nhà nhé,” họ sẽ nói, “Chà, bác sĩ nhi khoa không biết xây cầu. Đó là việc của các kỹ sư." Mặt khác, ông ta đến và tích cực phát biểu hoặc áp đặt, “Tôi biết giải thích sự không chắc chắn. Tôi biết cách thống kê.” Và mọi người nói, “Chà, ổn rồi. Ông ta là một chuyên gia.” Vì thế ta cần hiểu chuyên môn của mình là gì. Các vấn đề tương tự nảy sinh trong thời kỳ đầu của thử nghiệm DNA, khi các nhà khoa học, và luật sư và đôi khi là các thẩm phán, liên tục giải thích sai các bằng chứng. Thường thì họ không cố ý ngó lơ các chứng cứ, hy vọng là thế. Các nhà khoa học pháp y nói, “Khả năng người này vô tội là 1 phần 1 triệu.” Thậm chí nếu bạn tin con số này, giống như tỉ lệ 1 phần 73 triệu, chuyện không hẳn vậy đâu. Và vì thế mới có những vụ kháng cáo nổi tiếng tại Anh và những nơi khác.

And just to finish in the context of the legal system. It's all very well to say, "Let's do our best to present the evidence." But more and more, in cases of DNA profiling -- this is another one -- we expect juries, who are ordinary people -- and it's documented they're very bad at this -- we expect juries to be able to cope with the sorts of reasoning that goes on. In other spheres of life, if people argued -- well, except possibly for politics -- but in other spheres of life, if people argued illogically, we'd say that's not a good thing. We sort of expect it of politicians and don't hope for much more. In the case of uncertainty, we get it wrong all the time -- and at the very least, we should be aware of that, and ideally, we might try and do something about it. Thanks very much.

Và để kết thúc trong ngữ cảnh hệ thống luật pháp. Nói rằng “Hãy cố gắng hết sức để đưa ra bằng chứng” cũng tuyệt đấy. Nhưng hơn thế nữa, khi thử nghiệm DNA, đây là trường hợp khác-- ta mong đợi bồi thẩm đoàn, họ là những người dân bình thường, mà rõ ràng họ không có chuyên môn cao, ta mong đợi bồi thẩm đoàn có thể hiểu được một loạt lập luận được đưa ra. Trong các lĩnh vực khác của cuộc sống, nếu mọi người tranh luận à, ngoại trừ đối với chính trị-- nhưng trong lĩnh vực khác, nếu mọi người tranh luận vô lý, ta sẽ cho đó không phải điều tốt. Các chính trị gia thường tranh luận vô lý và ta không hy vọng hơn thế. Trong trường hợp không chắc chắn, chúng ta luôn phạm sai lầm -- và ít nhất, ta nên nhận thức điều đó, và lý tưởng nhất, ta có thể thử làm điều gì đó. Cảm ơn rất nhiều.

Peter Donnelly: How juries are fooled by statistics

Peter Donnelly: How juries are fooled by statistics

Related talks

Hans Rosling: The best stats you've ever seen

Michael Shermer: Why people believe weird things

Emily Oster: Flip your thinking on AIDS in Africa

Robert Full: Learning from the gecko's tail

Aubrey de Grey: A roadmap to end aging

E.O. Wilson: Advice to a young scientist

Related talks

Hans Rosling: The best stats you've ever seen

Michael Shermer: Why people believe weird things

Emily Oster: Flip your thinking on AIDS in Africa

Robert Full: Learning from the gecko's tail

Aubrey de Grey: A roadmap to end aging

E.O. Wilson: Advice to a young scientist