Peter Donnelly: How juries are fooled by statistics

Както казаха други оратори, е доста обезсърчително преживяване... особено обезсърчително преживяване... да се говори пред тази публика. Но за разлика от другите оратори, аз няма да ви разказвам за мистериите на Вселената, или чудесата на еволюцията, или наистина умните, иновативни начини, по които хората атакуват огромните неравенства в нашия свят. Дори и за предизвикателствата на нациите-държави в модерната глобална икономика. Целта ми, както току-що чухте, е да ви разказвам за статистика... и, за да бъда по-точен, да ви разкажа някои вълнуващи неща за статистиката. А това е... (Смях) ...това е доста по-предизвикателно, отколкото за всички оратори преди мен и за всички след мен. (Смях) Един от по-старшите ми колеги ми каза, когато бях младок в тази професия, доста гордо, че статистиците са хора, които харесват цифрите, но нямат личните умения, за да станат счетоводители. (Смях) Сред статистиците има и друга вътрешна шега: "По какво се различава статистикът интроверт от статистика екстроверт?" А отговорът е: "Статистикът екстроверт е този, който гледа обувките на другия човек." (Смях) Искам обаче да ви кажа нещо полезно... ето го, така че се съсредоточете. Тази вечер има прием в Университетския музей по естествена история. Чудесна обстановка, както се надявам да откриете, и прекрасен символ на най-добротото от викторианската традиция. Доста е невероятно... при тази специална обстановка и тази сбирка от хора... но може просто да се окаже, че говорите с някого, с когото бихте предпочели да не говорите. Ето какво да правите. Когато ви попитат: "С какво се занимавате?", отговаряте: "Със статистика". (Смях) Е, освен ако не са предупредени предварително сега и знаят, че си го измисляте. И тогава ще се случи едно от две неща. Или ще открият отдавна изгубения си братовчед в другия ъгъл на залата и ще изтичат да поговорят с него, или пък внезапно ще ги обземе страхотен глад и/или жажда... често и двете... и ще спринтират за питие и храна. А вие ще бъдете оставени на мира да поговорите с човека, с когото наистина искате.

As other speakers have said, it's a rather daunting experience -- a particularly daunting experience -- to be speaking in front of this audience. But unlike the other speakers, I'm not going to tell you about the mysteries of the universe, or the wonders of evolution, or the really clever, innovative ways people are attacking the major inequalities in our world. Or even the challenges of nation-states in the modern global economy. My brief, as you've just heard, is to tell you about statistics -- and, to be more precise, to tell you some exciting things about statistics. And that's -- (Laughter) -- that's rather more challenging than all the speakers before me and all the ones coming after me. (Laughter) One of my senior colleagues told me, when I was a youngster in this profession, rather proudly, that statisticians were people who liked figures but didn't have the personality skills to become accountants. (Laughter) And there's another in-joke among statisticians, and that's, "How do you tell the introverted statistician from the extroverted statistician?" To which the answer is, "The extroverted statistician's the one who looks at the other person's shoes." (Laughter) But I want to tell you something useful -- and here it is, so concentrate now. This evening, there's a reception in the University's Museum of Natural History. And it's a wonderful setting, as I hope you'll find, and a great icon to the best of the Victorian tradition. It's very unlikely -- in this special setting, and this collection of people -- but you might just find yourself talking to someone you'd rather wish that you weren't. So here's what you do. When they say to you, "What do you do?" -- you say, "I'm a statistician." (Laughter) Well, except they've been pre-warned now, and they'll know you're making it up. And then one of two things will happen. They'll either discover their long-lost cousin in the other corner of the room and run over and talk to them. Or they'll suddenly become parched and/or hungry -- and often both -- and sprint off for a drink and some food. And you'll be left in peace to talk to the person you really want to talk to.

Едно от предизвикателствата в нашата професия е да се опитваме да обясним с какво се занимаваме. Не сме начело на хорските списъци за гости на вечеря, разговори и така нататък. И това е нещо, за което всъщност никога не съм намирал добър начин. Но жена ми... която тогава беше моя приятелка... успяваше в това далеч по-добре от мен. Преди много години, когато започнахме да излизаме отначало, тя работеше в Би Би Си в Британия, а аз, на този етап, работех в Америка. Връщах се да я посетя. Тя каза това на един от колегите си, който попита: "А какво работи приятелят ти?" Сара се замислила доста за нещата, които съм й обяснявал... а в онези времена тя се съсредоточаваше върху изсушването. (Смях) Не й казвайте, че съм казал така. И мислеше за работата, която вършех за разработване на математически модели за разбиране на еволюцията и модерната генетика. Затова, когато колегата й попитал: "Какво работи той", тя замълчала за малко и отвърнала: "Моделира разни неща." (Смях) Е, колегата й внезапно се заинтересувал много повече, отколкото имах право да очаквам, продължил и попитал: "А какво моделира?" Сара помислила още малко за работата ми и отвърнала: "Гени." (Смях) "Той моделира гени."

It's one of the challenges in our profession to try and explain what we do. We're not top on people's lists for dinner party guests and conversations and so on. And it's something I've never really found a good way of doing. But my wife -- who was then my girlfriend -- managed it much better than I've ever been able to. Many years ago, when we first started going out, she was working for the BBC in Britain, and I was, at that stage, working in America. I was coming back to visit her. She told this to one of her colleagues, who said, "Well, what does your boyfriend do?" Sarah thought quite hard about the things I'd explained -- and she concentrated, in those days, on listening. (Laughter) Don't tell her I said that. And she was thinking about the work I did developing mathematical models for understanding evolution and modern genetics. So when her colleague said, "What does he do?" She paused and said, "He models things." (Laughter) Well, her colleague suddenly got much more interested than I had any right to expect and went on and said, "What does he model?" Well, Sarah thought a little bit more about my work and said, "Genes." (Laughter) "He models genes."

Това е първата ми любов, ще ви разкажа малко за нея. Онова, което искам да постигна по-общо, е да ви накарам да се замислите за мястото на несигурността, произволността и случайността в нашия свят, как реагираме на това и колко добре мислим, или не мислим за това. Досега ви беше доста лесно... малко смях, ей такива неща... на разговорите досега. Трябва да помислите, и ще ви задам няколко въпроса. Ето първия въпрос, който ще ви задам. Можете ли да си представите последователно хвърляне на монета? По някаква причина... която ще остане доста неясна... се интересуваме от определен модел. Ето един... ези, следвано от тура, следвано от тура.

That is my first love, and that's what I'll tell you a little bit about. What I want to do more generally is to get you thinking about the place of uncertainty and randomness and chance in our world, and how we react to that, and how well we do or don't think about it. So you've had a pretty easy time up till now -- a few laughs, and all that kind of thing -- in the talks to date. You've got to think, and I'm going to ask you some questions. So here's the scene for the first question I'm going to ask you. Can you imagine tossing a coin successively? And for some reason -- which shall remain rather vague -- we're interested in a particular pattern. Here's one -- a head, followed by a tail, followed by a tail.

Да предположим, че хвърляме монета многократно. Тогава моделът, ези-тура-тура, от който внезапно сме обсебени, се случва тук. И може да се брои: едно, две, три, четири, пет, шест, седем, осем, девет, десет... случва се след десетото хвърляне. Може да си мислите, че има по-интересни неща за правене, но ми угодете за момента. Представете си, че всички от тази половина от публиката вземат монети и ги хвърлят, докато видят за пръв път модела ези-тура-тура. За пръв път може да се случи след десетото хвърляне, както тук. Втория път - може би след четвъртото хвърляне. Следващия път, след 15-тото хвърляне. Значи, това се прави много пъти и се усредняват тези числа. За това искам да мисли тази страна.

So suppose we toss a coin repeatedly. Then the pattern, head-tail-tail, that we've suddenly become fixated with happens here. And you can count: one, two, three, four, five, six, seven, eight, nine, 10 -- it happens after the 10th toss. So you might think there are more interesting things to do, but humor me for the moment. Imagine this half of the audience each get out coins, and they toss them until they first see the pattern head-tail-tail. The first time they do it, maybe it happens after the 10th toss, as here. The second time, maybe it's after the fourth toss. The next time, after the 15th toss. So you do that lots and lots of times, and you average those numbers. That's what I want this side to think about.

Другата част от публиката не обича ези-тура-тура... според тях, по дълбоки културни причини, това е скучно... и са много по-заинтересувани от различен модел - ези-тура-ези. Значи, от тази страна, изваждате монетите си, хвърляте и хвърляте, и хвърляте. И броите колко пъти, докато се появи моделът ези-тура-ези и ги усреднявате. Става ли? Значи, от тази страна имате число... правили сте го много пъти, така че е точно... което е средният брой хвърляния до получаване на ези-тура-тура. От тази страна имате число... средният брой хвърляния до получаване на ези-тура-ези.

The other half of the audience doesn't like head-tail-tail -- they think, for deep cultural reasons, that's boring -- and they're much more interested in a different pattern -- head-tail-head. So, on this side, you get out your coins, and you toss and toss and toss. And you count the number of times until the pattern head-tail-head appears and you average them. OK? So on this side, you've got a number -- you've done it lots of times, so you get it accurately -- which is the average number of tosses until head-tail-tail. On this side, you've got a number -- the average number of tosses until head-tail-head.

Ето един дълбок математически факт... ако има две числа, трябва да е вярно едно от три неща. Или са едни и същи, или това е по-голямо от онова, или онова по-голямо от това. А какво става тук? Трябва всички да помислите за това и всички да гласуваме... не се придвижваме нататък. И не искам накрая да се получи двеминутно мълчание, за да ви дам повече време да мислите за това, докато всеки е изразил възглед. Така. Това, което искате да правите, е да сравнявате средния брой хвърляния, докато видим за пръв път ези-тура-ези със средния брой хвърляния, докато видим ези-тура-тура.

So here's a deep mathematical fact -- if you've got two numbers, one of three things must be true. Either they're the same, or this one's bigger than this one, or this one's bigger than that one. So what's going on here? So you've all got to think about this, and you've all got to vote -- and we're not moving on. And I don't want to end up in the two-minute silence to give you more time to think about it, until everyone's expressed a view. OK. So what you want to do is compare the average number of tosses until we first see head-tail-head with the average number of tosses until we first see head-tail-tail.

Кой мисли, че А е вярно... че средно ще трябва по-дълго време, за да се види ези-тура-ези, отколкото ези-тура-тура? Кой мисли, че е вярно В - че средно са едни и същи? Кой мисли, че е вярно С - че средно ще трябва по-малко време, за да се види ези-тура-ези, отколкото ези-тура-тура? Така, кой не е гласувал още? Защото това е много невъзпитано - казах ви, че трябва. (Смях) Така. Значи, повечето хора мислят, че е вярно В. Може да сте облекчени да научите, че така мислят дори доста изтъкнати математици. Не е така. Тук е вярно А. Средно е нужно по-дълго време. Всъщност средният брой хвърляния, докато се падне 10 пъти ези-тура-ези и средният брой хвърляния, докато се падне ези-тура-тура е осем. Как е възможно? Има ли нещо различно в двата модела? Има. Ези-тура-ези се застъпва. Ако се получи ези-тура-ези-тура-ези, може хитро да се получат две появи на модела само при пет хвърляния. Не става с ези-тура-тура. Това се оказва важно.

Who thinks that A is true -- that, on average, it'll take longer to see head-tail-head than head-tail-tail? Who thinks that B is true -- that on average, they're the same? Who thinks that C is true -- that, on average, it'll take less time to see head-tail-head than head-tail-tail? OK, who hasn't voted yet? Because that's really naughty -- I said you had to. (Laughter) OK. So most people think B is true. And you might be relieved to know even rather distinguished mathematicians think that. It's not. A is true here. It takes longer, on average. In fact, the average number of tosses till head-tail-head is 10 and the average number of tosses until head-tail-tail is eight. How could that be? Anything different about the two patterns? There is. Head-tail-head overlaps itself. If you went head-tail-head-tail-head, you can cunningly get two occurrences of the pattern in only five tosses. You can't do that with head-tail-tail. That turns out to be important.

Има два начина да се мисли за това. Ще ви дам един от тях. Представете си... да предположим, че го правим. От тази страна... помнете, вие сте развълнувани от ези-тура-тура, вие сте развълнувани от ези-тура-ези. Започваме да хвърляме монета и получаваме ези... и започвате да седите на ръба на стола си, защото може да е на път да се случи нещо прекрасно, чудесно или внушително. Следващото хвърляне е тура... наистина се вълнувате. Шампанското се изстудява върху лед до вас, охладили сте чашите за празнуване. Чакате със затаен дъх последното хвърляне. И се пада ези, страхотно. Готови сте, и празнувате. Ако е тура... е, доста разочароващо, оставяте чашите и прибирате шампанското. И продължавате да хвърляте, в очакване на следващото ези, за да се развълнувате.

There are two ways of thinking about this. I'll give you one of them. So imagine -- let's suppose we're doing it. On this side -- remember, you're excited about head-tail-tail; you're excited about head-tail-head. We start tossing a coin, and we get a head -- and you start sitting on the edge of your seat because something great and wonderful, or awesome, might be about to happen. The next toss is a tail -- you get really excited. The champagne's on ice just next to you; you've got the glasses chilled to celebrate. You're waiting with bated breath for the final toss. And if it comes down a head, that's great. You're done, and you celebrate. If it's a tail -- well, rather disappointedly, you put the glasses away and put the champagne back. And you keep tossing, to wait for the next head, to get excited.

От тази страна, ето различно преживяване. Същото е за първите две части от поредицата. Малко сте развълнувани от първото ези... вълнувате се доста повече от следващата тура. После хвърляте монетата. Ако е тура, гръмвате шампанското. Ако е ези, сте разочаровани, но все пак сте на една трета от пътя отново да получите вашия модел. Това е неформален начин да се представи... затова има разлика. Друг начин да се мисли по въпроса - ако хвърлим една монета осем милиона пъти, тогава бихме очаквали един милион ези-тура-ези и един милион ези-тура-тура - но ези-тура-ези би могло да се проявява накуп. Затова, ако искате да поставите милион неща сред осем милиона позиции и може някои от тях да се застъпват, куповете ще бъдат по-раздалечени. Това е друг начин за схващане на интуицията.

On this side, there's a different experience. It's the same for the first two parts of the sequence. You're a little bit excited with the first head -- you get rather more excited with the next tail. Then you toss the coin. If it's a tail, you crack open the champagne. If it's a head you're disappointed, but you're still a third of the way to your pattern again. And that's an informal way of presenting it -- that's why there's a difference. Another way of thinking about it -- if we tossed a coin eight million times, then we'd expect a million head-tail-heads and a million head-tail-tails -- but the head-tail-heads could occur in clumps. So if you want to put a million things down amongst eight million positions and you can have some of them overlapping, the clumps will be further apart. It's another way of getting the intuition.

Какво всъщност твърдя? Това е много, много прост пример, лесен за излагане въпрос по вероятност, който всеки... в добра компания сте... всеки разбира погрешно. Това е малкото ми отклонение от реалната ми страст, а именно генетиката. Има връзка между ези-тура-ези и ези-тура-тура в генетиката, и тя е следната. При хвърляне на монета се получава поредица от ези и тура. Като погледнеш ДНК, там има поредица не от две неща - ези и тура - а от четири букви: А-та, Г-та, Ц-та и Т-та. Има и малки химически ножици, наречени рестрикционни ендонуклеази, които срязват ДНК, щом видят определени модели. И са невероятно полезен инструмент в модерната молекулярна биология. Вместо да се задава въпросът: "Колко време ще мине, докато видя ези-тура-ези?", може да попиташ: "Колко големи ще бъдат парчетата, когато използвам рестрикционна ендонуклеаза, която реже винаги, щом види Г-А-А-Г, например? Колко дълги ще бъдат тези парчета?"

What's the point I want to make? It's a very, very simple example, an easily stated question in probability, which every -- you're in good company -- everybody gets wrong. This is my little diversion into my real passion, which is genetics. There's a connection between head-tail-heads and head-tail-tails in genetics, and it's the following. When you toss a coin, you get a sequence of heads and tails. When you look at DNA, there's a sequence of not two things -- heads and tails -- but four letters -- As, Gs, Cs and Ts. And there are little chemical scissors, called restriction enzymes which cut DNA whenever they see particular patterns. And they're an enormously useful tool in modern molecular biology. And instead of asking the question, "How long until I see a head-tail-head?" -- you can ask, "How big will the chunks be when I use a restriction enzyme which cuts whenever it sees G-A-A-G, for example? How long will those chunks be?"

Това е доста тривиална връзка между вероятност и генетика. Има много по-дълбока връзка, в която нямам време да навлизам, и тя е, че модерната генетика е наистина вълнуваща област от науката. Ще чуем някои разговори по-нататък на конференцията специално за това. Но се оказва, че отключването на тайните в информацията, генерирана от модерни експериментални технологии, ключова част от него е свързана с доста сложни... ще бъдете облекчени, като научите, че върша нещо полезно в работата си, доста по-сложни от историята с ези-тура-ези... но доста сложни компютърни моделирания, математически моделирания и модерни статистически техники. Ще ви дам два малки откъса... два примера... от проекти, в които участваме в моята група в Оксфорд, според мен и двата са доста вълнуващи. Знаете за проекта Човешки геном. Това беше проект, насочен към разчитане на едно копие от човешкия геном. Естественото, след като си го направил... и това е този проект, Международният проект HapMap, който е сътрудничество между лаборатории в пет или шест различни страни. Мислете за проекта Човешки геном като научаване какво общо имаме, а проектът HapMap се опитва да разбере къде са разликите между различните хора.

That's a rather trivial connection between probability and genetics. There's a much deeper connection, which I don't have time to go into and that is that modern genetics is a really exciting area of science. And we'll hear some talks later in the conference specifically about that. But it turns out that unlocking the secrets in the information generated by modern experimental technologies, a key part of that has to do with fairly sophisticated -- you'll be relieved to know that I do something useful in my day job, rather more sophisticated than the head-tail-head story -- but quite sophisticated computer modelings and mathematical modelings and modern statistical techniques. And I will give you two little snippets -- two examples -- of projects we're involved in in my group in Oxford, both of which I think are rather exciting. You know about the Human Genome Project. That was a project which aimed to read one copy of the human genome. The natural thing to do after you've done that -- and that's what this project, the International HapMap Project, which is a collaboration between labs in five or six different countries. Think of the Human Genome Project as learning what we've got in common, and the HapMap Project is trying to understand where there are differences between different people.

Защо ни е грижа за това? Ами, има много причини. Най-непосредствената е, че искаме да разберем как някои различия правят някои хора податливи на една болест - диабет тип 2, например - а други различия правят хората по-податливи на сърдечни заболявания, удар, аутизъм и така нататък. Това е един голям проект. Има втори голям проект, наскоро финансиран от тръста "Уелкъм" в тази страна, включващ много големи проучвания... хиляди индивиди, с всяко от осем различни заболявания, често срещани заболявания като диабет тип 1 и 2, и коронарно сърдечно заболяване, биполярно разстройство и така нататък... в опит да се разбере генетиката. В опит да се разбере какво в генетичните различия причинява заболяванията. А защо искаме да правим това? Защото разбираме много малко за повечето човешки болести. Не знаем какво ги причинява. А ако можем да схванем основата и да разберем генетиката, ще имаме прозорец към начина, по който действа заболяването. И цял нов начин на мислене за терапии на заболявания, превантивно лечение и така нататък. Това, както казах, е малкото отклонение от основната ми любов.

Why do we care about that? Well, there are lots of reasons. The most pressing one is that we want to understand how some differences make some people susceptible to one disease -- type-2 diabetes, for example -- and other differences make people more susceptible to heart disease, or stroke, or autism and so on. That's one big project. There's a second big project, recently funded by the Wellcome Trust in this country, involving very large studies -- thousands of individuals, with each of eight different diseases, common diseases like type-1 and type-2 diabetes, and coronary heart disease, bipolar disease and so on -- to try and understand the genetics. To try and understand what it is about genetic differences that causes the diseases. Why do we want to do that? Because we understand very little about most human diseases. We don't know what causes them. And if we can get in at the bottom and understand the genetics, we'll have a window on the way the disease works, and a whole new way about thinking about disease therapies and preventative treatment and so on. So that's, as I said, the little diversion on my main love.

Да се върнем към някои по-досадни въпроси за мисленето за несигурността. Ето друга загадка за вас - да предположим, че имаме тест за болест, който не е безотказен, но е доста добър. Резултатите са точни в 99 процента от случаите. Ще направя тест на вас, или ще взема някого от улицата и ще го тествам за въпросната болест. Да предположим, че има тест за ХИВ... вирусът, който причинява СПИН... и според вируса лицето има болестта. Каква е вероятността да е така? Тестът е точен в 99 процента от случаите. Значи, естествен отговор е 99 процента. На кого му харесва този отговор? Хайде... всички трябва да се включат. Не мисля, че вече не ми вярвате. (Смях) Е, прави сте да сте малко скептични, защото това не е отговорът. Това може да си помислите. Не е отговорът, и не защото е само част от историята. Всъщност зависи от това доколко често срещана или колко рядка е болестта. Да се опитам да го илюстрирам. Ето една малка карикатура на един милион индивида. Да мислим за болестта, която засяга... доста рядка е, засяга едно лице на 10 000. Сред тези милион индивиди, повечето от тях са здрави, а някои от тях ще имат болестта. Всъщност, ако болестта е широко разпространена, около 100 ще имат болестта, а останалите не. Да предположим, че направим тестове на всички тях. Какво се случва? Е, сред стоте, които имат болестта, тестът ще даде точни резултати в 99 от случаите, и 99 ще имат позитивен тест. Сред всички тези други хора, които нямат болестта, тестът ще е верен в 99 процента от случаите. Ще бъде погрешен само в един процент от случаите. Но те са толкова много, че ще има огромен брой грешни позитивни резултати. Да го кажем по друг начин... от всички тях, които имат позитивен тест... ето ги, включените индивиди... повече от един на 100 наистина има болестта. Така че, макар и да мислим, че тестът е точен, важната част от историята е, че ни трябва друга частица информация.

Back to some of the more mundane issues of thinking about uncertainty. Here's another quiz for you -- now suppose we've got a test for a disease which isn't infallible, but it's pretty good. It gets it right 99 percent of the time. And I take one of you, or I take someone off the street, and I test them for the disease in question. Let's suppose there's a test for HIV -- the virus that causes AIDS -- and the test says the person has the disease. What's the chance that they do? The test gets it right 99 percent of the time. So a natural answer is 99 percent. Who likes that answer? Come on -- everyone's got to get involved. Don't think you don't trust me anymore. (Laughter) Well, you're right to be a bit skeptical, because that's not the answer. That's what you might think. It's not the answer, and it's not because it's only part of the story. It actually depends on how common or how rare the disease is. So let me try and illustrate that. Here's a little caricature of a million individuals. So let's think about a disease that affects -- it's pretty rare, it affects one person in 10,000. Amongst these million individuals, most of them are healthy and some of them will have the disease. And in fact, if this is the prevalence of the disease, about 100 will have the disease and the rest won't. So now suppose we test them all. What happens? Well, amongst the 100 who do have the disease, the test will get it right 99 percent of the time, and 99 will test positive. Amongst all these other people who don't have the disease, the test will get it right 99 percent of the time. It'll only get it wrong one percent of the time. But there are so many of them that there'll be an enormous number of false positives. Put that another way -- of all of them who test positive -- so here they are, the individuals involved -- less than one in 100 actually have the disease. So even though we think the test is accurate, the important part of the story is there's another bit of information we need.

Ето я ключовата интуиция. Това, което трябва да направим, щом веднъж знаем, че тестът е позитивен, е да претеглим правдоподобността, или възможността за две конкурентни обяснения. Всяко от тези обяснения има вероятна част и невероятна част. Едно обяснение е, че лицето няма болестта... това е непреодолимо вероятно, ако се избере случаен човек... но тестът е погрешен, което е невероятно. Другото обяснение е, че лицето наистина има болестта... това е невероятно... но тестът е правилен, което е вероятно. И числото, което се получава в крайна сметка... това число, което е малко по-малко от едно на сто... е свързано с това колко вероятно е едното от тези обяснения по отношение на другото. Всяко от тях, взети заедно, е невероятно.

Here's the key intuition. What we have to do, once we know the test is positive, is to weigh up the plausibility, or the likelihood, of two competing explanations. Each of those explanations has a likely bit and an unlikely bit. One explanation is that the person doesn't have the disease -- that's overwhelmingly likely, if you pick someone at random -- but the test gets it wrong, which is unlikely. The other explanation is that the person does have the disease -- that's unlikely -- but the test gets it right, which is likely. And the number we end up with -- that number which is a little bit less than one in 100 -- is to do with how likely one of those explanations is relative to the other. Each of them taken together is unlikely.

Ето един по-уместен пример за точно същото нещо. Онези от вас, които са в Британия, ще знаят за един доста прословут случай с жена на име Сали Кларк, която имала две бебета, починали внезапно. Първоначално се смятало, че са починали от това, известно неформално като "смърт в креватче", а по-официално като Синдром на внезапна детска смъртност. По различни причини, след това била обвинена в убийство. А на процеса, нейния процес, един много изтъкнат педиатър представил догазателства, че шансът от два смъртни случая в креватчето, невинни смъртни случаи, в семейство като нейното... професионалисти и непушачи... е едно на 73 милиона. Накратко, на времето била осъдена. По-късно, и доста наскоро, оправдана при обжалване... всъщност, при второ обжалване. И просто за да го поставя в контекста - може да си представите колко е ужасно за човек да изгуби едно дете, а после две, ако е невинен, да бъде осъден за убийството им. Да преживее стреса от процеса, обвинен в убийството им... и да излежава присъда в женски затвор, където всички други затворнички мислят, че си убила децата си... наистина е ужасно да ти се случи такова нещо. А се е случило до голяма степен, тъй като експертът ужасно е объркал статистиката, по два различни начина.

Here's a more topical example of exactly the same thing. Those of you in Britain will know about what's become rather a celebrated case of a woman called Sally Clark, who had two babies who died suddenly. And initially, it was thought that they died of what's known informally as "cot death," and more formally as "Sudden Infant Death Syndrome." For various reasons, she was later charged with murder. And at the trial, her trial, a very distinguished pediatrician gave evidence that the chance of two cot deaths, innocent deaths, in a family like hers -- which was professional and non-smoking -- was one in 73 million. To cut a long story short, she was convicted at the time. Later, and fairly recently, acquitted on appeal -- in fact, on the second appeal. And just to set it in context, you can imagine how awful it is for someone to have lost one child, and then two, if they're innocent, to be convicted of murdering them. To be put through the stress of the trial, convicted of murdering them -- and to spend time in a women's prison, where all the other prisoners think you killed your children -- is a really awful thing to happen to someone. And it happened in large part here because the expert got the statistics horribly wrong, in two different ways.

Откъде е взел числото едно на 73 милиона? Погледнал някакви изследвания, според които вероятността от една смърт в креватче на семейство като това на Сали Кларк е около едно на осем хиляди и половина. Затова си казал: "Ще предположа, че ако в едно семейство има една внезапна детска смърт, вероятността второ дете да умре от смърт в креватче не се е променила." Това статистиците биха нарекли независимо допускане. Все едно да кажеш: "Ако подхвърлиш монета и се падне ези първия път, това няма да засегне вероятността да се падне ези втория път." Значи, ако хвърлиш монета два пъти, вероятността да се падне ези два пъти е наполовина... това е вероятността първия път... половин път... от вероятността втория път. А той казал: "Да допуснем... ще допусна, че тези събития са независими. Като се умножи осем хиляди и половина на квадрат, се получават около 73 милиона." И никаква част от това не била заявена пред съда като допускане или представена пред съдебните заседатели по този начин. За съжаление, тук... наистина за съжаление... първо, в такава ситуация ще трябва да се удостовери емпирично. И второ, осезаемо е погрешно. Има много неща, които не знаем за внезапната детска смъртност. Спокойно може да се окаже, че има фактори в околната среда, с които не сме наясно, и е доста вероятно случаят да е такъв, че да има генетични фактори, с които не сме наясно. Затова, ако едно семейство пострада от една смърт в креватчено, те биха били поставени във високорискова група. Вероятно имат тези рискови фактори в околната среда и/или генетични рискови фактори, които не са ни известни. И тогава, да се твърди, че вероятността от втори смъртен случай е, все едно не знаеш тази информация, е наистина глупаво. По-лошо е от глупаво... извънредно лоша наука. Въпреки всичко така било представено, и на процеса никой дори не го оспорил. Това е първият проблем. Вторият проблем е - какво означава числото едно на 73 милиона? След като Сали Кларк беше осъдена... можете да си представите какъв бум предизвика това в пресата... един от журналистите от един от по-почтените вестници в Британия писа, че казаното от експертите е било: "Вероятността тя да е невинна е бил едно на 73 милиона." Това е логическа грешка. Точно същата логическа грешка, като логическата грешка да се мисли, че след теста за болестта, който е с точност 99 процента, вероятността да имаш болестта е 99 процента. В примера с болестта трябва да имам епредвид две неща, едното от които е възможността тестът да е правилен, или не. А другото е вероятността, априори, лицето да има болестта, или не. Точно същото е в този контекст. Включени са две неща... обяснението има две неща. Искаме да разберем колко вероятни, или относително колко вероятни, са две различни обяснения. Едното от тях е, че Сали Кларк е била невинна... което е, априори, поразително вероятно... повечето майки не убиват децата си. А втората част от обяснението е, че тя е пострадала от изключително невероятно събитие. Не чак толкова невероятно като едно на 73 милиона, но въпреки това доста невероятно. Другото обяснение е, че е била виновна. Вероятно мислим априори, че това е невероятно. И сигурно трябва да мислим в контекста на един криминален процес, че това е невероятно, заради презумпцията за невинност. И тогава, ако се е опитвала да убие децата, е успяла. Така че вероятността да е невинна не е едно на 73 милиона. Не знаем каква е. Свързана е с претегляне силата на другите доказателства срещу нея и статистическите доказателства. Знаем, че децата са починали. Важното е колко вероятни или невероятни, едно спрямо друго са двете обяснения. И двете са неприемливи. Ето една ситуация, когато грешки в статистиката са имали много дълбоки и наистина злочести последици. Всъщност има две други жени, осъдени въз основа на доказателствата на този педиатър, впоследствие освободени при обжалване. Много случаи били преразгледани. И е особено актуално, защото той понастоящем е обвинен в дискредитиране пред Британския генерален медицински съвет.

So where did he get the one in 73 million number? He looked at some research, which said the chance of one cot death in a family like Sally Clark's is about one in 8,500. So he said, "I'll assume that if you have one cot death in a family, the chance of a second child dying from cot death aren't changed." So that's what statisticians would call an assumption of independence. It's like saying, "If you toss a coin and get a head the first time, that won't affect the chance of getting a head the second time." So if you toss a coin twice, the chance of getting a head twice are a half -- that's the chance the first time -- times a half -- the chance a second time. So he said, "Here, I'll assume that these events are independent. When you multiply 8,500 together twice, you get about 73 million." And none of this was stated to the court as an assumption or presented to the jury that way. Unfortunately here -- and, really, regrettably -- first of all, in a situation like this you'd have to verify it empirically. And secondly, it's palpably false. There are lots and lots of things that we don't know about sudden infant deaths. It might well be that there are environmental factors that we're not aware of, and it's pretty likely to be the case that there are genetic factors we're not aware of. So if a family suffers from one cot death, you'd put them in a high-risk group. They've probably got these environmental risk factors and/or genetic risk factors we don't know about. And to argue, then, that the chance of a second death is as if you didn't know that information is really silly. It's worse than silly -- it's really bad science. Nonetheless, that's how it was presented, and at trial nobody even argued it. That's the first problem. The second problem is, what does the number of one in 73 million mean? So after Sally Clark was convicted -- you can imagine, it made rather a splash in the press -- one of the journalists from one of Britain's more reputable newspapers wrote that what the expert had said was, "The chance that she was innocent was one in 73 million." Now, that's a logical error. It's exactly the same logical error as the logical error of thinking that after the disease test, which is 99 percent accurate, the chance of having the disease is 99 percent. In the disease example, we had to bear in mind two things, one of which was the possibility that the test got it right or not. And the other one was the chance, a priori, that the person had the disease or not. It's exactly the same in this context. There are two things involved -- two parts to the explanation. We want to know how likely, or relatively how likely, two different explanations are. One of them is that Sally Clark was innocent -- which is, a priori, overwhelmingly likely -- most mothers don't kill their children. And the second part of the explanation is that she suffered an incredibly unlikely event. Not as unlikely as one in 73 million, but nonetheless rather unlikely. The other explanation is that she was guilty. Now, we probably think a priori that's unlikely. And we certainly should think in the context of a criminal trial that that's unlikely, because of the presumption of innocence. And then if she were trying to kill the children, she succeeded. So the chance that she's innocent isn't one in 73 million. We don't know what it is. It has to do with weighing up the strength of the other evidence against her and the statistical evidence. We know the children died. What matters is how likely or unlikely, relative to each other, the two explanations are. And they're both implausible. There's a situation where errors in statistics had really profound and really unfortunate consequences. In fact, there are two other women who were convicted on the basis of the evidence of this pediatrician, who have subsequently been released on appeal. Many cases were reviewed. And it's particularly topical because he's currently facing a disrepute charge at Britain's General Medical Council.

И така, в заключение... какви послания остават от това? Знаем, че произволността, несигурността и вероятността до голяма степен са част от ежедневния ни живот. Вярно е също... и макар че вие, като цяло, сте много специални в известни отношения, сте напълно типични в това, че не разбирате правилно примерите, които дадох. Много добре е документирано, че хората разбират нещата погрешно. Правят логически грешки при разсъждения с несигурност. Можем да се справяме блестящо с неуловимостите на езика... и има интересни еволюционни въпроси как сме стигнали дотам. Не сме добри при разсъждения с несигурност. Това е проблем в ежедневния ни живот. Както сте чули от много от разговорите, статистиката подкрепя огромна част от изследванията в науката - в социологията, в медицината, както и всъщност в доста голяма част от индустрията. Целият качествен контрол, който е имал огромен ефект върху индустриалното производство, е подкрепен от статистика. Нещо, с което се справяме зле. Най-малкото трябва да признаем това, а ние сме склонни да не го признаваме. За да се върнем към законовия контекст, на процеса на Сали Кларк всички адвокати просто приели казаното от експерта. Ако един педиатър беше дошъл и бе заявил пред съдебните заседатели: "Знам как се строят мостове. Построил съм един надолу по пътя. Моля ви, минете с колата оттам на път за вкъщи", те биха казали: "Ама педиатрите не знаят как да строят мостове. Това е работа на инженерите." От друга страна, той излязъл и казал, или загатнал: "Знам как да разсъждавам с несигурност. Знам как се прави статистика." И всички отвърнали: "Ами, добре. Той е експерт." Затова трябва да разберем къде е компетентността ни и къде я няма. Точно същият вид въпроси възникваха в ранните дни на ДНК профилирането, когато учени, адвокати и в някои случаи съдии, рутинно представяха погрешно доказателства. Обикновено... човек се надява... невинно, но погрешно представени доказателства. Според съдебни учени: "Вероятността този човек да е невинен е едно на три милиона. Дори ако вярвате в числото, както и в 73 милиона към едно, не това означава то. Заради това е имало прочути случаи с обжалване в Британия и другаде.

So just to conclude -- what are the take-home messages from this? Well, we know that randomness and uncertainty and chance are very much a part of our everyday life. It's also true -- and, although, you, as a collective, are very special in many ways, you're completely typical in not getting the examples I gave right. It's very well documented that people get things wrong. They make errors of logic in reasoning with uncertainty. We can cope with the subtleties of language brilliantly -- and there are interesting evolutionary questions about how we got here. We are not good at reasoning with uncertainty. That's an issue in our everyday lives. As you've heard from many of the talks, statistics underpins an enormous amount of research in science -- in social science, in medicine and indeed, quite a lot of industry. All of quality control, which has had a major impact on industrial processing, is underpinned by statistics. It's something we're bad at doing. At the very least, we should recognize that, and we tend not to. To go back to the legal context, at the Sally Clark trial all of the lawyers just accepted what the expert said. So if a pediatrician had come out and said to a jury, "I know how to build bridges. I've built one down the road. Please drive your car home over it," they would have said, "Well, pediatricians don't know how to build bridges. That's what engineers do." On the other hand, he came out and effectively said, or implied, "I know how to reason with uncertainty. I know how to do statistics." And everyone said, "Well, that's fine. He's an expert." So we need to understand where our competence is and isn't. Exactly the same kinds of issues arose in the early days of DNA profiling, when scientists, and lawyers and in some cases judges, routinely misrepresented evidence. Usually -- one hopes -- innocently, but misrepresented evidence. Forensic scientists said, "The chance that this guy's innocent is one in three million." Even if you believe the number, just like the 73 million to one, that's not what it meant. And there have been celebrated appeal cases in Britain and elsewhere because of that.

И, просто за да завършим в контекста на законовата система Много е добре да се казва: "Да направим всичко възможно, за да представим доказателствата". Но все повече и повече, в случаи на ДНК профилиране... още едно... очакваме съдебните заседатели, които са обикновени хора... и е документирано, че се справят много зле с това... очакваме съдебните заседатели да успяват да се справят с типа разсъждения, които се случват. В други сфери от живота, ако хората спорят... е, освен вероятно за политиците. Но в други сфери от живота, ако хората спорят нелогично, бихме казали, че това не е добре. Някак си го очакваме от политиците и не се надяваме на много повече. В случай на несигурност, объркваме се постоянно... и най-малкото, трябва да сме наясно с това. А в идеалния случай, може да опитаме да направим нещо по въпроса. Много благодаря.

And just to finish in the context of the legal system. It's all very well to say, "Let's do our best to present the evidence." But more and more, in cases of DNA profiling -- this is another one -- we expect juries, who are ordinary people -- and it's documented they're very bad at this -- we expect juries to be able to cope with the sorts of reasoning that goes on. In other spheres of life, if people argued -- well, except possibly for politics -- but in other spheres of life, if people argued illogically, we'd say that's not a good thing. We sort of expect it of politicians and don't hope for much more. In the case of uncertainty, we get it wrong all the time -- and at the very least, we should be aware of that, and ideally, we might try and do something about it. Thanks very much.

Peter Donnelly: How juries are fooled by statistics

Peter Donnelly: How juries are fooled by statistics

Related talks

Hans Rosling: The best stats you've ever seen

Michael Shermer: Why people believe weird things

Emily Oster: Flip your thinking on AIDS in Africa

Robert Full: Learning from the gecko's tail

Aubrey de Grey: A roadmap to end aging

E.O. Wilson: Advice to a young scientist

Related talks

Hans Rosling: The best stats you've ever seen

Michael Shermer: Why people believe weird things

Emily Oster: Flip your thinking on AIDS in Africa

Robert Full: Learning from the gecko's tail

Aubrey de Grey: A roadmap to end aging

E.O. Wilson: Advice to a young scientist