So you go to the doctor and get some tests. The doctor determines that you have high cholesterol and you would benefit from medication to treat it. So you get a pillbox. You have some confidence, your physician has some confidence that this is going to work. The company that invented it did a lot of studies, submitted it to the FDA. They studied it very carefully, skeptically, they approved it. They have a rough idea of how it works, they have a rough idea of what the side effects are. It should be OK. You have a little more of a conversation with your physician and the physician is a little worried because you've been blue, haven't felt like yourself, you haven't been able to enjoy things in life quite as much as you usually do. Your physician says, "You know, I think you have some depression. I'm going to have to give you another pill."
Du går till läkaren och det tas några prover. Läkaren fastställer att du har högt kolesterol och att ett läkemedel skulle få dig att må bättre. Så du får en tablettask. Du tror, din läkare tror att det här kommer fungera. Företaget bakom läkemedlet utförde en massa studier, som FDA (läkemedelsinspektionen i USA) granskade och godkände. Man vet ungefär hur läkemedlet fungerar, man känner till biverkningarna ganska bra. Det borde vara okej. Du fortsätter tala med läkaren och läkaren är lite oroad över att du har varit nedstämd, inte känt dig som du brukar och du har inte kunnat njuta av saker på samma sätt som tidigare. Din läkare säger, "Vet du, jag tror att du lider av depression. Jag ska skriva ut ännu en tablett till dig."
So now we're talking about two medications. This pill also -- millions of people have taken it, the company did studies, the FDA looked at it -- all good. Think things should go OK. Think things should go OK. Well, wait a minute. How much have we studied these two together?
Så nu är det fråga om två läkemedel. Även den här tabletten - miljontals människor har tagit den, företaget har gjort studier, FDA har kontrollerat - bra. Det borde inte vara några problem. Det borde inte vara några problem. Men vänta lite. Hur mycket har man studerat de här två tillsammans?
Well, it's very hard to do that. In fact, it's not traditionally done. We totally depend on what we call "post-marketing surveillance," after the drugs hit the market. How can we figure out if bad things are happening between two medications? Three? Five? Seven? Ask your favorite person who has several diagnoses how many medications they're on.
Det är väldigt svårt att göra det. Faktum är, det brukar inte göras. Vi måste helt och hållet lita på "post marketing surveillance", efter att läkemedlen har börjat säljas. Hur ska vi få reda på om det händer dåliga saker mellan två läkemedel? Mellan tre? Fem? Sju? Fråga en person som du känner med flera diagnoser hur många mediciner de tar.
Why do I care about this problem? I care about it deeply. I'm an informatics and data science guy and really, in my opinion, the only hope -- only hope -- to understand these interactions is to leverage lots of different sources of data in order to figure out when drugs can be used together safely and when it's not so safe.
Varför bryr jag mig om det här? Jag bryr mig oerhört. Min grej är IT och datavetenskap och enligt mig så är enda sättet - enda sättet - vi kan förstå dessa interaktioner genom att använda massor av data från olika håll för att ta reda på när läkemedel är säkra att användas samtidigt och när det inte är så säkert.
So let me tell you a data science story. And it begins with my student Nick. Let's call him "Nick," because that's his name.
Nu ska ni få höra en historia. Det börjar med min elev Nick. Vi kan kalla honom "Nick" för det är så han heter.
(Laughter)
(Skratt)
Nick was a young student. I said, "You know, Nick, we have to understand how drugs work and how they work together and how they work separately, and we don't have a great understanding. But the FDA has made available an amazing database. It's a database of adverse events. They literally put on the web -- publicly available, you could all download it right now -- hundreds of thousands of adverse event reports from patients, doctors, companies, pharmacists. And these reports are pretty simple: it has all the diseases that the patient has, all the drugs that they're on, and all the adverse events, or side effects, that they experience. It is not all of the adverse events that are occurring in America today, but it's hundreds and hundreds of thousands of drugs.
Nick var ung och ny. Jag sa, "Vet du, Nick, vi behöver förstå hur läkemedel fungerar, hur de fungerar tillsammans och hur de fungerar enskilt, för i nuläget vet vi inte." Men FDA har offentliggjort en fantastisk databas. Det är en databas över biverkningar. De lägger upp på internet - allmänt tillgängligt, ni kan alla ladda ner det nu - hundratusentals rapporter om biverkningar från patienter, läkare, företag, farmaceuter. Och rapporterna är ganska simpla: där står alla sjukdomar som patienten har, alla mediciner som de tar och alla biverkningar som de upplever. Det är inte alla biverkningar som sker i USA idag, men det är hundratusentals mediciner.
So I said to Nick, "Let's think about glucose. Glucose is very important, and we know it's involved with diabetes. Let's see if we can understand glucose response. I sent Nick off. Nick came back.
Så jag sa till Nick, "Om vi tänker på glukos. Glukos är viktigt och vi vet att det har koppling till diabetes. Tänk om vi skulle försöka förstå glukosresponsen." Jag skickade iväg Nick. Han kom tillbaka.
"Russ," he said, "I've created a classifier that can look at the side effects of a drug based on looking at this database, and can tell you whether that drug is likely to change glucose or not."
"Russ", sa han, "Jag har gjort en klassificerare som kan hitta biverkningarna av en medicin baserat på den här databasen och berätta om den medicinen sannolikt ändrar glukosnivåer eller inte gör det."
He did it. It was very simple, in a way. He took all the drugs that were known to change glucose and a bunch of drugs that don't change glucose, and said, "What's the difference in their side effects? Differences in fatigue? In appetite? In urination habits?" All those things conspired to give him a really good predictor. He said, "Russ, I can predict with 93 percent accuracy when a drug will change glucose."
Han gjorde det. Det var väldigt enkelt. Han tog alla mediciner som är kända glukospåverkare och en massa mediciner som inte påverkar glukos och frågade sig, "Vad är skillnaden i biverkningarna? Skillnader i trötthet? Aptit? Urinering?" All den här informationen gav honom en bra förutsägare. Han sa , "Russ, jag kan förutspå med 93 % sannolikhet när en medicin påverkar glukos."
I said, "Nick, that's great." He's a young student, you have to build his confidence. "But Nick, there's a problem. It's that every physician in the world knows all the drugs that change glucose, because it's core to our practice. So it's great, good job, but not really that interesting, definitely not publishable."
Jag sa, "Nick, det är toppen" Han är en ung studerande, han behöver få självförtroende. "Nick, det finns ett problem. Alla läkare känner till vilka mediciner som påverkar glukoshalten, för det måste vi känna till. Så, jättebra jobbat, men inte så intressant, definitivt inte publicerbart."
(Laughter)
(Skratt)
He said, "I know, Russ. I thought you might say that." Nick is smart. "I thought you might say that, so I did one other experiment. I looked at people in this database who were on two drugs, and I looked for signals similar, glucose-changing signals, for people taking two drugs, where each drug alone did not change glucose, but together I saw a strong signal."
Han sa, "Jag vet, Russ. Jag gissade det." Nick är smart. "Jag gissade det, så jag gjorde ett annat experiment. Jag kollade på personer i databasen som tog två mediciner och sökte efter liknande signaler på glukosförändring, hos personer som tar två mediciner men där medicinerna var för sig inte ändrar glukoshalten, men gav starka signaler när de användes samtidigt."
And I said, "Oh! You're clever. Good idea. Show me the list." And there's a bunch of drugs, not very exciting. But what caught my eye was, on the list there were two drugs: paroxetine, or Paxil, an antidepressant; and pravastatin, or Pravachol, a cholesterol medication.
Jag sa, "Smart! Bra idé. Visa mig listan." Det är en massa mediciner, inte så intressant. Men det som fångade mitt intresse var ett par mediciner: paroxetin, eller Seroxat, antidepressiv; och pravastatin, eller Pravachol, en kolesterolmedicin.
And I said, "Huh. There are millions of Americans on those two drugs." In fact, we learned later, 15 million Americans on paroxetine at the time, 15 million on pravastatin, and a million, we estimated, on both. So that's a million people who might be having some problems with their glucose if this machine-learning mumbo jumbo that he did in the FDA database actually holds up. But I said, "It's still not publishable, because I love what you did with the mumbo jumbo, with the machine learning, but it's not really standard-of-proof evidence that we have." So we have to do something else. Let's go into the Stanford electronic medical record. We have a copy of it that's OK for research, we removed identifying information. And I said, "Let's see if people on these two drugs have problems with their glucose."
Jag sa, "Oj. Det finns miljontals amerikaner som tar båda medicinerna." Vi fick senare reda på, att då använde 15 miljoner amerikaner paroxetin och 15 miljoner pravastatin och vi uppskattade att en miljon använde bägge. En miljon människor som kanske har problem med glukosnivåerna om det här maskininlärningssvamlet som han gjorde i FDA-databasen faktiskt stämmer. Jag sa, "Vi kan inte publicera ännu, för jag gillar det du gjorde med allt svammel, med maskininlärning, men det är inte riktigt vattentäta bevis som vi har." Vi måste göra mer. Vi går in på Stanfords elektroniska medicinska arkiv. Vi har en kopia som kan användas i forskning, identitetsinformationen är utsuddad. Jag sa, "Vi ska se om de som tar båda medicinerna har problem med glukosnivåerna."
Now there are thousands and thousands of people in the Stanford medical records that take paroxetine and pravastatin. But we needed special patients. We needed patients who were on one of them and had a glucose measurement, then got the second one and had another glucose measurement, all within a reasonable period of time -- something like two months. And when we did that, we found 10 patients. However, eight out of the 10 had a bump in their glucose when they got the second P -- we call this P and P -- when they got the second P. Either one could be first, the second one comes up, glucose went up 20 milligrams per deciliter. Just as a reminder, you walk around normally, if you're not diabetic, with a glucose of around 90. And if it gets up to 120, 125, your doctor begins to think about a potential diagnosis of diabetes. So a 20 bump -- pretty significant.
Det finns tusentals personer i Stanfords medicinska arkiv som tar paroxetin och pravastatin. Men vi sökte en viss typ av patient. Vi sökte patienter som gick på en av dem och var med om en glukosmätning, sedan fick den andra och var med om en annan glukosmätning, allt inom en rimlig tid - ungefär två månader. Vi hittade 10 patienter. 8 av 10 fick en ökning av glukoshalten när de fick sitt andra P - vi kallar det P och P - när de fick sitt andra P. Någondera kommer först, sedan kommer den andra, glukoshalten stiger 20 milligram per deciliter. Som en påminnelse, du har vanligtvis, om du inte är diabetiker, ett glukos på ungefär 90. Om det stiger till 120, 125, då börjar din läkare överväga en diabetesdiagnos. Så en ökning på 20 - ganska betydande.
I said, "Nick, this is very cool. But, I'm sorry, we still don't have a paper, because this is 10 patients and -- give me a break -- it's not enough patients."
Jag sa, "Nick, det här är häftigt. Men tyvärr har vi inte en artikel ännu, för det här är 10 patienter, och kom igen, det är inte tillräckligt."
So we said, what can we do? And we said, let's call our friends at Harvard and Vanderbilt, who also -- Harvard in Boston, Vanderbilt in Nashville, who also have electronic medical records similar to ours. Let's see if they can find similar patients with the one P, the other P, the glucose measurements in that range that we need.
Så vad skulle vi göra? Vi ringde våra vänner vid Harvard och Vanderbilt, som också - Harvard i Boston, Vanderbilt i Nashville, som liksom vi har elektroniska medicinska arkiv. Kanske de kan hitta liknande patienter med ett P, sedan ett annat P, glukosmätningarna i den skala vi behöver.
God bless them, Vanderbilt in one week found 40 such patients, same trend. Harvard found 100 patients, same trend. So at the end, we had 150 patients from three diverse medical centers that were telling us that patients getting these two drugs were having their glucose bump somewhat significantly.
Tack och lov, Vanderbilt hittade 40 patienter på en vecka, samma tendens. Harvard hittade 100 patienter, samma trend. Så till slut hade vi 150 patienter från tre olika sjukhus som visade att patienter med dessa två mediciner får en signifikant ökning av glukoshalten.
More interestingly, we had left out diabetics, because diabetics already have messed up glucose. When we looked at the glucose of diabetics, it was going up 60 milligrams per deciliter, not just 20. This was a big deal, and we said, "We've got to publish this." We submitted the paper. It was all data evidence, data from the FDA, data from Stanford, data from Vanderbilt, data from Harvard. We had not done a single real experiment.
Dessutom hade vi utelämnat diabetiker, för de har redan instabila glukoshalter. När vi tittade på glukoshalterna hos diabetiker, så var det en ökning på 60 mg/dl, inte bara 20. Det var en viktig upptäckt och vi tänkte, "Vi måste publicera det här." Vi skickade in artikeln. Den bestod enbart av bevis i form av data, data från FDA, data från Stanford, data från Vanderbilt, data från Harvard. Vi hade inte utfört ett enda riktigt experiment,
But we were nervous. So Nick, while the paper was in review, went to the lab. We found somebody who knew about lab stuff. I don't do that. I take care of patients, but I don't do pipettes. They taught us how to feed mice drugs. We took mice and we gave them one P, paroxetine. We gave some other mice pravastatin. And we gave a third group of mice both of them. And lo and behold, glucose went up 20 to 60 milligrams per deciliter in the mice.
Men vi var nervösa. Medan artikeln granskades gick Nick till labbet. Vi hittade någon som kunde labbgrejer. Jag gör inte sånt. Jag tar hand om patienter, men har inga pipetter. De lärde oss hur man ger mediciner till möss. Vi tog några möss och gav dem ett P, paroxetin. Till några andra möss gav vi pravastatin. Och den tredje gruppen fick båda medicinerna. Och hör och häpna, glukoshalten gick från 20 till 60 mg/dl hos mössen.
So the paper was accepted based on the informatics evidence alone, but we added a little note at the end, saying, oh by the way, if you give these to mice, it goes up.
Så artikeln godkändes baserat enbart på bevis i form av data, men vi lade till en slutnot, där det stod att möss får högre glukoshalt om de tar dem.
That was great, and the story could have ended there. But I still have six and a half minutes.
Det var härligt och här skulle historien kunna sluta. Men jag har sex och en halv minut kvar.
(Laughter)
(Skratt)
So we were sitting around thinking about all of this, and I don't remember who thought of it, but somebody said, "I wonder if patients who are taking these two drugs are noticing side effects of hyperglycemia. They could and they should. How would we ever determine that?"
Vi satt och pratade om det här och jag minns inte vem det var, men någon sa, "Jag undrar om patienter som tar de här två medicinerna har symptom på hyperglykemi. Det borde de ha. Hur ska vi någonsin få reda på det?"
We said, well, what do you do? You're taking a medication, one new medication or two, and you get a funny feeling. What do you do? You go to Google and type in the two drugs you're taking or the one drug you're taking, and you type in "side effects." What are you experiencing? So we said OK, let's ask Google if they will share their search logs with us, so that we can look at the search logs and see if patients are doing these kinds of searches. Google, I am sorry to say, denied our request. So I was bummed. I was at a dinner with a colleague who works at Microsoft Research and I said, "We wanted to do this study, Google said no, it's kind of a bummer." He said, "Well, we have the Bing searches."
Vi tänkte, vad gör man? Man tar en medicin, en ny medicin eller två och man börjar må underligt. Vad gör man då? Man går till Google och man skriver in medicinerna man tar och man skriver "biverkningar". Vad upplever du? Så vi tänkte att, vi frågar Google om de vill dela sin sökhistorik med oss, så att vi kan titta på sökhistoriken och se om patienter gör sådana här sökningar. Google tackade nej, tyvärr. Jag var besviken. Jag var på middag med en kollega från Microsoft Research jag sa, "Vi ville göra den här studien, Google sa nej, det var trist." Han sa, "Vi har sökmotorn Bing."
(Laughter)
(Skratt)
Yeah. That's great. Now I felt like I was --
Jepp. Det är härligt. Nu kändes det som att -
(Laughter)
(Skratt)
I felt like I was talking to Nick again. He works for one of the largest companies in the world, and I'm already trying to make him feel better. But he said, "No, Russ -- you might not understand. We not only have Bing searches, but if you use Internet Explorer to do searches at Google, Yahoo, Bing, any ... Then, for 18 months, we keep that data for research purposes only." I said, "Now you're talking!" This was Eric Horvitz, my friend at Microsoft.
som att prata med Nick igen. Han jobbar för en av de största företagen i världen och jag försöker trösta honom. Men han sa, "Russ - du förstår inte. Vi har inte bara bingsökningar, men om man använder Internet Explorer för att göra googlesökningar, Yahoo, Bing, vad som helst... Vi sparar informationen i 18 månader i forskningssyfte." Jag sa, "Nu är vi inne på något!" Det var Eric Horvitz, min vän på Microsoft.
So we did a study where we defined 50 words that a regular person might type in if they're having hyperglycemia, like "fatigue," "loss of appetite," "urinating a lot," "peeing a lot" -- forgive me, but that's one of the things you might type in. So we had 50 phrases that we called the "diabetes words." And we did first a baseline. And it turns out that about .5 to one percent of all searches on the Internet involve one of those words. So that's our baseline rate. If people type in "paroxetine" or "Paxil" -- those are synonyms -- and one of those words, the rate goes up to about two percent of diabetes-type words, if you already know that there's that "paroxetine" word. If it's "pravastatin," the rate goes up to about three percent from the baseline. If both "paroxetine" and "pravastatin" are present in the query, it goes up to 10 percent, a huge three- to four-fold increase in those searches with the two drugs that we were interested in, and diabetes-type words or hyperglycemia-type words.
Så vi gjorde en studie där vi definierade 50 ord som en vanlig person skulle skriva om de har hyperglykemi, som "trötthet", "tappat aptiten", "urinerar ofta", "kissar ofta" - ursäkta, men det är en sak som man kanske skriver. Så vi hade 50 fraser som vi kallade "diabetesord". Och först gjorde vi en måttstock. Det visar sig att ungefär en halv till en procent av alla sökningar på internet innehåller någon av de fraserna. Så det är vår måttstock. Om folk skriver "paroxetin" eller "Seroxat" - det är samma sak - och en av de fraserna, så är andelen diabetesord två procent, om man redan vet att det finns ett ord för paroxetin. Om det är "pravastatin", så är andelen tre procent. Om både "paroxetin" och "pravastatin" finns med i frågan, så går det upp till 10 procent, en enorm tre- till fyrfaldig ökning i sökningarna med de två mediciner som vi undersökte och diabetesord eller hyperglykemiord.
We published this, and it got some attention. The reason it deserves attention is that patients are telling us their side effects indirectly through their searches. We brought this to the attention of the FDA. They were interested. They have set up social media surveillance programs to collaborate with Microsoft, which had a nice infrastructure for doing this, and others, to look at Twitter feeds, to look at Facebook feeds, to look at search logs, to try to see early signs that drugs, either individually or together, are causing problems.
Vi publicerade detta, det fick en del uppmärksamhet. Det förtjänar uppmärksamet därför att patienterna berättar om sina biverkningar indirekt genom sina sökningar. Vi uppmärksammade FDA på detta. De var intresserade. De har satt igång övervakningsprogram i sociala medier i samarbete med Microsoft, som hade en lämplig infrastruktur, och andra, man kollar twitterflöden, man kollar på facebookflöden, sökmotorhistorik, för att hitta tidiga tecken på mediciner, som enskilt eller tillsammans, skapar problem.
What do I take from this? Why tell this story? Well, first of all, we have now the promise of big data and medium-sized data to help us understand drug interactions and really, fundamentally, drug actions. How do drugs work? This will create and has created a new ecosystem for understanding how drugs work and to optimize their use. Nick went on; he's a professor at Columbia now. He did this in his PhD for hundreds of pairs of drugs. He found several very important interactions, and so we replicated this and we showed that this is a way that really works for finding drug-drug interactions.
Varför berättar jag det här? För det första, så är det nu möjligt att med hjälp av "big data" och medelstora data att förstå interaktioner mellan mediciner och medicinernas verkan. Hur fungerar mediciner? Det här har skapat ett nytt ekosystem för att förstå medicinernas verkan och optimera användningen av dem. Nick fortsatte; han är professor vid Columbia nu. I sin doktorsavhandling gjorde han samma sak med hundratals mediciner. Han hittade flera viktiga interaktioner, så vi upprepade det här och vi visade att det här är ett fungerande sätt när man vill hitta interaktioner mellan mediciner.
However, there's a couple of things. We don't just use pairs of drugs at a time. As I said before, there are patients on three, five, seven, nine drugs. Have they been studied with respect to their nine-way interaction? Yes, we can do pair-wise, A and B, A and C, A and D, but what about A, B, C, D, E, F, G all together, being taken by the same patient, perhaps interacting with each other in ways that either makes them more effective or less effective or causes side effects that are unexpected? We really have no idea. It's a blue sky, open field for us to use data to try to understand the interaction of drugs.
Men det är inte allt. Vi använder inte bara två mediciner åt gången. Det finns patienter som tar tre, fem, sju, nio mediciner. Har de studerats med tanke på den niofaldiga interaktionen? Vi kan göra det parvis, A och B, A och C, A och D, men hur blir det om A, B, C, D, E, F, G, alla tillsammans, tas av samma patient och kanske interagerar sinsemellan så att de förstärker eller försvagar varandra, eller ger oväntade biverkningar? Vi har ingen aning. Det är outforskat område, att använda data för att ta reda på interaktioner mellan mediciner.
Two more lessons: I want you to think about the power that we were able to generate with the data from people who had volunteered their adverse reactions through their pharmacists, through themselves, through their doctors, the people who allowed the databases at Stanford, Harvard, Vanderbilt, to be used for research. People are worried about data. They're worried about their privacy and security -- they should be. We need secure systems. But we can't have a system that closes that data off, because it is too rich of a source of inspiration, innovation and discovery for new things in medicine.
Två saker till: Jag vill att ni tänker på hur mycket vi kunde få fram ur data från människor som frivilligt rapporterade sina biverkningar genom sina farmaceuter, av sig själva, genom sina läkare, personerna som lät sin information vid Stanford, Harvard, Vanderbilt, användas i forskningssyfte. Folk oroar sig för data. De oroar sig över integritet och säkerhet - med rätta. Vi behöver säkra system. Men vi kan inte ha system som stänger ut den typen av data, för det är en så rik källa till inspiration, innovation och upptäckt av nya saker inom medicinen.
And the final thing I want to say is, in this case we found two drugs and it was a little bit of a sad story. The two drugs actually caused problems. They increased glucose. They could throw somebody into diabetes who would otherwise not be in diabetes, and so you would want to use the two drugs very carefully together, perhaps not together, make different choices when you're prescribing. But there was another possibility. We could have found two drugs or three drugs that were interacting in a beneficial way. We could have found new effects of drugs that neither of them has alone, but together, instead of causing a side effect, they could be a new and novel treatment for diseases that don't have treatments or where the treatments are not effective. If we think about drug treatment today, all the major breakthroughs -- for HIV, for tuberculosis, for depression, for diabetes -- it's always a cocktail of drugs.
Och till sist vill jag säga, i det här fallet hittade vi två mediciner och det var ganska sorgligt. De två medicinerna skapade problem. De ökade glukoshalten. De kunde ge någon diabetes som inte skulle ha haft diabetes annars, så man bör använda de två medicinerna med försiktighet, kanske inte tillsammans, göra andra val när man skriver ut mediciner. Men det finns en annan möjlighet. Vi skulle ha kunnat hitta två eller tre mediciner som interagerar på ett gynnsamt sätt. Vi skulle ha kunnat hitta nya effekter av mediciner som de inte har var för sig, men tillsammans, i stället för biverkningar, kan de skapa en ny behandlingsform för sjukdomar som saknar behandling eller där behandlingarna är ineffektiva. Om vi tänker på läkemedelsbehandling idag, alla stora genombrott - för HIV, för tuberkulos, för depression, för diabetes - det är alltid en kombination av mediciner.
And so the upside here, and the subject for a different TED Talk on a different day, is how can we use the same data sources to find good effects of drugs in combination that will provide us new treatments, new insights into how drugs work and enable us to take care of our patients even better?
Så fördelen här - och det är ämnet för ett annat TED Talk en annan dag - är att vi kan använda samma datakällor för att hitta goda effekter av medicinkombinationer som kan ge oss nya behandlingar, nya insikter i hur mediciner fungerar och hjälpa oss att ta hand om våra patienter ännu bättre?
Thank you very much.
Tack så mycket.
(Applause)
(Applåder)