Посещавате лекаря си и правите изследвания. Докторът определя, че имате висок холестерол и бихте имали полза от лекарство, което да го понижи. Затова ви предписват лекарство. Имате известна увереност, а също и лекарят ви, че това ще проработи. Компанията производител е провела много изследвания, предала го е на FDA. Изследвали са го много внимателно, скептично, преди да го одобрят. Имат известна представа как действа, имат груба идея какви са страничните ефекти. Би трябвало всичко да е наред. Говорите още малко и лекарят е малко разтревожен, защото напоследък сте тъжни, не сте на себе си, не се наслаждавате на нещата от живота, както обикновено. Лекарят ви казва, "Знаете ли, мисля, че имате депресия. Ще трябва да ви предпиша още едно лекарство."
So you go to the doctor and get some tests. The doctor determines that you have high cholesterol and you would benefit from medication to treat it. So you get a pillbox. You have some confidence, your physician has some confidence that this is going to work. The company that invented it did a lot of studies, submitted it to the FDA. They studied it very carefully, skeptically, they approved it. They have a rough idea of how it works, they have a rough idea of what the side effects are. It should be OK. You have a little more of a conversation with your physician and the physician is a little worried because you've been blue, haven't felt like yourself, you haven't been able to enjoy things in life quite as much as you usually do. Your physician says, "You know, I think you have some depression. I'm going to have to give you another pill."
Така че сега говорим за две лекарства. Милиони хора взимат и това лекарство, компанията е провела изследвания, FDA го е тествала - всичко е наред. Мисля, че всичко ще е наред. Мисля, че всичко ще е наред. Един момент моля. До колко сме изучили двете лекарства заедно?
So now we're talking about two medications. This pill also -- millions of people have taken it, the company did studies, the FDA looked at it -- all good. Think things should go OK. Think things should go OK. Well, wait a minute. How much have we studied these two together?
Това е много трудно. Всъщност не се прави обикновено. Напълно зависим от така наречения "след пазарен надзор," след като лекарствата са на пазара. Как можем да разберем дали има проблеми между две лекарства? Между три? Пет? Седем? Попитайте любимия си човек с няколко диагнози колко лекарства взима.
Well, it's very hard to do that. In fact, it's not traditionally done. We totally depend on what we call "post-marketing surveillance," after the drugs hit the market. How can we figure out if bad things are happening between two medications? Three? Five? Seven? Ask your favorite person who has several diagnoses how many medications they're on.
Защо се интересувам от този проблем? Интересувам се много. Аз съм информатик и наистина, според мен единственият шанс да разберем тези взаимодействия е да използваме множество източници на данни, за да разберем кога лекарствата могат да се използват заедно безопасно и кога това не е толкова безопасно.
Why do I care about this problem? I care about it deeply. I'm an informatics and data science guy and really, in my opinion, the only hope -- only hope -- to understand these interactions is to leverage lots of different sources of data in order to figure out when drugs can be used together safely and when it's not so safe.
Нека ви разкажа една история за информатика. Тя започва с аспиранта ми Ник. Нека го наречем "Ник," защото се казва така.
So let me tell you a data science story. And it begins with my student Nick. Let's call him "Nick," because that's his name.
(Смях)
(Laughter)
Ник беше млад аспирант. Казах му, "Ник, трябва да разберем как действат лекарствата: как действат заедно и поотделно, защото нямаме добра яснота. Но FDA са предоставили невероятна база данни. Тя съдържа странични ефекти. Буквално публикуват в Интернет -- публично достъпни, можете да ги свалите сега -- стотици хиляди доклади на неблагоприятни събития от пациенти, доктори, компании, фармацевти. И тези доклади са доста прости: включват всички заболявания на пациента, всички лекарства, които взима, и всички неблагоприятни събития или странични ефекти, които изпитва. Това не са всички странични ефекти, които се наблюдават в Америка днес, но са стотици хиляди лекарства.
Nick was a young student. I said, "You know, Nick, we have to understand how drugs work and how they work together and how they work separately, and we don't have a great understanding. But the FDA has made available an amazing database. It's a database of adverse events. They literally put on the web -- publicly available, you could all download it right now -- hundreds of thousands of adverse event reports from patients, doctors, companies, pharmacists. And these reports are pretty simple: it has all the diseases that the patient has, all the drugs that they're on, and all the adverse events, or side effects, that they experience. It is not all of the adverse events that are occurring in America today, but it's hundreds and hundreds of thousands of drugs.
Затова казах на Ник, "Нека да помислим за глюкозата. Глюкозата е много важна, и e замесена в диабета. Нека да видим дали можем да разберем метаболизма на глюкозата." Отпратих Ник. Ник се върна.
So I said to Nick, "Let's think about glucose. Glucose is very important, and we know it's involved with diabetes. Let's see if we can understand glucose response. I sent Nick off. Nick came back.
"Ръс," - каза той, "Създадох класификатор, който анализира страничните ефекти на едно лекарство, използвайки тази база данни, и може да определи дали лекарството влияе на глюкозата или не.
"Russ," he said, "I've created a classifier that can look at the side effects of a drug based on looking at this database, and can tell you whether that drug is likely to change glucose or not."
Той успя. Донякъде беше много просто. Използва всички лекарства, които влияят на глюкозата и някои лекарства, които не влияят на глюкозата, и каза, "Каква е разликата в страничните им ефекти? Разлики в умората? В апетита? В уринирането? Всички тези неща му помагат да даде доста добра прогноза. Той каза, "Ръс, мога да предскажа с 93% сигурност дали лекарството влияе на глюкозата."
He did it. It was very simple, in a way. He took all the drugs that were known to change glucose and a bunch of drugs that don't change glucose, and said, "What's the difference in their side effects? Differences in fatigue? In appetite? In urination habits?" All those things conspired to give him a really good predictor. He said, "Russ, I can predict with 93 percent accuracy when a drug will change glucose."
"Ник, това е чудесно." Той е млад студент, трябва да изграждаш самочувствието му. "Но, Ник, има един проблем. Проблемът е, че всеки доктор знае лекарствата, които влияят на глюкозата, защото е основно за нашата дейност. Така че това е чудесно, но не е много интересно, и не може да се публикува."
I said, "Nick, that's great." He's a young student, you have to build his confidence. "But Nick, there's a problem. It's that every physician in the world knows all the drugs that change glucose, because it's core to our practice. So it's great, good job, but not really that interesting, definitely not publishable."
(Смях)
(Laughter)
Каза, "Знам, Ръс. Предположих, че може да кажеш така." Ник е умен. "Затова направих друг експеримент. Потърсих в тази база данни хора, които взимат две лекарства, и потърсих сходни знаци за промяна на глюкозата за хора, приемащи две лекарства, при които едно лекарство не променя глюкозата, но при двете забелязах силен сигнал."
He said, "I know, Russ. I thought you might say that." Nick is smart. "I thought you might say that, so I did one other experiment. I looked at people in this database who were on two drugs, and I looked for signals similar, glucose-changing signals, for people taking two drugs, where each drug alone did not change glucose, but together I saw a strong signal."
И аз казах, "О! Ти си умен. Добра идея. Покажи ми списъка." И там има група лекарства, не много вълнуващи. Но две лекарства привлякоха вниманието ми: пароксетин, или Паксил, антидепресант; и правастатин, или Правакол, лекарство против холестерола.
And I said, "Oh! You're clever. Good idea. Show me the list." And there's a bunch of drugs, not very exciting. But what caught my eye was, on the list there were two drugs: paroxetine, or Paxil, an antidepressant; and pravastatin, or Pravachol, a cholesterol medication.
И казах, "Има милиони американци, които взимат тези две лекарства." По-късно научихме, че 15 милиона американци взимат пароксетин по това време, 15 милиона - правастатин, и един милион, преценихме, и двете. Това са един милион души, които биха могли да имат проблеми с глюкозата си, ако тези глупости, машинно-генерирани от базата данни на FDA, наистина минат тестовете. Но казах, "Това все още не е за публикуване, въпреки че ми харесва какво си направил с машинното изследване, но това не е на нивото на изискваните доказателства." Трябваше да направим нещо друго. Нека да влезем в Станфордския електронен медицински архив. Имаме копие, достъпно за изследвания, премахнали сме идентифициращата информация. Казах, "Нека да видим дали хората на тези две лекарства имат проблеми с глюкозата си."
And I said, "Huh. There are millions of Americans on those two drugs." In fact, we learned later, 15 million Americans on paroxetine at the time, 15 million on pravastatin, and a million, we estimated, on both. So that's a million people who might be having some problems with their glucose if this machine-learning mumbo jumbo that he did in the FDA database actually holds up. But I said, "It's still not publishable, because I love what you did with the mumbo jumbo, with the machine learning, but it's not really standard-of-proof evidence that we have." So we have to do something else. Let's go into the Stanford electronic medical record. We have a copy of it that's OK for research, we removed identifying information. And I said, "Let's see if people on these two drugs have problems with their glucose."
Има хиляди хора в Станфордския медицински архив, които взимат пароксетин и правастатин. Но се нуждаехме от специални пациенти. Нуждаехме се от пациенти, взимали едното лекарство и с измерена глюкоза, а след това са започнали да взимат другото и пак е измерена глюкозата, всичко в разумен период от време - около два месеца. Когато направихме това, намерихме 10 пациента. Обаче осем от 10 са имали рязко увеличение на глюкозата, когато са получили второто П наричаме лекарствата П и П когато са получили второто П. Което и да е може да е първо, когато се появи второто, глюкозата се увеличава с 20 милиграма на децилитър. Само за напомняне, ако нямате диабет, глюкозата ви е около 90. Ако се увеличи до 120, 125, докторът ви заподозира потенциална диагноза диабет. Така че увеличение с 20 - доста значително.
Now there are thousands and thousands of people in the Stanford medical records that take paroxetine and pravastatin. But we needed special patients. We needed patients who were on one of them and had a glucose measurement, then got the second one and had another glucose measurement, all within a reasonable period of time -- something like two months. And when we did that, we found 10 patients. However, eight out of the 10 had a bump in their glucose when they got the second P -- we call this P and P -- when they got the second P. Either one could be first, the second one comes up, glucose went up 20 milligrams per deciliter. Just as a reminder, you walk around normally, if you're not diabetic, with a glucose of around 90. And if it gets up to 120, 125, your doctor begins to think about a potential diagnosis of diabetes. So a 20 bump -- pretty significant.
Казах, "Ник, това е доста готино. Но, съжалявам, все още нямаме публикация, защото това са 10 пациента, и -- остави ме на мира -- това не е достатъчно."
I said, "Nick, this is very cool. But, I'm sorry, we still don't have a paper, because this is 10 patients and -- give me a break -- it's not enough patients."
Какво можем да направим? Нека се обадим на приятелите си в Харвард и Вандербилт, които също -- Харвард в Бостън, Вандербилт в Нашвил, които също имат електронни архиви сходни с нашите. Да видим дали могат да намерят подобни пациенти с едното П, с другото П, с нивата на глюкоза в обхвата, от който се нуждаем.
So we said, what can we do? And we said, let's call our friends at Harvard and Vanderbilt, who also -- Harvard in Boston, Vanderbilt in Nashville, who also have electronic medical records similar to ours. Let's see if they can find similar patients with the one P, the other P, the glucose measurements in that range that we need.
Бог да ги благослови, Вандербилт за една седмица откриха 40 такива пациента, същата тенденция. Харвард намери 100 пациента, същата тенденция Накрая имахме 150 пациента от три различни медицински центъра, които ни показваха, че пациентите, които взимат тези две лекарства, имат значително увеличение на глюкозата си.
God bless them, Vanderbilt in one week found 40 such patients, same trend. Harvard found 100 patients, same trend. So at the end, we had 150 patients from three diverse medical centers that were telling us that patients getting these two drugs were having their glucose bump somewhat significantly.
По-интригуващо, не включихме диабетиците, защото те по начало имат увредена глюкоза. Когато разгледахме глюкозата на диабетиците, тя се увеличаваше с 60 милиграма на децилитър, не само с 20. Това беше голяма работа, и казахме, "Трябва да го публикуваме." Предадохме публикацията. Всичко беше данни: данни от FDA, данни от Станфорд, данни от Вандербилт, данни от Харвард. Не бяхме направили нито един истински експеримент.
More interestingly, we had left out diabetics, because diabetics already have messed up glucose. When we looked at the glucose of diabetics, it was going up 60 milligrams per deciliter, not just 20. This was a big deal, and we said, "We've got to publish this." We submitted the paper. It was all data evidence, data from the FDA, data from Stanford, data from Vanderbilt, data from Harvard. We had not done a single real experiment.
Но бяхме нервни. Така че докато публикацията беше в редакция, Ник отиде в лабораторията. Намерихме човек, който знае за лабораторните неща. Аз не се занимавам с това. Грижа се за пациенти, но не се занимавам с пипети. Те ни научиха как да даваме лекарства на мишки. Взехме мишки и им дадохме едното П, пароксетин. Дадохме на други мишки правастатин. На трета група мишки дадохме и двете лекарства. И ето на, глюкозата се увеличи с 20 до 60 милиграма на децилитър при мишките.
But we were nervous. So Nick, while the paper was in review, went to the lab. We found somebody who knew about lab stuff. I don't do that. I take care of patients, but I don't do pipettes. They taught us how to feed mice drugs. We took mice and we gave them one P, paroxetine. We gave some other mice pravastatin. And we gave a third group of mice both of them. And lo and behold, glucose went up 20 to 60 milligrams per deciliter in the mice.
Така че публикацията беше приета на базата само на информатичните данни, но добавихме малка бележка в края, че ако дадете тези лекарства на мишки, глюкозата се увеличава.
So the paper was accepted based on the informatics evidence alone, but we added a little note at the end, saying, oh by the way, if you give these to mice, it goes up.
Това беше чудесно и историята можеше да свърши тук. Но все още имам шест минути и половина.
That was great, and the story could have ended there. But I still have six and a half minutes.
(Смях)
(Laughter)
Седяхме си и си мислехме за всичко това и не мога да си спомня кой, но някой каза, "Чудя се дали пациентите, които взимат тези две лекарства, забелязват страничните ефекти на хипергликемия. Би могло и би трябвало. Как бихме могли да го докажем?"
So we were sitting around thinking about all of this, and I don't remember who thought of it, but somebody said, "I wonder if patients who are taking these two drugs are noticing side effects of hyperglycemia. They could and they should. How would we ever determine that?"
Как би постъпил един пациент? Взимаш лекарство, едно ново лекарство или две, и изпитваш странно усещане. Как постъпваш? Отваряш Google и написваш двете лекарства или лекарството, което взимаш, и пишеш, "странични ефекти." Какво изпитваш? Така че казахме добре, нека да попитаме Google дали ще ни споделят записите си, така че да можем да погледнем в тях и да видим дали пациентите извършват този тип търсене. Google, съжалявам да отбележа, отказаха нашето искане. Така че бях разочарован. Бях на вечеря с един колега, който работи в Microsoft Research и казах, "Искахме да проведем изследване, Google отказаха, малко е разочароващо." Той каза, "Ами, ние имаме Bing търсенета."
We said, well, what do you do? You're taking a medication, one new medication or two, and you get a funny feeling. What do you do? You go to Google and type in the two drugs you're taking or the one drug you're taking, and you type in "side effects." What are you experiencing? So we said OK, let's ask Google if they will share their search logs with us, so that we can look at the search logs and see if patients are doing these kinds of searches. Google, I am sorry to say, denied our request. So I was bummed. I was at a dinner with a colleague who works at Microsoft Research and I said, "We wanted to do this study, Google said no, it's kind of a bummer." He said, "Well, we have the Bing searches."
(Смях)
(Laughter)
Да. Това е чудесно. Почувствах се сякаш --
Yeah. That's great. Now I felt like I was --
(Смях)
(Laughter)
Почувствах се сякаш говорех с Ник отново. Той работи за една от най-големите компании в света, а аз вече се опитвам да го насърча. Но той каза, "Не, Ръс -- може би не разбираш. Не само имаме Bing търсенета, но ако използваш Internet Explorer за да търсиш в Google, Yahoo, Bing, която и да е търсачка ... След това, за 18 месеца, пазим тези данни само за изследователски цели." Казах, "Дойдохме си на думата!" Това бе Ерик Хорвитц, приятелят ми в Microsoft.
I felt like I was talking to Nick again. He works for one of the largest companies in the world, and I'm already trying to make him feel better. But he said, "No, Russ -- you might not understand. We not only have Bing searches, but if you use Internet Explorer to do searches at Google, Yahoo, Bing, any ... Then, for 18 months, we keep that data for research purposes only." I said, "Now you're talking!" This was Eric Horvitz, my friend at Microsoft.
Така че проведохме изследване като определихме 50 думи, който обикновен човек би написал ако има хипергликемия, като "умора," "загуба на апетит," "често уриниране," "често пикаене" -- простете ми, но това е една от възможните фрази. Така че имахме 50 фрази, които нарекохме "диабетни думи." И първо направихме изходно ниво. Оказа се, че около 0.5 до един процент от всички търсения в Internet включват една от тези думи. Това беше изходното ни ниво. Ако хората напишат "пароксетин" или "Паксил" -- те са синоними -- и една от тези думи, процентът се увеличава до около два процента от диабетните думи, ако вече е известно, че я има думата "пароксетин." Ако е "правастатин," процентът се увеличава до 3 % над изходното ниво. Ако и "пароксетин" и "правастатин" са в търсенето, увеличението е с до 10 процента, огромно три- до четири-кратно увеличение в тези търсения с двете лекарства, от които се интересувахме, и думите, свързани с диабет или хипергликемия.
So we did a study where we defined 50 words that a regular person might type in if they're having hyperglycemia, like "fatigue," "loss of appetite," "urinating a lot," "peeing a lot" -- forgive me, but that's one of the things you might type in. So we had 50 phrases that we called the "diabetes words." And we did first a baseline. And it turns out that about .5 to one percent of all searches on the Internet involve one of those words. So that's our baseline rate. If people type in "paroxetine" or "Paxil" -- those are synonyms -- and one of those words, the rate goes up to about two percent of diabetes-type words, if you already know that there's that "paroxetine" word. If it's "pravastatin," the rate goes up to about three percent from the baseline. If both "paroxetine" and "pravastatin" are present in the query, it goes up to 10 percent, a huge three- to four-fold increase in those searches with the two drugs that we were interested in, and diabetes-type words or hyperglycemia-type words.
Ние публикувахме този факт и той привлече малко внимание. Причината да заслужава внимание е, че пациентите ни казват страничните ефекти косвено чрез търсенията си. Обявихме това на FDA. Те проявиха интерес. Установиха програми за следене чрез социалните медии, за да сътрудничат с Microsoft, който имаше хубава инфраструктура за това и други програми, за да анализират данни от Twitter, от Facebook, от записи на търсения, за да се опитат да открият ранни знаци, че лекарствата самостоятелно или заедно, причиняват проблеми.
We published this, and it got some attention. The reason it deserves attention is that patients are telling us their side effects indirectly through their searches. We brought this to the attention of the FDA. They were interested. They have set up social media surveillance programs to collaborate with Microsoft, which had a nice infrastructure for doing this, and others, to look at Twitter feeds, to look at Facebook feeds, to look at search logs, to try to see early signs that drugs, either individually or together, are causing problems.
Каква е поуката? Защо ви разказвам това? Преди всичко, сега имаме надеждата, че данни от голям и среден размер ще ни помогнат да разберем взаимодействия между лекарствата и наистина, основно, действията на лекарствата. Как действат лекарствата? Това ще и вече е създало нова екосистема за разбиране на действието на лекарствата и оптимизация на употребата им Сега Ник е професор в Колумбийския университет. Той направи това в аспирантурата си за стотици двойки от лекарства. Откри няколко много важни лекарствени взаимодействия и ние пресъздадохме това и показахме, че това е метод, който наистина работи за откриване на взаимодействия между лекарства.
What do I take from this? Why tell this story? Well, first of all, we have now the promise of big data and medium-sized data to help us understand drug interactions and really, fundamentally, drug actions. How do drugs work? This will create and has created a new ecosystem for understanding how drugs work and to optimize their use. Nick went on; he's a professor at Columbia now. He did this in his PhD for hundreds of pairs of drugs. He found several very important interactions, and so we replicated this and we showed that this is a way that really works for finding drug-drug interactions.
Има обаче още няколко неща. Не използваме само по две лекарства наведнъж. Има пациенти, които взимат три, пет, седем, девет лекарства. Те били ли са изследвани относно техните деветостранни взаимоотношения? Да, можем да правим двустранни изследвания, А и B, А и С, А и D, но какво относно A, B, C, D, E, F, G заедно, които се взимат от един пациент и може би си взаимодействат едно с друго по начини, които или ги правят повече или по-малко ефективни или причиняват неочаквани странични ефекти? Наистина нямаме никаква представа. Това е открит хоризонт, за да използваме тези данни да се опитаме да разберем лекарствените взаимодействия.
However, there's a couple of things. We don't just use pairs of drugs at a time. As I said before, there are patients on three, five, seven, nine drugs. Have they been studied with respect to their nine-way interaction? Yes, we can do pair-wise, A and B, A and C, A and D, but what about A, B, C, D, E, F, G all together, being taken by the same patient, perhaps interacting with each other in ways that either makes them more effective or less effective or causes side effects that are unexpected? We really have no idea. It's a blue sky, open field for us to use data to try to understand the interaction of drugs.
Още два урока: искам да помислите за силата, която можем да генерираме с данните от хората, които са споделили своите странични ефекти чрез своите фармацевти, самостоятелно, чрез лекарите си, хората които са позволили базите данни в Станфорд, Харвард, Вандербилт да се използват за изследвания. Хората се тревожат за данните си. Тревожат се за конфиденциалността и сигурността им - така и трябва. Нуждаем се от сигурни системи. Но не можем да имаме система, която изолира данните, защото това е твърде богат източник на вдъхновение, нововъведения и открития на новости в медицината.
Two more lessons: I want you to think about the power that we were able to generate with the data from people who had volunteered their adverse reactions through their pharmacists, through themselves, through their doctors, the people who allowed the databases at Stanford, Harvard, Vanderbilt, to be used for research. People are worried about data. They're worried about their privacy and security -- they should be. We need secure systems. But we can't have a system that closes that data off, because it is too rich of a source of inspiration, innovation and discovery for new things in medicine.
Последното, което искам да кажа е, че в този случай открихме две лекарства с малко тъжна история. Двете лекарства причиняваха проблеми. Увеличаваха глюкозата. Можеха да причинят диабет у човек, който иначе не би имал диабет, така че трябва да използваме тези две лекарства внимателно заедно, може би поотделно, да избираме други възможности при предписване. Но съществува и друга възможност. Можехме да открием две или три лекарства, които си взаимодействат по благоприятен начин. Можеше да открием нови ефекти от лекарствата, които те не притежават поотделно, но заедно, вместо да причинят страничен ефект, биха могли да бъдат ново и оригинално лечение на болести, които нямат лечение или при които леченията не са ефективни. Ако мислим за фармацевтични лечения днес, всички важни научни открития -- за СПИН, за туберкулоза, за депресия, за диабет -- винаги е коктейл от лекарства.
And the final thing I want to say is, in this case we found two drugs and it was a little bit of a sad story. The two drugs actually caused problems. They increased glucose. They could throw somebody into diabetes who would otherwise not be in diabetes, and so you would want to use the two drugs very carefully together, perhaps not together, make different choices when you're prescribing. But there was another possibility. We could have found two drugs or three drugs that were interacting in a beneficial way. We could have found new effects of drugs that neither of them has alone, but together, instead of causing a side effect, they could be a new and novel treatment for diseases that don't have treatments or where the treatments are not effective. If we think about drug treatment today, all the major breakthroughs -- for HIV, for tuberculosis, for depression, for diabetes -- it's always a cocktail of drugs.
Така че тук има позитивна страна, и темата за друга TED презентация някой друг ден е как да използваме същите източници на данни за да открием добри ефекти на лекарствата в комбинация, които ще ни осигурят нови лечения, нови прозрения как действат лекарствата и как да се грижим за пациентите си още по-добре.
And so the upside here, and the subject for a different TED Talk on a different day, is how can we use the same data sources to find good effects of drugs in combination that will provide us new treatments, new insights into how drugs work and enable us to take care of our patients even better?
Благодаря ви много.
Thank you very much.
(Аплодисменти)
(Applause)