Nicholas Christakis: How social networks predict epidemics

For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.

Przez ostatnie 10 lat, spędzałem czas próbując się dowiedzieć jak i dlaczego ludzie gromadzą się w sieciach społecznych. Rodzaj sieci społecznych o których mówię nie jest internetowym bytem, ale raczej typem sieci społecznych jakie ludzie tworzą od setek tysięcy lat, odkąd pojawiliśmy się na afrykańskiej sawannie. Tak więc, formuję przyjaźnie, współpracę i małżeństwa i relacje z innymi ludźmi, którzy z kolei mają podobne relacje z innymi ludźmi. I to rozprzestrzenia się tak bez końca na odległość. I dostajecie sieć, która wygląda tak. Każda kropka to osoba. Każda linia pomiędzy nimi jest związkiem pomiędzy dwojgiem ludzi -- różnego rodzaju związkami. I można uzyskać tego rodzaju ogromną tkaninę ludzkości, w którą wszyscy jesteśmy wrośnięci.

And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.

I wraz z moim kolegą, Jamesem Fowlerem, analizowaliśmy przez pewien czas jakie są matematyczne, społeczne, biologiczne i psychologiczne reguły, które rządzą tym, jak te sieci powstają i jakie są podobne reguły, które rządzą tym, jak one funkcjonują, jak wpływają na nasze życie. I ostatnio zastanawialiśmy się czy możliwe jest wykorzystanie tej wiedzy, w celu znalezienia sposobów na udoskonalenie świata aby zrobić coś lepszego, żeby konkretnie naprawić rzeczy, nie tylko je zrozumieć. I tak jedną z pierwszych spraw do jakich postanowiliśmy podejść był sposób przewidywania epidemii.

And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.

Aktualny stan wiedzy w przewidywaniu epidemii -- jeśli jesteś CDC (www.cdc.gov) lub innym organem krajowym -- polega na siedzeniu w miejscu i zbieraniu danych od lekarzy i laboratoriów w terenie, którzy raportują występowanie lub częstość występowania pewnych warunków. Tacy i tacy pacjenci zostali zdiagnozowani z czymś tutaj lub inni pacjenci zostali zdiagnozowani tam, i wszystkie te dane są wprowadzane do centralnego repozytorium, z pewnym opóźnieniem. I jeśli wszystko pójdzie gładko, w ciągu tygodnia lub dwóch, dowiesz się że epidemia wystąpiła dzisiaj. I w zasadzie, mniej więcej rok temu, powstał pomysł stworzenia trendów rozwoju grypy - Google Flu Trends, gdzie, poprzez dzisiejszą analizę zapytań w wyszukiwarce moglibyśmy się dowiedzieć gdzie grypa... jaki jest status epidemii na dzień dzisiejszy, jaki jest stan występowania epidemii na dziś.

But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.

Ale to co chciałem wam pokazać dzisiaj, to sposób, dzięki któremu możemy uzyskać nie tylko wczesne ostrzeżenie o epidemii, ale także wczesne wykrycie epidemii. I w zasadzie ta idea może być użyta nie tylko w przypadku epidemii zarazków ale także przy przewidywaniu jakiegokolwiek rodzaju epidemii. Na przykład, cokolwiek co rozprzestrzenia się w formie społecznej zarazy może być rozumiane w ten sposób, od abstrakcyjnych idei po lewej, takich jak patriotyzm, czy altruizm, czy religia po praktyczne takie jak dieta, czy zakup książek, czy też picie alkoholu, czy kask rowerowy i inne praktyki BHP lub produkty które ludzie mogą kupić, zakupy sprzętu elektronicznego, wszystko z czym związane jest interpersonalne rozpowszechnienie. Rodzaj dyfuzji innowacji może być rozumiane i przewidywane poprzez mechanizm który wam teraz pokażę.

So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.

A więc, jak zapewne wszyscy wiecie, klasyczny sposób myślenia o tym jest dyfuzja innowacji lub też krzywa adoptacji. Więc tu na osi Y, mamy procent ludzi którzy zostali dotknięci, i na osi X mamy czas. I na samym początku, niewiele osób jest dotkniętych, i dostajemy klasyczną krzywą w kształcie litery S. Powodem takiego kształtu jest fakt, że na samym początku, powiedzmy jedna lub dwie osoby zostały dotknięte, lub zainfekowane przez tą rzecz i następnie infekują, dwie następne osoby które w efekcie wpływają na cztery, osiem, 16, itd. i powstaje faza epidemicznego wzrostu krzywej. I w końcu, nasyca się populacja. Jest coraz mniej osób które są dostępne, które można zarazić; i osiągamy plateau krzywej, i otrzymujemy klasyczną esowatą krzywą. I to dotyczy zarazków, pomysłów, adoptacji produktów, zachowań i tym podobnych. Ale w populacji ludzi rzeczy nie rozprzestrzeniają się w sposób przypadkowy. One szerzą się poprzez sieci. Ponieważ, jak juz wspomniałem, nasze życie spędzamy w sieciach i sieci te mają konkretną strukturę.

Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.

Teraz.. jeśli popatrzycie na sieć w taki sposób... To jest 105 osób. Linie reprezentują... kropki to ludzie, a linie reprezentują przyjaźnie. Możecie zauważyć że ludzie okupują różne miejsca w sieci. I jest wiele różnych rodzajów związków pomiędzy ludźmi. Możecie mieć związki przyjaźni, związki rodzeństwa, związki małżeńskie, związki współpracowników, związki sąsiedzkie i tym podobne. I różne rzeczy rozprzestrzeniają się poprzez różne więzi. Na przykład, choroby przenoszone drogą płciową będą rozprzestrzeniać się poprzez więzi seksualne. Lub, na przykład, zachowanie ludzi pod kątem palenia może być pod wpływem ich przyjaciół. Lub ich altruistyczna lub charytatywna działalność może być pod wpływem ich współpracowników lub ich sąsiadów. Ale nie wszystkie pozycje w sieci są takie same.

So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.

Jeśli spojrzycie na to, możecie natychmiast zrozumieć że różni ludzie mają różny połączeń. Jedni mają jedno połączenie, inni dwa inny sześć, a jeszcze inni 10 połączeń. I to nazywamy "stopniem" wierzchołka, lub liczą połączeń które dany wierzchołek posiada. Ale, ponad to, jest coś jeszcze. Jeśli przyjrzycie się wierzchołkom A i B, oba mają po sześć połączeń. Ale jeśli spojrzycie na ten obrazek [sieci] z lotu ptaka, uznacie że jest coś co powoduje że wierzchołki A i B są zdecydowanie różne. Pozwólcie że was zapytam tak -- mogę podtrzymywać tą intuicję poprzez pytanie -- kim wolelibyście być gdyby zabójczy zarazek rozprzestrzeniał się poprzez sieć, A czy B ? (Sala: B) Nicholas Christakis: B, to oczywiste. B jest ulokowane na krawędzi sieci. A teraz, kim wolelibyście być gdyby soczysta plotka krążyła w tej sieci ? A. I możecie niemal natychmiast zauważyć że A ma większe szanse aby dostać tę rzecz która się rozprzestrzenia i dostać prędzej ze względu na na jego położenie w strukturach sieci. A jest bardziej centralne, i to może być sformalizowane matematycznie. Więc, jeśli chcielibyśmy śledzić coś co się rozprzestrzenia poprzez sieć, w idealnym świecie chcielibyśmy ustawić sensory na centralnych jednostkach w sieci, włączając wierzchołek A, monitorować te osoby które są właśnie tam, w samym środku sieci, i w jakiś sposób dokonać wczesnego odkrycia tego co się rozprzestrzenia w sieci, czymkolwiek to jest.

So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.

Oznacza to, że jeśli zauważylibyście moment w którym złapali wirusa lub fragment informacji, wiedzielibyście, że wkrótce, wszyscy zostaliby zarażeni lub posiadali ten fragment informacji. I byłoby to dużo lepsze od monitorowania sześciu przypadkowo wybranych osób bez żadnego odniesienia do struktury populacji. I co więcej, jeśli moglibyście to zrobić to co byście zobaczyli wyglądałoby mniej więcej tak. Po lewej stronie panelu, znowu, mamy krzywą adoptacji w kształcie S. Czerwona przerywana linia pokazuje jak wyglądałaby adoptacja u przypadkowych ludzi, i linia po lewej stronie, przesunięta do lewej pokazuje jak wyglądałaby adoptacja u osób znajdujących się w centrum sieci. Na osi Y jest łączne wystąpienie zakażenia, i na osi X jest czas. I po prawej stronie, pokazujemy te same dane, ale z dzienną zapadalnością. I to co tu pokazujemy jest, tak jak tutaj bardzo mało ludzi jest dotkniętych, więcej i więcej i więcej i do tego momentu i tu jest szczyt epidemii. Ale przesunięty jest w lewo, i to występuje u centralnej jednostki. I ta różnica w czasie pomiędzy obiema (epidemiami) to wczesne wykrycie, wczesne ostrzeżenie które możemy uzyskać o nadchodzącej epidemii w populacji ludzi.

The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.

Problem, jednak jest taki, że mapowanie sieci społecznych ludzi nie zawsze jest możliwe. Może być drogie, [bardzo trudne], nieetyczne lub, szczerze, po prostu niemożliwe do zrobienia. A więc, jak możemy rozgryźć kto znajduje sie w centrum sieci bez właściwego jej mapowania ? Wpadliśmy na pomysł wykorzystania starej informacji lub też znanego faktu o sieciach społecznych, który mówi: Czy wiesz że Twoi znajomi mają więcej znajomych niż ty ? Twoi przyjaciele mają więcej przyjaciół niż ty. To jest znane jako paradoks przyjaźni. Wyobraźcie sobie bardzo popularną osobę w sieci społecznej -- jak np. organizator imprezy, który ma setkę przyjaciół -- i mizantropa który ma tylko jednego przyjaciela, i wybieracie przypadkową osobę z populacji; ta osoba ma dużo większe szanse znać organizatora imprezy I jeśli ta osoba nominuje gospodarza imprezy jako przyjaciela, ten organizator imprezy ma setkę przyjaciół, a zatem ma więcej przyjaciół niż wybrany przez was osobnik. I to, w skrócie, jest paradoks przyjaźni. Przyjaciele przypadkowo wybranych ludzi mają wyższy stopień, i są bardziej centralni niż przypadkowi ludzie.

And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.

Można to zrozumieć intuicyjnie jeśli wyobrazicie sobie osoby znajdujące się na obrzeżu sieci. Jeśli wybierzecie taką osobę, jedynym osobnikiem który może zostać jej przyjacielem, jest ten który ma już co najmniej dwoje, a zazwyczaj więcej, przyjaciół. I tak dzieje się z każdym krańcowym wierzchołkiem. I co więcej, tak dzieje się w obrębie całej sieci, po której się poruszamy, kogokolwiek wybierzesz, kiedy nominują przypadkową.. kiedy przypadkowa osoba nominuje kogoś jako swojego przyjaciela, ty przybliżasz się do centrum sieci. Tak więc, postanowiliśmy wykorzystać ten pomysł w celu zbadania, czy możemy przewidywać zjawiska w sieciach. Ponieważ teraz, z tym pomysłem, możemy brać przypadkowe próbki spośród ludzi, wskazać ich przyjaciół, ci przyjaciele byliby bardziej centralni, i moglibyśmy dokonać tego bez potrzeby mapowania sieci.

And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.

Przetestowaliśmy ten pomysł na epidemii świńskiej grypy H1N1 na Harwardzie, jesienią i zimą 2009, tylko kilka miesięcy temu. Wzięliśmy 1300 losowo wybranych studentów, poprosiliśmy ich o wskazanie swoich znajomych, a następnie śledziliśmy zarówno studentów, jak ich przyjaciół codziennie, żeby zobaczyć czy zostali zarażeni grypą. Zrobiliśmy to w sposób pasywny, patrząc czy któryś ze studentów zgłosił się do uniwersyteckiego lekarza. Jak również, poprosiliśmy ich o przesyłanie nam emaili kilka razy w tygodniu. Stało się dokładnie to, co przewidzieliśmy. I tak losowo wybrana grupa, jest czerwoną linią. Epidemia w grupie przyjaciół jest przesunięta do lewej, tutaj. Różnica czasu wynosi 16 dni. Poprzez monitorowanie grupy przyjaciół, udało nam się z 16 dniowym wyprzedzeniem przestrzec o zbliżającej się epidemii w tej populacji ludzi.

Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.

Teraz, ponadto jeśli bylibyście analitykami i próbowali studiować epidemię lub przewidzieć przyjęcie się produktu, na przykład, to co moglibyście zrobić, to wybrać losową próbkę populacji, poprosić ich o wskazanie ich przyjaciół i śledzić tychże przyjaciół, i śledzić zarówno losowo wybranych ludzi, jak również ich przyjaciół. Spośród przyjaciół, pierwsza oznaką jaką byście zobaczyli, mały piksel nad zerem na krzywej adoptacji, oznaczałaby na przykład oznakę nadchodzącej epidemii. Lub moglibyście zaobserwować jak dwie krzywe rozchodzą się tak jak to jest pokazane po lewej. Kiedy.. Kiedy przyjaciele odbiegają, i zostawiają losowych wybrańców i kiedy ich krzywa zaczyna się przesuwać? I to, jak wskazuje biała linia, odbyło się 46 dni przed szczytowym dniem epidemii. Więc to byłaby technika, dzięki której moglibyśmy z ponad półtoramiesięcznym wyprzedzeniem dostać ostrzeżenie o epidemii grypy w konkretnej populacji.

I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.

Powinienem dodać, że to jak wczesne ostrzeżenie o czymś można dostać zależy od wielu czynników. Może zależeć od natury danego patogenu -- w przypadku różnych patogenów używając tej techniki, dostalibyście różne ostrzeżenia -- może zależeć od innych zjawisk, które się rozprzestrzeniają, lub, po prostu, może zależeć od struktury sieci. W naszym przypadku, mimo że nie było to konieczne mogliśmy zmapować sieć studentów.

So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.

I tak, oto jest jest mapa 714 studentów i ich więzi przyjaźni, I za moment, puszczę tą mapę w ruch. Zaprezentuję jak wyglądała ta sieć dzień po dniu przez okres 120 dni. Czerwone kropki będą przypadkami grypy, żółte kropki to przyjaciele osób zarażonych grypą. Rozmiar kropki jest proporcjonalny do ilości przyjaciół zarażonych grypą. Zatem większa kropka oznacza, że więcej twoich przyjaciół ma grypę. I jeśli spojrzycie na ten obrazek -- mamy teraz 13 września -- zobaczycie kilka przypadków które się podświetlą. Zobaczycie swoisty rodzaj rozkwitu grypy w środku. Tutaj mamy 19 października. Zbliża się nachylenie krzywej epidemii, teraz, w listopadzie. Bang, bang, bang, bang, bang, teraz zobaczycie duży rozkwit w środku, a następnie zobaczycie swoiste wyrównanie coraz mniej przypadków pod koniec grudnia. I tego typu wizualizacja może pokazać, że epidemie jak ta, ukorzeniają się i wpływają najpierw na centralne jednostki, zanim zaczną wpływać na innych.

Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.

Teraz, tak jak sugerowałem, ta metoda nie ogranicza się jedynie do zarazków, ale do czegokolwiek co może się rozprzestrzeniać w populacjach. Informacja rozprzestrzenia się w populacjach. Normy rozprzestrzeniają się w populacjach. Zachowania mogą się rozprzestrzeniać w populacjach. I przez zachowanie, mam na myśli rzeczy takie jak kryminalne zachowania, głosowanie, podejście do zdrowia takie jak palenie czy szczepionki, lub adoptacja produktu, lub inne typy zachowań które odnoszą się do wpływania interpersonalnego. Jeśli ja jestem skłonny zrobić coś, co wpłynie na innych wokół mnie, ta technika umożliwia wczesne ostrzeżenie, lub wczesną detekcje o wyborach wewnątrz populacji. Aby to zadziałało, kluczową rzeczą jest interpersonalny wpływ. To nie może być z powodu jakiegoś mechanizmu transmisji który wpływa na wszystkich jednakowo.

Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.

Te same spostrzeżenia mogą być wykorzystane -- w odniesieniu do sieci -- mogą być wykorzystane na inne sposoby na przykład, w stosunku do wyszukiwania konkretnych osób do interwencji. I tak, na przykład, większość z was prawdopodobnie zna pojęcie odporności stada. Gdy weźmiemy populacje tysiąca osób, i chcemy, aby populacja była odporna na dany patogen, nie musimy szczepić każdej pojedynczej osoby. Jeśli zaszczepimy 960 osób, to prawie tak jakbyśmy zaszczepili sto procent. Ponieważ, nawet jeśli jedna lub dwie nie zaszczepione osoby zostaną zainfekowane, nie ma nikogo kogo mogłyby zarazić. Są otoczone przez osoby zaszczepione. Zatem 96 procent jest tak samo dobre jak 100 procent. Niektórzy naukowcy oszacowali co by się stało gdyby wziąć 30 procent losowo wybranych ludzi z grupy 1000 osób, 300 osób i je zaszczepić. Czy osiągnęlibyśmy odporność na poziomie populacji ? Odpowiedź brzmi: nie. Ale jeśli weźmiecie te 30 procent, te 300 osób, poprosicie ich aby wskazali swoich przyjaciół i użyli tej samej liczby szczepionek i zaczepili przyjaciół tej 300tki, 300 przyjaciół, moglibyście osiągnąć ten sam poziom odporności stada jak w przypadku zaszczepienia 96 procent populacji przy dużo większej wydajności i ograniczeniach budżetowych.

And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].

I podobne pomysły mogą być użyte, na przykład, do zwalczania dystrybucji rzeczy takich jak moskitiery w krajach rozwijających się. Gdybyśmy mogli zrozumieć strukturę sieci w wioskach, moglibyśmy określić komu nadać wpływ do wspierania tego typu rozprzestrzeniania. Lub, szczerze, to reklamowania wszelkiego rodzaju produktów. Gdybyśmy mogli zrozumieć jak to ukierunkowywać wpłynęło by to znacznie na wydajność tego co chcemy osiągnąć. I ponadto, moglibyśmy użyć danych z różnego rodzaju źródeł.

This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.

To jest mapa ośmiu milionów użytkowników telefonów w europejskim kraju. Każdy punkt to osoba, i każda linia reprezentuje ilość rozmów pomiędzy ludźmi. I możemy użyć takich danych, które zostały pobrane pasywnie, w celu zmapowania całych krajów i zrozumieć kto jest zlokalizowany gdzie w sieci. Bez potrzeby zadawania jakichkolwiek pytań, możemy osiągnąć tego typu wgląd w strukturę sieci. I inne źródła informacji, których bez wątpienia jesteście świadomi, są dostępne o takich cechach, od wymiany emaili, interakcji online, sieci społeczne, itd. I do tego, żyjemy w czasach, które ja nazywam czasami "masywno-pasywnego" kolekcjonowania danych. Jest mnóstwo sposobów jakich możemy użyć do masywnego zbierania danych do tworzenie sieci sensorów aby śledzić populację, zrozumieć co się dzieje w populacji, i wpłynąć na populację dla jej dobra. Ponieważ te nowe technologie mówią nam nie tylko kto z kim rozmawia, ale gdzie wszyscy są, i o czym myśleli na podstawie tego co ściągają z internetu, i co kupowali na podstawie ich zakupów. I wszystkie te dane administracyjne mogą być zebrane razem i przetworzone aby zrozumieć ludzkie zachowanie w sposób jaki nigdy wcześniej nie był możliwy.

So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.

I tak na przykład, moglibyśmy użyć dane o zakupach paliwa kierowcy TIRa. Tak więc kierowcy ciężarówek prowadzą swoją działalność i kupują paliwo. Widzimy skok w zakupie paliwa, i wiemy, że recesja się wkrótce skończy. Lub też możemy monitorować prędkość z jaką ludzie poruszają się ze swoimi telefonami na autostradzie, i firma telekomunikacyjna może zobaczyć, gdy prędkość się zmniejsza, że pojawił się korek. I mogą przesłać te informacje do swoich użytkowników, ale tylko do tych którzy są na tej samej autostradzie zlokalizowani przed korkiem. Lub możemy monitorować recepty wypisane przez lekarzy, i zobaczyć jak dyfuzja innowacji farmaceutycznych występuje w środowisku lekarzy. Lub też, możemy monitorować zakupy ludzi, i obserwować jak tego typu zjawiska szerzą się wśród ludzkiej populacji.

And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.

I są trzy sposoby, moim zdaniem, na które te masywno-pasywne zbieranie danych, które mogą być użyte. Jeden z nich jest całkowicie pasywny, tak jak to właśnie opisałem -- na przykładzie kierowców ciężarówek, gdzie w zasadzie nie wpływamy na populacje w żaden sposób. Drugi jest pseudo-aktywny jak w przykładzie grypy, gdzie prosimy niektórych ludzi o wskazanie swoich przyjaciół i następnie pasywnie monitorujemy ich przyjaciół -- czy mają grypę, czy nie? -- i wtedy otrzymujemy ostrzeżenie. Inny przykład mógłby być taki: jeśli jesteś firmą telekomunikacyjną, rozgryzłyś kto znajduje się w centrum sieci, i spytałbyś tych ludzi: "Słuchaj, czy mógłbyś nam wysłać codziennie swoją temperaturę?" I zbierać ogromne ilości informacji o temperaturach ludzi, ale tylko od centralnie ulokowanych osobników. I być w stanie, na dużą skalę, monitorować nadchodzącą epidemię przy minimalnym udziale ludzi. Lub, w końcu, trzeci sposób w pełni aktywny -- o ile mi wiadomo następni prelegenci będą dziś o tym mówić -- gdzie ludzie mogą globalnie brać udział w wiki, lub fotografiach lub monitorowaniu wyborów, i wgrywać informacje w sposób jaki umożliwiłby nam zbieranie tych informacji w celu zrozumienia procesów społecznych i zjawisk społecznych.

In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.

I na dobrą sprawę, uważam, że dostępność tych danych otwiera nową erę, którą ja i inni chcielibyśmy nazwać "komputerowa nauka społeczna". To jest coś jak, gdy Galileo wynalazł -- albo raczej nie tyle wynalazł, co zaczął używać teleskopu i zobaczył niebo w zupełnie nowy sposób, lub Leeuwenhoek dowiedział się o mikroskopie -- lub właściwie go wynalazł -- i mógł zobaczyć biologię w nowy sposób. Ale teraz mamy dostęp do tych danych które pozwolą nam zrozumieć procesy społeczne i zjawiska społeczne w zupełnie nowy sposób, który nigdy wcześniej nie był możliwy. I z tą nauką, możemy zrozumieć jak dokładnie całość staje się czymś więcej niż tylko sumą części. I właściwie, możemy użyć tych spostrzeżeń do poprawy społeczeństwa i poprawy dobrobytu ludzi.

Thank you.

Dziękuję.

Thank you.

Dziękuję.

Nicholas Christakis: How social networks predict epidemics

Nicholas Christakis: How social networks predict epidemics

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading