For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.
Az utóbbi tíz évben annak a kérdésnek a megválaszolásával foglalkoztam, hogy az emberek miért és hogyan szerveződnek közösségi hálózatokba. Amikor közösségi hálózatról beszélek, nem a nemrég megjelent online változatára gondolok, hanem azokra a közösségi hálózatokra, amelyekbe az emberek több százezer éve szerveződnek, azóta, amióta az ember afrikai szavannákon megjelent. Tehát az ember baráti, munkatársi testvéri és rokoni kapcsolatokat alakít ki más emberekkel, akik maguk is hasonló kapcsolatokat létesítenek. Ez pedig végtelenbe nyúlik. Így egy olyan hálózat alakul ki, ami a következőképpen néz ki. Minden pont egy-egy személy. A pontok közötti vonalak a két ember közötti kapcsolatot jelölik -- különböző kapcsolatokat. Így kialakul ez a hatalmas emberiség szövevény, amelybe mindannyian be vagyunk ágyazva.
And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.
A kollégám, James Fowler és én, már egy jó ideje vizsgáljuk, hogy melyek azok a matematikai, társadalmi, biológiai és pszichológiai szabályszerűségek, amelyek ezeknek a hálózatoknak a felépítését meghatározzák, és azt, hogy melyek azok a hasonló szabályok, amelyek a működésüket meghatározzák, és ezek miként befolyásolják az életünket. Nemrégiben felmerült bennünk az a kérdés, hogy vajon előnyt lehetne-e kovácsolni a kutatási eredményeinkből, hozzásegíthetnek-e ezek a világ fejlődéséhez, hogy jobbá tegyünk dolgokat, hogy ne csupán megértsünk dolgokat, hanem jobbá is tegyük azokat. Az egyik első dolog, amire gondoltunk az volt, hogy miként jelezzük előre a járványokat.
And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.
A dolgok mai állása szerint a járványok előrejelzése -- CDC-ként vagy más országos szervezetként -- úgy történik, hogy ott, ahol éppen tartózkodsz, adatokat gyűjtesz a szakavatott orvosoktól, illetve laboratóriumoktól, amelyek beszámolnak bizonyos betegségek előfordulásáról, gyakoriságáról. Ilyen és ilyen pácienseket valamilyen betegséggel diagnosztizálták [itt], más betegeket más betegséggel diagnosztizáltak [ott], és ezek az adatok egy központi összesítő rendszerbe kerülnek, bizonyos időbeli eltolódással. Ha minden simán megy, egy-két héten belül kiderül, hogy a járvány hol tartott ma. Mintegy egy évvel ezelőtt nyilvánosságra hozták a Google Influenza Tendenciák ötletét, az influenzára vonatkozóan, amely keretében az emberek Google keresési szokásait vizsgálva rá lehet jönni, hogy az influenza hol ... mi volt a járvány helyzete ma, mekkora volt az előfordulási gyakorisága ma.
But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.
Ma azt szeretném megmutatni önöknek, hogy létezik egy olyan módszer, amellyel nemcsak gyors figyelmeztetést kaphatunk egy járványról, hanem lényegében a járvány nagyon korán kimutatható. Ez a módszer nemcsak arra alkalmas, hogy a baktériumok által okozott járványokat előrejelezze, hanem arra is, hogy bármilyen fajta járványt megjósoljon. Például, bármi, ami társadalmi érintkezéssel terjed, megérthető ily módon, az absztrakt gondolatoktól, balra, mint például a hazaszeretet, az altruizmus, a vallás az olyan gyakorlatokig, mint például a fogyókúrázás vagy könyvvásárlás, alkoholfogyasztás, védősisak-viselés vagy egyéb biztonsági viselkedésmódok, vagy vásárlási szokások, elektronikai termékek vásárlása, bármi, ami személyek között terjedhet. Az innováció terjedése megérthető és előrejelezhető azzal a mechanizmussal, amit bemutatok most önöknek.
So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.
Ahogyan talán mindannyian tudják, klasszikusan erről az innováció-diffúzióval vagy az ún. elfogadási görbével gondolkodnak. Itt, az Y tengelyen található az érintett személyek aránya, az X tengelyen pedig az idő látható. Az elején nem túl sok ember érintett, a klasszikus szigmoid, S-alakú görbét látjuk. A görbe oka, hogy a legeslegelején mondjuk egy-két ember érintett vagy fertőzött, majd megérint vagy megfertőz két személyt, akik maguk is átadják még 4, 8 majd 16 személynek, és így tovább, amíg megkapjuk a járvány terjedésének növekedési görbéjét. És így tovább, amíg az egész népesség megfertőződik. Egyre kevesebb ember van, aki még nem érintett, és aki megfertőzhető, majd a görbe plafonizálódik, és az eredmény ez a klasszikus szigmoid görbe lesz. Ez érvényes a baktériumokra, a gondolatokra, a termékelfogadásra, a viselkedés-terjedésre, és hasonlókra. De a dolgok nem véletlenszerűen terjednek az emberi populációkban, hanem hálózatokon keresztül. Mert, mint ahogyan említettem, hálózatokban éljük az életünket, és ezeknek a hálózatoknak különleges szerkezetük van.
Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.
Ha megnéznek egy ilyen hálózatot ... Ezt 105 személy alkotja. És a vonalak... a pontok az emberek, a vonalak pedig a közöttük fennálló baráti kapcsolatokat jelölik. Látható, hogy az emberek különböző helyeket foglalnak el a hálózaton belül. És az is látszik, hogy az emberek között különböző kapcsolatok vannak. Találunk baráti kapcsolatokat, testvéri kapcsolatokat, házastársi kapcsolatokat, munkatársi kapcsolatokat, szomszédsági kapcsolatokat és így tovább. Különböző dolgok terjednek a különböző kapcsolatokon keresztül. Például, szexuális úton terjedő betegségek szexuális kapcsolatokon keresztül terjednek. Vagy az emberek dohányzási szokásait például befolyásolják barátaik. Vagy altruista vagy jótékonysági viselkedésüket munkatársaik vagy szomszédjaik irányítják. Nem minden helyzet egyforma a hálózaton belül.
So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.
Ha megnézik ezt, egyből látják, hogy a különböző személyeknek nem ugyanannyi kapcsolatuk van. Egyes embereknek csak egy kapcsolatuk van, másoknak kettő, megint másoknak hat, esetleg tíz. Ezt a csomópont "érték"-ének nevezik, vagy a csomópont kapcsolatai számának. De ezenkívül valami más is van. Ha megnézik az A és B csomópontot, akkor látják, hogy mindekettőnek hat kapcsolata van. De ha a hálózat képét madártávlatból nézzük, látszik, hogy valami nagyon különbözik az A és a B csomópontok esetében. Engedjék meg, hogy megkérdezzem -- egy kérdéssel segíthetem ennek megértését -- kinek a helyében lennének inkább, ha egy halálos vírus terjedne a hálózaton keresztül, A-nak vagy B-nek? (Hallgatóság: B-nek.) Nicholas Christakis: B-nek, egyértelmű. B a hálózat szélén helyezkedik el. Kinek a helyében lennének inkább, ha egy jó szaftos pletyka keringene a hálózaton? A-nak. Egyből ráéreztek, hogy A-hoz nagyobb valószínűséggel eljut a terjedő dolog, és korábban jut el hozzá a hálózat szerkezetén belül elfoglalt helye miatt. A valójában sokkal központibb helyet foglal el, és ez matematikai képletben is kifejezhető. Tehát, ha valamit ki akarunk mutatni, ami a hálózaton keresztül terjed, akkor - ideális esetben - szenzorokat állítanánk fel a hálózat központi figuráin, beleértve az A csomópontot, figyelnénk azokat az embereket, akik a hálózat közepén helyezkednek el, és így korán értesülnénk bármiről, ami a hálózatban terjed.
So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.
Vagyis, ha látjuk, hogy ezek elkaptak egy vírust vagy eljutott hozzájuk valamilyen információ, tudnánk, hogy hamarosan mindenki elkapja a vírust vagy mindenkihez eljut az információ. Ez sokkal hatékonyabb lenne, mint véletlenszerűen kiválasztott személyeket figyelni, figyelmen kívül hagyva a népesség szerkezetét. Ha ezt meg tudnánk tenni, akkor valami ilyesmit látnánk. A bal oldalon, ismét, az S-alakú elfogadási görbét látjuk. A piros pontozott vonal azt mutatja, hogyan nézne ki az átvétel a véletlenszerűen választott emberek esetében, a bal oldali vonalon pedig azt látjuk, hogyan nézne ki az átvétel a hálózat központi helyén található személyek esetében. Az Y tengelyen a fertőzés kumulatív eseteit látjuk, az X tengelyen pedig az időt. A jobb oldalon ugyanazokat az adatokat mutatjuk, napi előfordulásuk lebontásában. És amit itt mutatunk -- itt -- az az, hogy nagyon kevés ember érintett, majd egyre több és több, és itt van a betegség csúcsa. Visszatérve a bal oldalihoz, az látjuk, mi történik a központi egyéneknél. És ez az az időbeli különbség a kettő között a korai értesülés, a korai figyelmeztetés egy fenyegető járványról, ami az emberi populációban terjed.
The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.
A gond az, hogy az emberi hálózatok feltérképezése nem mindig lehetséges. Nagyon drága, bonyolult lehet, vagy nem etikus, vagy egyszerűen nem lehet végrehajtani. Tehát, hogyan határozható meg, hogy kik a központi személyek egy hálózatban a hálózat teljes feltérképezése nélkül? Amit kitaláltunk, egy régi dolgon alapszik, egy, a közösségi hálózatokról ismert dolgon, ami a következőképpen néz ki: Tudták, hogy a barátaiknak több barátjuk van, mint önöknek? A barátaiknak több barátjuk van, mint önöknek. Ez a tény a barátság paradoxonaként ismert. Képzeljenek el egy nagyon népszerű személyt a közösségi hálózaton belül -- például egy buli házigazdát, akinek több száz barátja van -- és egy mizantrópot, akinek csak egy barátja van, és válasszanak véletlenszerűen egy embert a népességből: nagyobb a valószínűsége, hogy ez az ember a buli házigazdát ismeri. És, ha ő a buli házigazdát nevezi meg barátjaként, a buli házgazdának több barátja van, tehát, több mint az előbbinek. Ez lényegében a barátság paradoxon. A véletlenszerűen kiválasztott személyek barátai magasabb értékkel rendelkeznek, és központibb helyet foglalnak el, mint a véletlenszerűen kiválasztott emberek.
And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.
Megérthetik ezt intuitív módon, ha csak azokat az embereket képzelik el, aki a hálózat perifériáján vannak. Ha kiválasztják ezt az embert, az egyetlen barát, akit meg tud nevezni, ez a személy, akinek, a szerkezet jellegéből adódóan legalább kettő, de általában több barátja van. Ez történik mindenik periferikus csomópontnál. És valójában ez történik az egész hálózaton belül, ahogy haladunk befele, bárki, akit kiválasztunk, amikor véletlenszerűen nevez meg... amikor egy véletlenszerűen kiválasztott személy megnevezi egyik barátját, közelebb kerülünk a hálózat központjához. Úgy gondoltuk, hogy felhasználhatnánk ezt annak érdekében, hogy előrejelezzünk bizonyos jelenségeket a hálózaton belül. Mert ezzel a módszerrel kiválaszthatunk egy véletlenszerű embermintát, akik megnevezik barátaikat, és ez utóbbiak központibbak lesznek, mint az előbbiek, és ezt megtehetjük anélkül, hogy teljesen feltérképeznénk a hálózatot.
And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.
Leteszteltük ezt a módszert a H1N1 vírus megjelenésekor a Harvard Egyetemen 2009 őszén és telén, néhány hónappal ezelőtt. Véletlenszerűen kiválasztottunk 1300 egyetemistát, megkértük, hogy nevezzék meg barátaikat, és figyelemmel követtük mind a kiválasztott egyetemistákat, mind pedig ezek barátait nap mint nap azért, hogy lássuk, elkapták vagy sem az influenzát. Passzív megfigyelést tettünk: figyeltük, hogy igénybe vették vagy sem az egyetemi betegrendelőt. Ezenkívül pedig néhány alkalommal egy héten e-mailt kellett írniuk nekünk. Pontosan az történt, ami feltételeztünk. A véletlenszerűen kiválasztott csoportot a piros vonal jelöli. A betegség a baráti körben balra tolódott, itt. A kettő közötti különbség 16 nap. Megfigyelve a baráti csoportot, 16 napi előnyre tettünk szert egy közelgő járvány előrejelzésében.
Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.
És, ezenkívül, ha olyan szakértők lennénk, akik egy betegséget tanulmányoznak, vagy egy termék el- és befogadását tanulmányozzák például, azt lehetne tenni, hogy kiválasztanánk az emberi populációból egy véletlenszerű mintát, akik megnevezik barátaikat, majd figyelemmel követjük mind a véletlenszerűen kiválasztott mintát, mind pedig a mintát alkotó egyének barátait. A barátok között az első dolog, ami szembeötlik, a nullánál valamivel magasabb hajlam egy újdonság elfogadására például, és ez egy veszélyes betegség bizonyítéka is lehetne. Vagy láthatóvá válik, hogy a két görbe különböző irányokba halad, ahogyan azt itt a bal oldalon látjuk. Mikor hagyták le a véletlenszerűen kiválasztott mintában szereplő egyének barátai, a véletlenszerűen kiválasztott mintában szereplő egyéneket, és mikor kezdett eltolódni a görbe. És ez, mint ahogyan a fehér vonal mutatja, 46 nappal azelőtt történt, mielőtt a járvány tetőződött volna. Tehát ez egy olyan technika lehet, amely segítségével több mint egy és fél hónapos előrejelzést tudunk adni az influenza járványról egy emberi populáción belül.
I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.
El kell mondanom, hogy az, hogy mennyi idővel korábban kap valaki előrejelzést egy jelenségről, számos tényezőtől függ. Függhet a kórfejlődés természetétől -- különböző kórfejlődésekről, ennek a módszernek az alkalmazásával, különböző figyelmeztetést kapunk -- vagy más terjedő jelenségektől, vagy az emberi közösségi hálózat szerkezetétől. A mi esetünkben, bár nem volt szükséges, feltérképeztük az egyetemisták teljes hálózatát.
So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.
Ez egy 174 diákból álló hálózattérkép, amely tartalmazza baráti kapcsolataikat. Mindjárt mozgásba hozom ezt a térképet. Napi metszeteket készítünk a hálózatról 120 napon keresztül. A piros pontok az influenzás eseteket jelölik, a sárga pontok pedig az influenzások barátait. A pontok mérete arányos az influenzás barátok számával. Minél nagyobb a pont,az illetőnek annál több barátja kapta el a vírust. Ha megnézik ezt a képet -- ez a szeptember 13-i nap -- láthatják, hogy csak néhány eset gyúl ki. Középen az influenzának mintegy a virágzását látják. Most pedig október 19-én vagyunk. A járvány görbéje közeledik novemberben. Bumm, bumm, bumm, bumm, sok-sok kigyulladást látnak ott középen, majd csökken az esetek száma, kevesebb és kevesebb lesz december vége fele. Ez a fajta vizualizáció azt tudja megmutatni, ahogy az ilyenfajta járványok gyökeret vernek, és a központi személyeket fertőzik meg először, mielőtt másokat is megfertőznének.
Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.
Ahogyan utaltam rá, ennek a módszernek alkalmazása nem korlátozódik a vírusokra, hanem bárminek a letapogatására alkalmas, ami egy populáción belül terjed. Az információ is a populációkban terjed. A normák is a populációkban terjednek. A viselkedésminták is a populációkban terjednek. Viselkedés alatt értem például a bűnözői viselkedést, a szavazási veselkedést vagy az egészségügyi viselkedésformákat, mint például a dohányzás vagy a védőoltások beadása, vagy egy-egy terméknek az elfogadása, vagy más viselkedésformák, amelyek személyközi befolyást mutatnak. Az ember környezetében élőket befolyásoló tevékenységek korai előrejelzésére, korai figyelmeztetésre alkalmas ez a technika, amely jelzi a jelenségek terjedését a populáción belül. Működéséhez kulcsfontosságú, hogy olyan jelenségről legyen szó, amely személyről személyre terjed. Nem alkalmas olyan jelenségek terjedésének előrejelzésére, amelyek valamilyen egységes közvetítés következtében egyszerre érintenek mindenkit.
Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.
Ezek az eredmények felhasználhatók -- hálózatokra vonatkozóan -- felhasználhatók más módon is, például kiválasztani bizonyos személyeket a megelőzés érdekében. Talán legtöbbjüknek már ismerős a csordaimmunitás fogalma. Vagyis, ha van egy ezer emberből álló populáció, és ezt immúnissá szeretnénk tenni egy betegséggel szemben, akkor nem kell minden egyes személyt immúnissá tennünk. Ha immúnissá teszünk közülük 960-at, egyenlő azzal, mintha mindenkit imúnnissá tettünk volna. Mert, ha a nem immunizáltak közül egy-két személy meg is fertőződik, nincs, akinek továbbadnia a betegséget. Hiszen immunizált személyekkel vannak körbevéve. Tehát a 96 százalék pont annyira jó, mint a 100 százalék. Tudósok megbecsülték, hogy mi történne, ha egy 30 százalékos véletlenszerű mintát vennének ebből az 1000 emberből, vagyis 300 személyt, és immunizálnák őket. Vajon a populáció immúnissá válna? A válasz: nem. De ha ez a 30 százalék, a 300 személy megnevezné a barátait, beszereznénk ezeknek is a védőoltást, és beoltanánk a 300 személy barátait, a 300 barátot, akkor kialakulna a csordaimmunitás, pont úgy, mintha a populáció 96 százaléka kapott volna oltást, tehát növekszik a hatékonyság, miközben a költségek alacsonyabbak.
And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].
Hasonlóan alkalmazható a módszer például az olyan dolgok szétosztásában, mint az ágyháló a fejlődő országokban. Ha sikerülne megérteni a falvak hálózatának szerkezetét, le lehetne nyomozni, kiknek adják ezeket a dolgokat, hogy elősegítsék terjedésüket. Vagy a különböző termékek reklámkampányának megtervezésében... Ha megértenénk, hogyan célozzuk meg a célközönséget, növelné a hatékonyságát annak, amit el szeretnénk érni. Tulajdonképpen bármilyen forrásból származó adatot felhasználhatunk manapság ennek érdekében.
This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.
Ez nyolcmillió telefonhasználó személy térképe egy európai országban. Minden pont egy személy, minden vonal az emberek közötti telefonbeszélgetéseket jelöli. És ezt a passzív módon begyűjtött adatbázist egész országok feltérkepézésére felhasználhatjuk azért, hogy megtudjuk, ki hol helyezkedik el a hálózaton belül. Anélkül tehát, hogy megkérdeznénk őket, megkaphatjuk a hálózat szerkezeti képét. És más információforrások is, mint ahogyan biztosan önök is tudják, elérhetőek, az e-mailezésen át más online interakciókon keresztül az online közösségi hálózatokig, és így tovább. Tulajdonképpen a masszív-passzív adatgyűjtésnek nevezhető korszakot élünk. Számos módja van annak, hogy ezeket a nagy tételben összegyűjtött adatokat érzékelő hálózatok létrehozására használjuk fel, hogy figyeljük a népességet, megértsük, mi történik a populáción belül, és közbelépjünk a populáció érdekében. Mert ezek az új technológiák nemcsak arról tájékoztatnak, hogy ki beszél kivel, hanem arról is, hogy ki hol helyezkedik el, és mit gondol, például abból kikövetkeztetve, hogy mit tölt fel a világhálóra, vagy hogy mit vásárol, a vásárlásait megfigyelve. És mindezeket az adatokat össze lehet gyűjteni, és feldolgozni az emberi viselkedés megértése érdekében úgy, ahogyan azt eddig nem tették.
So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.
Például, felhasználhatjuk a kamionsofőrök üzemenyag-vásárlási szokását. A kamionsofőrök teszik a dolgukat, és üzemanyagot vásárolnak. Látjuk a növekedést a kamionsofőrök által vásárolt üzemanyag-mennyiségben, és tudjuk, hogy a válság a végéhez közeleg. Vagy megfigyelhetjük a sebességet, amellyel az emberek mobiltelfonukkal az autópályán közlekednek, és a telefonos vállalat láthatja, abból ahogy a sebesség csökken, hogy dugó alakult ki. Ezt az információt visszaküldhetik ügyfeleiknek, de csupán azoknak az ügyfeleknek, akik ugyanazon az autópályán közlekednek, és a közlekedési dugó előtt vannak! Vagy passzívan megfigyelhetjük az orvosok receptírási szokásait, és képet alkothatunk arról, ahogy az új gyógyszerek terjedése történik az orvoshálózatokon belül. Vagy ismét, megfigyelhetjük az emberek vásárlási szokásait, és láthatjuk, hogy ezek a jelenségek emberi populációkon belül terjednek.
And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.
Úgy gondolom, háromféleképpen használhatók fel ezek a nagy tételben passzívan begyűjtött adatok. Az egyik: teljes mértékben passzívan, ahogyan az imént elmondtam -- mint a kamionsofőrös példában, ahol nem befolyásoljuk semilyen módon a populációt. A második mód a kvázi-aktív, ilyen volt az influenzás példa, amelyben megkértük az embereket, hogy nevezzék meg barátaikat, majd passzívan monitorizáltuk a barátaikat -- hogy elkapták vagy sem az influenzát -- majd figyelmeztettük őket. Egy másik példa erre, a telefonos vállalat, ebben az esetben meg lehet nézni, ki foglal el központi helyet a hálózaton belül, majd megkérni őket, hogy küldjék el üzenetben naponta a testhőmérsékletüket. Csak küldjenek egy üzenetet a testhőmérsékletükkel. Így nagy mennyiségű adat gyűl össze az emberek testhőmérsékletéről, de csak azokéról, akik központi helyen találhatók. Így nagyban figyelemmel követhető egy várható járvány az emberektől igényelt minimális hozzájárulással. Vagy végül teljes mértékben aktív is lehet -- amiről az utánam következő előadók is beszélnek majd -- amikor az emberek globálisan részt vesznek wikikben, fényképezéssel vagy szavazásfigyelőkként és feltöltenek információt úgy, hogy mi ezt összegyűjthessük, a társadalmi folyamatok vagy társadalmi jelenségek megértése érdekében.
In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.
Ezeknek az adatoknak az elérhetősége, azt hiszem, egy új korszakot jelez, amit én és mások a komputációs társadalomtudományok korszakának nevezünk. Ez valami olyasmi, amikor Galileó felfedezte -- vagy nem fedezte fel -- a teleszkóp használatát, és az eget egészen más módon látta, vagy amikor Leeuwenhoek feltalálta a mikroszkópot -- és teljesen más szemszögből látta a biológiát. Most hozzáférünk ezekhez az adatokhoz, amelyek lehetővé teszik, hogy a társadalmi folyamatokat és a társadalmi jelenségeket teljesen más módon szemléljük, ami ezelőtt nem volt lehetséges. Ezzel a tudománnyal pontosan megérthetjük, hogy az egész miért jelent többet, mint a részek összege. És ezeket a felfedezéseket arra használhatjuk, hogy a társadalmat és az emberi jólétet fejlesszük.
Thank you.
Köszönöm.