For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.
În ultimii 10 ani, mi-am petrecut timpul încercând să-mi dau seama cum și de ce oamenii se organizează în rețele sociale. Și rețelele sociale despre care vorbesc nu fac parte din recenta varietate online ci, mai degrabă, din tipul de rețele sociale în care oamenii se organizează de sute de mii de ani, încă de când au apărut în savana africană. Deci eu formez relații de prietenie, de colegialitate, relații între frați sau de rudenie, cu alți oameni, care, la rândul lor, stabilesc aceleași tipuri de relații cu alți oameni. Şi acest proces se extinde la nesfârşit. Ce obții este o rețea care arată astfel. Fiecare punct reprezintă o persoană. Fiecare linie care le unește reprezintă relația dintre acele persoane -- diferite tipuri de relații. Și poți obține o reprezentare a acestei vaste țesături a umanității, în care toți suntem încorporați.
And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.
Colegul meu, James Fowler, și cu mine studiem de ceva vreme care sunt regulile matematice, sociale, biologice și psihologice care guvernează modul în care aceste rețele sunt formate și care sunt regulile, similare, care guvernează modul lor de operare și modul în care ne afectează viețile. Și, recent, am început să ne întrebăm dacă am putea să profităm de pe urma acestor intuiții, în așa fel încât să facem lumea un loc mai bun, să facem ceva mai bine, să remediem ceva, nu doar să înțelegem. Astfel, unul din primele lucruri pe care le-am avea în vedere ar fi cum am putea prezice epidemii.
And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.
Stadiul actual în acest domeniu -- dacă faci parte din CDC sau altă instituție națională -- este să stai în locul în care ești deja şi să colectezi date de la medici și laboratoare specializate care raportează prevalenţa sau incidenţa anumitor afecțiuni. Atâți pacienți au fost diagnosticați cu o boală [aici], sau atâți pacienți au fost diagnosticați [acolo], toate aceste date sunt introduse într-un repertoriu central, cu o anumită întârziere. Și, dacă totul funcționează cum trebuie, o săptămână sau două mai târziu, vei știi unde s-a aflat epidemia azi. Și, de fapt, acum un an, a apărut această idee de Google Flu Trends, în ceea ce privește gripa, în care, dacă studiem tiparele căutărilor oamenilor azi, am putea ști unde gripa... care a fost starea epidemiei azi, care a fost prevalența epidemiei azi.
But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.
Dar ce aș vrea să vă arăt azi este o metodă prin care putem obține nu doar alertare rapidă în cazul unei epidemii, dar de asemenea și detectarea din timp a unei epidemii. Și, de fapt, această idee poate fi folosită nu doar pentru predicția epidemiilor microbiene, dar, de asemenea, pentru predicția oricărui tip de epidemie. De exemplu, orice se răspândește printr-o formă de contagiune socială poate fi înțeles în acest fel, de la idei abstracte, la stânga, precum patriotismul, altruismul, sau religia, până la practici precum dietele, sau achiziționarea de cărți, consumul de alcool, practicile de siguranță, sau produsele pe care oamenii le-ar cumpăra, achizițiile de bunuri electronice, orice are vreo înclinație către o răspândire interpersonală. Un tip de difuzie a inovațiilor poate fi înțeles și prezis de mecanismul pe care îl voi prezenta acum.
So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.
După cum probabil știți, modul clasic de a privi problema este "răspândirea-inovației". sau curba de adoptare. Aici, pe axa Y, avem procentul de oameni afectați, și pe axa X, avem timpul. La început, nu foarte multe persoane sunt afectate, și obținem această curbă clasică sigmoidă, sau de forma literei S. Motivul pentru care obținem această formă este că, la început, să spunem, unul sau doi oameni sunt afectați, sau infectați, și apoi afectează, sau infectează, doi oameni, care, la rândul lor, infectează patru, opt, 16 și aşa mai departe, astfel obținând porțiunea din curbă care indică creșterea. Până la urmă, saturezi populația. Din ce în ce mai puțini oameni mai pot fi infectați, și aşa obții porțiunea de platou a curbei, rezultatul fiind această formă clasică sigmoidă. Același lucru este valabil pentru microbi, idei, produse noi, comportamente, și altele. Dar aceste lucruri nu se propagă în rândurile populației aleatoriu. Ele, de fapt, se propagă prin rețele. Pentru că, așa cum am spus, noi înșine trăim în rețele, și aceste rețele au un anumit tip de structură.
Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.
Dacă te uiţi la o reţea ca aceasta... Aici sunt 105 oameni. Și liniile reprezintă... punctele sunt oamenii, iar liniile reprezintă relațiile de prietenie. Puteți vedea că oamenii ocupă locații diferite în cadrul rețelei. Și sunt diverse tipuri de relații între oameni. Ai putea avea relații de prietenie, relații intre frați, relații între soți, sau între colegi de serviciu, relații între vecini, și altele. Și multe alte lucruri se propagă de-a lungul multor altor tipuri de legături. De exemplu, bolile cu transmitere sexuală se vor propaga de-a lungul legăturilor sexuale. Sau, de exemplu, obiceiul de a fuma poate fi generat de anturaj. Sau comportamentul altruist sau caritabil poate fi influențat de colegii de muncă, sau de către vecini. Dar nu toate pozițiile în rețea sunt identice.
So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.
Dacă vă uitați aici, v-ați putea da seama imediat că persoane diferite au numărul de conexiuni diferit. Unii oameni au o conexiune, alții au două, unii au șase, iar alții au 10. Această caracteristică se numește "gradul" unui nod, sau numărul de conexiuni pe care le are un nod. Dar, în plus, mai e ceva. Dacă te uiți la nodurile A și B, ambele au câte șase conexiuni. Dar dacă ai vedea această imagine de undeva de deasupra, ai observa că ceva diferă într-o măsură foarte mare în ce privește nodurile A şi B. Aşa că, lăsați-mă să vă întreb -- vă pot ajuta să înțelegeți cu o întrebare -- cine ai prefera să fii, dacă un microb letal s-ar răspândi prin rețea, A sau B? (Audienta: B.) Nicholas Christakis: B, este evident. B e așezat la marginea rețelei. Acum, cine ai prefera să fii dacă o bârfă interesantă s-ar răspândi prin rețea? A. Și înțelegi imediat că e mai probabil ca A să intre în contact cu orice se propagă în rețea și să o facă mai devreme în virtutea poziției sale în structura rețelei. A, de fapt, este mai central, și asta poate fi exprimată matematic. Aşa că, dacă vrem să dăm de urma a ceva ce se propagă prin rețea, ce ar trebui să facem este să folosim senzori conectați la indivizii centrali din cadrul rețelei, incluzând nodul A, monitorizând acei oameni care sunt acolo, în centrul rețelei, și, cumva, obținând o detecție precoce a orice s-ar propaga prin rețea.
So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.
Adică, dacă ei ar intra în contact cu vreun microb sau o informație, ai știi că, ulterior, toți ceilalți vor intra în contact cu acel microb sau acea informație. Această metodă este mult mai bună decât cea bazată pe șase oameni aleși aleatoriu, fără a lua în calcul structura populației. Și, de fapt, dacă ai putea face asa ceva, ai obține ceva de genul acesta. În partea stângă, din nou, avem curba adoptării, în forma de S. Linia punctată roșie indică cum ar arăta adoptarea într-un eșantion aleatoriu, iar linia din stânga, trecută la stânga, indică cum ar arăta adoptarea luând în calcul indivizii centrali ai rețelei. Pe axa Y se află stadiile contagiunii, luate cumulativ, iar pe axa X se află timpul. În partea dreaptă avem aceleași date, dar, de data asta, în funcție de incidenţa zilnică. Și ce vrem să arătăm aici -- aici -- foarte puţini oameni sunt afectați, din ce în ce mai mulţi și până aici, sus, unde avem vârful epidemiei. În stânga, avem o reprezentare a ce se întâmplă cu indivizii centrali. Și această diferență în timp dintre cele două e detecția precoce, acel preaviz pe care îl putem obține, despre o epidemie iminentă într-o anumită populație.
The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.
Problema, totuși, e că o cartografiere precisă a rețelelor sociale nu este întotdeauna posibilă. Poate fi prea scumpă, [prea dificilă], poate să nu fie etică, sau, chiar, poate să nu fie posibilă. Deci cum ne putem da seama cine sunt indivizii centrali într-o rețea fără a cartografia rețeaua? Am venit cu ideea de a exploata un fapt vechi, cunoscut, despre rețelele sociale, care sună așa: Știi că prietenii tăi au mai mulţi prieteni decât tine? Prietenii tăi au mai mulţi prieteni decât tine. E cunoscut ca paradoxul prieteniei. Imaginați-vă o persoană foarte populară în rețeaua socială -- cum ar fi gazda unei petreceri cu sute de prieteni -- și un mizantrop care are un singur prieten, și alegi pe cineva aleatoriu din populație; acel cineva e mult mai probabil să fie conectat cu gazda petrecerii. Și dacă acea persoană nominalizează gazda ca prieten, atunci acea gazdă are o sută de prieteni, deci are mai multi prieteni decât persoana aleasă aleatoriu. Și acesta, în esență, este paradoxul prieteniei. Prietenii unor indivizi aleși aleatoriu au grade mai mari și sunt mai centrali, decât indivizii pe care îi alegem aleatoriu.
And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.
Puteți aprecia acest fapt, la nivel intuitiv, dacă vă imaginați doar oamenii de la periferia rețelei. Dacă alegeți o persoană, singurul prieten pe care aceasta îl poate nominaliza, este unul care prin definiție are cel puțin doi prieteni, și, de obicei, mai multi prieteni. Acest fapt apare la orice nod periferic. De fapt, același lucru se întâmplă pe măsură ce înaintăm înspre interiorul rețelei, pe oricine ai alege, atunci când nominalizez aleatoriu... când o persoană la întâmplare își nominalizează un prieten, ajungem mai aproape de centrul rețelei. Ne-am gândit să exploatăm această idee pentru a studia dacă putem prezice fenomene în interiorul rețelelor. Pentru că acum, cu această idee, putem extrage un eșantion aleatoriu de oameni, să îi rugăm să își nominalizeze prietenii, și acei prieteni vor fi automat mai centrali, şi putem face asta fără să trebuiască să cartografiem rețeaua.
And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.
Am testat această idee la apariția gripei H1N1 la Colegiul Harvard în toamna și iarna lui 2009, acum doar câteva luni. Am ales un eșantion aleatoriu de 1.300 de studenți, i-am rugat să își nominalizeze prietenii, și i-am urmărit atât pe studenții din eșantion, cât și pe prietenii lor zilnic să vedem dacă contractează sau nu gripa. Am făcut acest lucru pasiv, observând dacă au apelat la serviciile medicale ale universității. De asemenea, i-am rugat să ne scrie prin e-mail de câteva ori pe săptămână. S-a întâmplat exact ce am prezis. Grupul aleatoriu este reprezentat de linia roșie. Epidemia în grupul prietenilor apare la stânga, acolo. Diferența între cele două este de 16 zile. Monitorizând grupul prietenilor, putem fi preveniți cu 16 zile înainte despre o epidemie iminentă în populație.
Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.
În plus, în calitate de analist care încearcă să studieze o epidemie sau să prezică adoptarea unui produs, de exemplu, ce ai putea face este să alegi un eșantion aleatoriu din populație, și, în același mod, să îi rogi să-și nominalizeze prietenii, iar tu să-i urmărești, atât pe cei din eșantion, cât și pe prietenii lor. Între prieteni, primul semn al unei variații peste 0 în adoptarea unei inovații, de exemplu, dovedește iminența unei epidemii. Sau ai putea observa prima divergență între cele două curbe, după cum apare în stânga. Când au început cei aleși aleatoriu... când au început prietenii să se despartă de cei aleși aleatoriu, și când a început curba să se desprindă? Și aceasta, așa cum indică linia albă, s-a întâmplat cu 46 de zile înainte de punctul maxim al epidemiei. Deci aceasta ar fi o tehnică prin care am putea obține o avertizare cu o lună și jumătate înainte. despre o epidemie într-o anumită populație.
I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.
Aș spune că avansul cu care primești un astfel de avertisment depinde de o multitudine de factori. Ar putea depinde de natura patogenului -- patogeni diferiți, folosind această tehnică, permit avertismente diferite -- sau alte fenomene care se răspândesc, sau, pur și simplu, de structura rețelei umane. Acum, în cazul nostru, deși nu a fost necesar, am putut cartografia rețeaua de studenți.
So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.
Aşa, am obținut o hartă cu 714 studenți și legăturile de prietenie dintre ei. Și într-un minut, voi pune în mișcare această hartă. Vom avea în vedere secțiuni zilnice prin rețea timp de 120 zile. Punctele roșii sunt cazurile de gripă, iar punctele galbene sunt prietenii persoanelor cu gripă. Și mărimea punctului este proporțională cu numărul prietenilor care au gripă. Deci, cu cât punctul este mai mare, cu atât mai mulţi prieteni au gripă. Și dacă vă uitați la această imagine -- aici suntem în data de 13 septembrie -- veți vedea că apar câteva cazuri. Veți vedea o înflorire a gripei în mijloc. Aici suntem în data de 19 octombrie. Panta curbei epidemiei se apropie de acest moment, în noiembrie. Bang, bang, bang, bang, bang, veți vedea multe cazuri în mijloc, și apoi un fel de nivelare, din ce în ce mai puține cazuri către finele lui decembrie. Și acest tip de vizualizare poate indica faptul că epidemii de genul acesta își au originea și afectează mai întâi indivizi centrali, înainte de a-i afecta pe alții.
Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.
Acum, după cum am sugerat, această metodă nu este aplicabilă doar microbilor, ci, de fapt, oricărui lucru care se poate răspândi într-o populație. Informația se răspândește în populație. Normele se pot răspândi în populație. Comportamentele se pot răspândi în populație. Și, prin comportament, înțeleg lucruri precum comportamentul infracțional sau comportamentul de vot, sau comportamentul legat de sănătatate, precum fumatul sau vaccinarea, sau adoptarea de produse, sau alte tipuri de comportamente care se leagă de influenţa interpersonală. Dacă sunt înclinat să fac ceva care îi afectează pe cei din jur, această tehnică poate avertiza, sau poate detecta din timp, adoptarea comportamentului în masa populației. Cheia este că, pentru a funcționa, trebuie să existe influenţă interpersonală. Nu se poate lega de vreo metodă de propagare care îi afectează pe toți uniform.
Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.
Aceleași idei pot fi exploatate -- în ceea ce privește rețelele -- pot fi exploatate în alte moduri, de exemplu, în vizarea anumitor persoane pentru intervenții. De exemplu, cei mai multi dintre voi sunteți familiarizaţi cu noțiunea de "imunitate de turmă". Deci, dacă avem o populație de o mie de persoane, şi vrem să imunizăm populația la un anumit patogen, nu e nevoie să imunizăm toate persoanele. Dacă imunizăm 960 dintre ei, e ca și cum i-am fi imunizat în proporție de 100%. Pentru că, deși dacă unul sau doi dintre cei ne-imunizați e infectat, nu au cum să-i infecteze pe alții. Ei sunt înconjurați de persoane imune. Aşa că un procentaj de 96 este la fel de bun ca unul de 100. Ei bine, unii oameni de știință au estimat ce s-ar întâmpla dacă ai lua un eșantion aleatoriu de 30 de procente din acești 1.000 de oameni, 300, și i-ai imuniza. Ai obține vreo imunitate la nivelul populației? Răspunsul este nu. Dar, dacă ai lua acest procentaj, acești 300 de oameni, și i-ai pune să își nominalizeze prietenii și ai folosi același număr de doze de vaccin și ai vaccina prietenii celor 300, cei 300 de prieteni, poți obține același nivel de imunitate de turmă ca atunci când ai vaccina un procentaj de 96 din populație cu o eficiență mult mai mare, cu o constrângere bugetară strictă.
And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].
Idei similare pot fi folosite, de exemplu, pentru țintirea distribuției unor lucruri precum plasele împotriva țânțarilor în statele în curs de dezvoltare. Dacă am putea înțelege structura rețelelor în sate, am putea ținti beneficiarii unor astfel de intervenții pentru a obține răspândirea dorită. Sau, sincer, pentru publicitatea diferitelor tipuri de produse. Dacă am putea înțelege cum să țintim, asta ar putea afecta eficiența a ceea ce încercăm să obținem. Și, de fapt, putem folosi date dintr-o multitudine de surse în ziua de azi.
This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.
Aceasta este o hartă cu opt milioane de utilizatori de telefonie într-o țară europeană. Fiecare punct este o persoană, iar fiecare linie reprezintă volumul convorbirilor telefonice dintre persoane. Putem folosi astfel de date, obținute pasiv, să cartografiem aceste ţări în întregime și să înțelegem cine este așezat unde în cadrul rețelei. Fără a fi nevoie să îi contactăm, putem obține astfel de perspective structurale. Și alte surse de informație, după cum bine știți, sunt disponibile pentru caracteristici precum interacțiuni pe e-mail, interacțiuni online, rețele sociale online, și așa mai departe. Și, de fapt, suntem într-o epocă a ceea ce eu aş numi eforturi de colectare de date "masiv-pasive". Sunt multe moduri în care putem folosi date obținute astfel pentru a crea rețele de senzori pentru a urmări populația, a înțelege ce se întâmplă în populație, și a interveni la nivelul populației pentru a face bine. Pentru că aceste noi tehnologii ne spun nu doar cine vorbește cu cine, dar și unde se află, și ce gândește fiecare, bazându-se pe conținutul încărcat de aceștia pe Internet, și ce cumpăra fiecare, bazându-se pe achizițiile lor. Toate aceste date administrative pot fi agregate și procesate pentru a înțelege comportamentul uman într-un mod imposibil până acum.
So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.
Deci, de exemplu, putem folosi achizițiile de combustibil ale conducătorilor de camioane. Deci camionagii își văd de treabă, și cumpără combustibil. Iar noi vedem o creștere a achizițiilor lor de combustibil, și știm că recesiunea e aproape de sfârșit. Sau putem monitoriza viteza cu care oamenii se deplasează pe autostradă folosind telefoanele și compania de telefonie poate vedea, atunci când viteza e în descreștere, că există un ambuteiaj. Iar ei pot trimite informația înapoi la abonați, dar doar abonaților aflați pe acea autostradă aflați în spatele ambuteiajului! Sau putem monitoriza pasiv comportamentul medicilor de a prescrie medicamente și putem vedea cum arată răspândirea inovațiilor din domeniul farmaceutic în interiorul rețelei de medici. Sau, din nou, putem monitoriza comportamentul de achiziție al oamenilor, și putem observa cum acest gen de fenomene se pot propaga în populație.
And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.
Sunt trei moduri, cred, în care aceste date masiv-pasive pot fi folosite. Unul dintre ele este în totalitate pasiv, așa cum am arătat -- aşa ca, de exemplu, situația camionagiilor, unde nu intervenim de fapt la nivelul populației în niciun fel. Unul este cvasi-activ, ca în exemplul gripei pe care l-am dat, unde putem ruga câteva persoane să își nominalizeze prietenii și apoi, pasiv, să îi monitorizam pe aceștia -- au sau nu au gripă? -- și astfel să fim avertizați. Un alt exemplu ar fi, dacă ești o companie telefonică, îți dai seama cine se află în centrul rețelei, și îi întrebi "Uite, vrei să ne trimiți zilnic un mesaj în care să ne spui dacă ai sau nu febră? Doar trimite-ne un mesaj cu temperatura ta." Și colectezi cantități mari de informație despre temperatura oamenilor, dar de la indivizi localizați central. Și poți, pe scară largă, să monitorizezi o epidemie iminentă cu o contribuție minimă din partea oamenilor. Sau, în cele din urmă, poate fi vorba despre ceva activ -- după cum știu că vor aminti și alți co-vorbitori azi -- unde oamenii pot participa global la platforme de tip "wiki", sau prin fotografii, sau monitorizând alegeri, și încărcând informația într-un mod care să ne permită să o agregăm pentru a înțelege procese sociale și fenomene sociale.
In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.
De fapt, disponibilitatea unor astfel de date, cred, prevestește o nouă epocă a ceea ce eu, dar și alții, numim "știință socială computațională" E ca atunci când Galileo a inventat -- sau, nu a inventat -- a ajuns să folosească telescopul și a putut privi cerul într-un nou mod, sau Leeuwenhoek a aflat despre microscop -- sau, de fapt, l-a inventat -- și a putut vedea biologia într-un nou mod. Dar acum avem acces la aceste tipuri de date care ne permit să înțelegem procesele sociale și fenomenele sociale într-un mod cu totul nou, imposibil până acum. Și cu acest tip de știință, putem înțelege exact cum întregul ajunge să fie mai mult decât suma părților sale. Și, de fapt, putem folosi aceste informații pentru a îmbunătăți societatea și a creşte bunăstarea omului.
Thank you.
Vă mulțumesc.