Nicholas Christakis: How social networks predict epidemics

В последните 10 години прекарвам времето си, опитвайки се да разбера, как и защо човешките същества се събират в социални мрежи. И не говоря за социалните мрежи от наскорошните онлайн разновидности, а по-скоро, за вида социални мрежи, в които човешките същества се събират от стотици хиляди години, откакто сме произлезли от африканската савана. И така, аз формирам приятелства и връзки с колеги, роднини и относителни връзки с други хора, които от своя страна имат подобни отношения с други хора. И това се разпростира безкрайно надалеко. Получавате мрежа, която изглежда така. Всяка точка е човек. Всяка линия между тях е връзка между двама души -- различни видове връзки. И можете да получите този вид голяма структура на човечеството, в която всички сме вградени.

For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.

И моят колега, Джеймс Фаулър, и аз изучаваме от известно време, какви са математическите, социалните, биологичните и психологическите правила, които управляват как тези мрежи са образувани, и какви са сходните правила, които управляват как те функционират, как засягат нашия живот. И наскоро започнахме да се чудим, дали не би било възможно да се възползваме от това прозрение, всъщност да намерим начини за подобряване на света, да направим нещо по-добро, всъщност да оправяме неща, а не само да ги разбираме. Така че едно от първите неща, които си мислим, че ще преборим, е как ще прогнозираме епидемиите.

And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.

Сегашния най-развит метод за прогнозиране на епидемия -- ако сте Центъра по контрол и профилактика на заболяванията [на англ. CDC] или друг национален орган -- е да стоите по средата, където сте, и да събирате данни от лекари и лаборатории в областта, които докладват за преобладаването, или разпространението на определени заболявания. Толкова, толкова и толкова пациента са диагностицирани с нещо, или други пациенти са диагностицирани, и всички тези данни се вкарват в централно хранилище с известно закъснение. И ако всичко върви гладко, след 1-2 седмици ще знаете къде е била епидемията днес. И всъщност преди около една година беше обявена идеята за Гугъл грипни тенденции, по отношение на грипа, където, гледайки поведението на търсене на хората днес, бихме могли да знаем къде грипа ... какво е състоянието на епидемията днес, какво е разпространението на епидемията днес.

And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.

Но това, което бих искал да ви покажа днес е средство, чрез което можем да получим, не само бързо предупреждение за епидемия, но също и ранно откриване на епидемия. И всъщност, тази идея може да се използва не само за предсказване на епидемия от микроби, но също и да предсказва епидемии от най-различен вид. Например, всичко, което се разпространява като един вид социална зараза, може да бъде разбрано по този начин, от абстрактни идеи от една страна, като патриотизъм, или алтруизъм, или религия, до практики като диетично поведение, или купуване на книги, или пиене, или велосипедна-каска [и] други практики за безопасност, или продукти, които хората могат да купуват, покупка на електронни стоки, всичко, в което има нещо като междуличностно разпространение. Нещо като разпространение на иновациите може да бъде разбрано и прогнозирано от механизма, който ще ви покажа сега.

But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.

И така, както всички от вас може би знаят, класическия начин да си мислим за това е разпространението на иновациите, или "кривата на усвояване." Така, тук по оста Y е процента на засегнатите хора, и по оста X е времето. И в самото начало, засегнатите хора не са твърде много, и ще получите тази класическа сигмоида, или S-образна крива. И причината за тази форма е, че в самото начало, да приемем, че един или двама души са засегнати, или заразени от нещото, и след това те засягат, или заразяват, двама човека, които на свой ред засягат четири, осем, 16 и т.н., и получавате фазата на растеж на епидемията върху кривата. И накрая, населението се насища. Има все по-малко хора, които все още са на разположение, за да могат да бъдат заразени, и тогава получавате платото на кривата, и ще получите тази класическа S-образна крива. И това се отнася и за микроби, идеи, възприемане на продукти, поведение и други подобни. Но нещата не се разпространяват на случаен принцип в човешките популации. Те всъщност се разпространяват чрез мрежи. Понеже, както казах, ние живеем живота си в мрежи, и тези мрежи имат определен вид структура.

So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.

Сега, ако се вгледате в мрежа като този ... Това са 105 души. И линиите представляват ... точките са хората, а линиите представляват приятелски отношения. Можете да видите, че хората заемат различни места в мрежата. И има различни видове взаимоотношения между хората. Може да има приятелски взаимоотношения, отношения между братя и сестри, съпружески взаимоотношения, колегиални отношения, съседски взаимоотношения и други подобни. И различни видове неща, разпространени в различни видове връзки. Например, полово предавани болести, ще се разпространяват чрез сексуални връзки. Или например, пушенето на хората, може да бъде повлияно от техните приятели. Или тяхното алтруистично или благотворително поведение, може да бъде повлияно от колегите им, или от техните съседи. Но не всички позиции в мрежата са еднакви.

Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.

Така че, ако се вгледате в това, може незабавно да схванете, че различните хора имат различен брой връзки. Някои хора имат една връзка, някои са с две, някои имат шест, други са с десет връзки. И това се нарича степен на един възел, или броя на връзките, които има един възел. Но, освен това, има нещо друго. Така например, ако погледнете възлите А и Б, те и двата имат шест връзки. Но ако видите тази диаграма от птичи поглед, можете да оцените, че има нещо много различно между възлите А и Б. Така че, нека да ви попитам -- мога да направя това интуитивно, като задам въпрос -- кой бихте искали да бъдете, ако смъртоносен вирус се разпространява през мрежата, А или Б? (Публиката: Б.) Николас Христакис: Б, това е очевидно. Б се намира на края на мрежата. Сега, кой бихте искали да бъдете, ако пикантна клюка са разпространява през мрежата? А. И можете да оцените непосредствено, че А е по-вероятно да получи новината, която се разпространява, и да я получи по-скоро, благодарение на структурното си разположение в рамките на мрежата. А, всъщност, е по-централен, и това може да се формализира математически. Така че, ако искаме да проследим нещо, което се разпространява през мрежа, това, което в идеалния случай бихме искали да направим, е да поставим сензори на централните лица в рамките на мрежата, включително възел А, и да наблюдаваме тези хора, които са там в средата на мрежата, и някак си да открием рано, каквото и да се разпространява чрез мрежата.

So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.

Така че, ако ги видите да получават вирус, или информация, ще знаете, че доста скоро, всеки ще е на път да получи този вирус, или тази информация. И това ще бъде много по-добре, отколкото да се наблюдават шест произволно избрани хора, без оглед на структурата на населението. И всъщност, ако бихме могли да направим това, това, което ще видим е нещо подобно на таблото от лявата страна, отново, имаме S-образна крива на усвояване. С пунктираната червена линия показваме, какво ще бъде усвояването при случайни хора, и на линията от ляво, изместена на ляво, показваме какво ще е усвояването при индивидите, разположени в централната част на мрежата. По оста Y са сумарните случаи на зараза, а по оста X е времето. И от дясната страна, показваме същите данни, но с дневни инциденти. И това, което показваме тук е - като, тук -- много малко хора са засегнати, все повече, и повече, и повече до тук, и тук е пикът на епидемията. Но изместено наляво е това, което се случва при индивидите в центъра. И тази разлика във времето между двете групи е ранното откриване, ранното предупреждение, което можем да получим, за предстоящата епидемия в човешката популация.

So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.

Проблемът, обаче е, че пълното описание на човешките социални мрежи е не винаги възможно. Може да бъде скъпо, [неосъществимо], неетично, или, честно казано, просто не е възможно да се направи такова нещо. И така, как можем да разберем, кои са хората в центъра на мрежата, без всъщност да описваме мрежата в детайли? Това, което ни хрумна беше идеята да се използва една много стара практика, или известен факт за социалните мрежи, който гласи нещо от сорта на: Знаете ли, че вашите приятели имат повече приятели от вас? Вашите приятели имат повече приятели от вас. И това е известно като парадокса на приятелството. Представете си един много популярен човек в социалната мрежа -- като домакин на парти, който има стотици приятели -- и мизантроп, който има само един приятел, и вие избирате някого на случаен принцип от населението; той е много по-вероятно да познава домакина на партито. И ако те определят домакина на партито като свой приятел, този домакин на парти има сто приятели, следователно, има повече приятели, отколкото тях. И това по същество е известно като парадокса на приятелството. Приятелите на случайно избрани хора имат по-висока степен и са по-централни, отколкото самите случайни хора.

The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.

Можете да получите интуитивна представа за това, ако си представите само хората в периметъра на мрежата. Ако изберете този човек, единственият приятел, който той трябва да избере, е този човек, който по построение, трябва да има поне двама, и обикновено повече приятели. И това се случва със всеки периферен възел. И всъщност, това се случва в рамките на цялата мрежа, докато се придвижвате навътре, всекиго, когото изберете, ако те номинират случайно ... когато случаен човек номинира свой приятел, се придвижвате по-близо до центъра на мрежата. Така че, ние решихме, че можем да използваме тази идея, за да проучим дали можем да предскажем явления в мрежи. Защото сега, с тази идея, можем да вземем случайна извадка от хора, да ги накараме да номинират своите приятели, тези приятели ще бъдат по-централни, и можем да направим това, без да се налага да съставяме карта на мрежата.

And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.

И ние тествахме тази идея с разпространението на H1N1 грип в Харвардския колеж, през есента и зимата на 2009 година, само преди няколко месеца. Взехме 1300 случайно подбрани студенти, накарахме ги да номинират своите приятели, и следвахме както случайно избрани студенти, така и техните приятели, ежедневно във времето, за да видим дали те имат, или не, грипна епидемия. И ние правихме това пасивно, гледайки дали те са ползвали, или не, университетския здравен център. И също така, те трябваше да ни пишат няколко пъти в седмицата. Случи се точно това, което предсказахме. Случайната група е с червената линия. Епидемията в групата на приятелите се измести наляво, до тук. И разликата в двете е 16 дни. Чрез наблюдение на групата приятели, можахме да получим 16 дни предупреждение в аванс, за предстояща епидемия в тази човешка популация.

And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.

Сега, в допълнение към това, ако сте анализатор, който се опитва да изучава епидемиите, или да предвиди усвояването на даден продукт, например, това, което бихте могли да направите, е да изберете случайна извадка от населението, да ги накарете да номинират своите приятели и да проследите приятелите, и да следвате както случайните хора, така и приятелите. Сред приятелите, първото доказателство, което видите за покачване над нулата в усвояването на иновациите, например, ще бъде доказателство за предстояща епидемия. Или можете да видите първия път, когато двете криви се разклоняват, както е показано в ляво. Кога случайните ... кога приятелите се отделят и оставят случайните хора, и техните криви започват да се отместват? И това, както е показано от бялата линия, настъпи на 46 ден, преди пика на епидемията. Така че това може да бъде техника, с която бихме могли да получим повече от месец и половина предупреждение, за грипна епидемия в определена популация.

Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.

Трябва да кажа, че колко ранно предупреждение може да се получи за нещо, зависи от множество фактори. Може да зависи от естеството на патогените -- при различни патогени, използвайки тази техника, може да получите различни предупреждения -- или различни явления, които се разпространяват, или, честно казано, от структурата на човешката мрежа. Сега, в нашия случай, въпреки че не беше необходимо, можехме да направим карта на мрежата на студентите.

I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.

Така че, това е картата на 714 студенти и техните приятелски връзки. И след една минута ще оживя тази карта. Ще направим дневни снимки на мрежата за 120 дни. Червените точки ще са случаите на грип, а жълтите точки ще бъдат приятели на хората с грип. И размерът на точките ще бъде пропорционален на това, колко много от техните приятели имат грип. Така че по-големите точки означават, че повече от вашите приятели имат грип. И ако се вгледате в тази графика -- това е от 13-и септември -- можете да видите само няколко случаи да проблясват. Може да видите растежа на грипа по средата. Това е от 19-и октомври. Наклонът на епидемичната крива се приближава сега през ноември. Бам, бам, бам, бам, бам, ще видите много растеж в средата, и след това ще видите нещо като стабилизиране, и все по-малко случаи към края на декември. И този тип визуализация показва, че епидемии като тази, се закореняват и засягат първо индивидите в центъра, преди да засегнат останалите.

So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.

Сега, както споменах, този метод не се ограничава до микроби, но всъщност до всичко, което се разпространява в популациите. Информацията се разпространява в популациите. Норми може да се разпространяват в популациите. Поведения могат да се разпространяват в популациите. И под поведения, имам предвид неща като престъпно поведение, или избирателно поведение, или здравно поведение, като тютюнопушене, или ваксинация, или усвояване на продукт, или други видове поведения, които се отнасят до междуличностното влияние. Ако мога да направя нещо, което да засегне другите около мен, тази техника може да получи ранно предупреждение, или ранно откриване, за усвояването в населението. Ключовото нещо в това, за да работи е, че трябва да има междуличносто влияние. Не може да се дължи на някакъв предавателен механизъм, който засяга всички по еднакъв начин.

Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.

Сега, същите прозрения, също може да бъдат използвани -- по отношение на мрежите -- също могат да бъдат използвани по други начини, например, при използването на фокусиране на определени хора за интервенции. Така например, повечето от вас вероятно са запознати с понятието за стаден имунитет. Така че, ако имаме популация от хиляда души, и искаме да направим населението имунно към патогени, ние не трябва да имунизираме всеки един човек. Ако имунизираме 960 от тях, ще бъде същото, както ако имунизираме сто [процента] от тях. Защото, ако дори един или двама от неимунизираните хора станат заразени, няма да има кого да инфектират. Ще са заобиколени от имунизирани хора. Така че 96% е почти като 100%. Е, някои други учени изчислиха, какво ще се случи, ако се направи 30 процентова случайна извадка на тези 1300 души и ги имунизираме. Дали ще получим някакво ниво на имунитет на населението? И отговорът е, не. Но ако вземете тези 30 процента, тези 300 души, и ги накарате да номинират своите приятели, и вземете същия брой ваксини, и ваксинирате приятелите на 300-та, 300-та приятели, ще получите същото ниво на стаден имунитет, все едно сте ваксинирали 96% от населението, при много по-голяма ефективност, със строго ограничен бюджет.

Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.

И подобни идеи могат да бъдат използвани, например, за разпределението на неща, като мрежи за легла, в развиващия се свят. Ако можем да разберем структурата на мрежите в селата, може да насочим към кого да дадем интервенциите, за насърчаването на тези видове покривала. Или, честно казано, за рекламиране на всякакви видове продукти. Ако можем да разберем как да се фокусираме, това ще повлияе на ефективността, на това, което се опитваме да постигнем. И в действителност, можем да използваме данни от различни видове източници, [за да правим това] днес.

And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].

Това е карта на осем милиона телефонни потребители в една европейска държава. Всяка точка е човек, и всяка линия представлява обемът на разговорите между хората. И можем да използваме такива данни, които са пасивно получени, за да опишем целите тези страни, и да разберем кой къде се намира в рамките на мрежата. Без всъщност да се налага да ги питаме, можем да получим това структурно наблюдение. И други източници на информация, както без съмнение ви е известно, са на разположение, за информация като електронни взаимодействия, онлайн взаимодействия, онлайн социални мрежи и други. И всъщност, ние сме в ерата на това, което бих нарекъл масивни-пасивни усилия за събиране на данни. Има всякакви начини за използване на масово събирани данни за създаване на сензорни мрежи, които да следат населението, разбират какво се случва в населението и да се намесват в населението за по-добро. Понеже тези нови технологии ни казават, не само кой говори с кого, но и къде е всеки, и това, което мислят, въз основа на това, което качват в интернет, и това, което купуват, въз основа на техните покупки. И всички тези административни данни могат да бъдат използвани заедно и обработени, за да разберем поведението на хората, по начин, по който не сме могли да го сторим преди.

This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.

Така например, бихме могли да използваме покупките на гориво на шофьорите на камиони. И така, шофьорите на камиони развиват търговията си, и те закупуват гориво. И когато видим нарастване в покупките на гориво на шофьорите на камиони, знаем, че рецесията е на път да свърши. Или можем да наблюдаваме скоростта, с която хората се движат с телефоните си по магистралата, и телефонната компания може да види, докато скоростта намалява, че има задръстване. И те могат да изпратят тази информация обратно на своите абонати, но само на абонатите си по същата магистрала, намираща се зад задръстването. Или можем да следим лекарското поведение на изписване на лекарства, пасивно, като видим как разпространението на иновациите с фармацевтични продукти се случва при лекарите. Или отново, можем да наблюдаваме покупателното поведение на хората, и да гледам как тези явления могат да се разпространяват в човешки популации.

So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.

И има три начина, мисля, по които могат да бъдат използвани тези масивни-пасивни данни. Единият е напълно пасивен, както току-що описах. Например, при шофьорът на камиона, където всъщност не се намесваме в популацията по никакъв начин. Един от тях е полуактивен, като примера с грипа, който дадох, където накарахме някои хора да номинират своите приятели и след това пасивно наблюдавахме техните приятели -- дали имат грип, или не? -- и след това получихме предупреждение. Или друг пример ще бъде, ако сте телефонна компания, и сте наясно кой е нa централно място в мрежата, и помолите тези хора, "Вижте, може ли просто да ни изпратите съобщение с вашата температура всеки ден? Просто SMS с температурата." И да съберете огромно количество информация за температурата на хората, но само от централно разположените лица. И да имате възможност, в голям мащаб, да наблюдавате предстояща епидемия, с много минимална информация от хората. Или може да бъде много по-активен начин -- за което знам, че други ще говорят днес -- където хората могат да участват в световен мащаб в уикита, или фотографиране, или наблюдение на избори, и качване на информация по начин, по който можем да я извличаме, за да разбираме обществени процеси и социални явления.

And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.

Всъщност, наличието на тези данни, мисля, предвещава една нова ера, на това, което аз и други, бихме искали да наречем изчислителна социална наука. Това е нещо като Галилео, когато изобретил -- или, не го е изобретил -- но започнал да използва телескопа, и могъл да види небето по нов начин, или когато Льовенхук се запознал с микроскопа -- или всъщност го изобретил -- и можал да види биологията по нов начин. Но сега имаме достъп до този вид данни, които ни позволяват да разберем социални процеси и социални явления, по един изцяло нов начин, който не бил възможен преди. И с тази наука, ние можем да разберем как точно цялата част става по-голяма, от сбора на съставните й части. И всъщност, ние можем да използваме тези данни, за подобряване на обществото и подобряване на човешкото благополучие.

In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.

Благодаря ви.

Thank you.

Благодаря ви.

Thank you.

Nicholas Christakis: How social networks predict epidemics

Nicholas Christakis: How social networks predict epidemics

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading