For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.
Последњих 10 година проводим време у покушавању да схватим како и зашто се људска бића окупљају у друштвене мреже. А та врста друштвене мреже о којој причам није ова нова интернет врста, него пре она врста друштвених мрежа које људи формирају стотинама хиљада година, од кад смо се појавили у афричкој пустињи. Дакле, ја имам пријатељске и сарадничке и братске и рођачке везе са другим људима који такође имају сличне везе са другим људима. И ово се бескрајно шири у даљину. И добијате мрежу која изгледа овако. Свака тачка је једна особа. Свака линија је нека веза међу двоје људи - различите врсте веза. И можете добити овакву тканину човечанства у коју смо сви ми уткани.
And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.
Мој колега, Џејмс Фаулер и ја, већ дуже време истражујемо каква су математичка, друштвена, биолошка и психолошка правила која управљају начином формирања ових веза и каква су слична правила која управљају њиховим функционисањем и утицајем на наше животе. У последње време се питамо да ли је могуће искористити овај увид, како бисмо нашли начине да побољшамо свет, учинимо нешто боље, да стварно поправимо ствари, не само да их разумемо. Једна од првих ствари на којима бисмо радили била би како бисмо могли да предвиђамо епидемије.
And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.
Тренутна уметност предвиђања епидемија - ако припадате Центру за контролу болести или неком другом телу - састоји се у седењу тамо где јесте и прикупљању података од лекара и лабораторија са терена, који пријављују преваленцу и инциденцу одређених стања. Дакле, толико и толико пацијената има такву дијагнозу овде, или неки други имају дијагнозу овде, и сви ови подаци сливају се у централно складиште, са кашњењем. И ако све иде као по лоју, за недељу до две од сада, знаћете где је епидемија била на данашњи дан. И уствари, пре неких годину дана објављена је идеја о "Google Flu Trends", о грипу, где, пратећи шта људи претражују данас, могли бисмо знати где грип... какав је данас статус епидемије, каква је данас преваленца епидемије.
But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.
Али данас желим да вам покажем средство помоћу којег можемо добити не само брзо упозорење о епидемији, него и заправо рано откривање епидемије. Уствари, ова идеја се може користити не само за предикцију епидемије болести, него за предикцију свакаквих других ствари. На пример, све што се шири у облику друштвене заразе може се посматрати на овај начин, од апстрактних идеја с леве стране, као што су патриотизам, алтруизам, религија до понашања, као што су дијете, куповина књига, или пијење, ношење кациге и друге безбедносне мере, или производи које људи купују, куповина електричних уређаја, било шта где постоји интерперсонално ширење. Нека врста распростирања иновација може се разумети и предвидети механизмом који ћу вам сада показати.
So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.
Дакле, као што сви вероватно знате, стари начин гледања на ово је расипање-иновација или крива усвајања. Овде на Y оси имамо проценат заражених људи, а на Х оси имамо време. На самом почетку није много људи заражено, и добијамо ову класичну сигмоидалну, или S кривуљу. А разлог за овај облик је да је на самом почетку, рецимо једно или двоје људи заражено, инфицирано, том ствари и онда они заразе или инфицирају двоје људи, који потом заразе четворо, осморо, 16 итд, и добијете фазу раста епидемије на кривуљи. И коначно, дође до засићења популације. Све је мање и мање људи које још можете да заразите, и онда долазимо до платоа кривуље, и имамо класичну S кривуљу. Ово важи за бациле, идеје, прихватање производа, понашања, и слично. Али ствари се не расипају међу људима случајно. Оне се уствари шире мрежама. Јер, како сам рекао, живимо животе у мрежама, а оне имају посебну врсту структуре.
Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.
Када погледате једну овакву мрежу... Овде има 105 људи. Линије представњају... тачке су људи, а линије представљају пријатељске везе. Можете видети да људи заузимају различита места унутар мреже. И постоје различите везе међу људима. Имате пријатељске везе, братске, супружничке, сарадничке, комшијске и сличне. И различите ствари се шире различитим везама. На пример, сексуално преносиве болести шириће се сексуалним везама. Или, на пример, пушачко понашање је можда под утицајем пријатеља. Или на алтруистично или добротворно понашање можда утичу колеге или суседи. Али нису све позиције у мрежи исте.
So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.
Када погледате ово, можда одмах можете схватити да различити људи имају различит број веза. Неки имају једну везу, неки две, неки шест, неки имају десет. Ово се зове "степен" чвора, или број повезаности које неки чвор има. Али, има још нешто поред тога. Дакле, ако погледате чвор А и Б, оба имају по шест веза. Али ако можете да видите ову слику мреже из птичије перспективе, примећујете да има много разлике међу чворовима А и Б. Питам вас - могу покренути ово размишљање питањем - ко бисте радије били, да се смртоносни бацил шири мрежом, А или Б? (Публика: Б) Николас Кристакис: Б, очигледно. Б се налази на ивици мреже. А сада, ко бисте радије били, да се неки сочни трач шири мрежом? А. И одмах схватате да је вероватније да ће А, због своје структурне позиције у мрежи, пре добити ту ствар која се њоме шири. А је уствари централнији, и то се може и математички приказати. Дакле, ако желимо да пратимо нешто што се шири мрежом, заправо желимо да поставимо сензоре на централне поједнице у мрежи, укључујући чвор А, да посматрамо те људе који се налазе усред мреже и некако рано откријемо шта год да је то што се шири мрежом.
So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.
То јест, ако их видите да се заразе бацилом или неком информацијом, знаћете да ће, ускоро, сви да се заразе тим бацилом или том информацијом. Ово би било много боље него посматрање шесторо насумичних људи, без знања о структури популације. Уствари, кад бисте то могли, добили бисте нешто што изгледа као ово. С леве стране опет имамо Ѕ кривуљу прихватања. Црвеном истачканом линијом приказано је како би то ширење изгледало у насумичној популацији, и на левој страни, померено улево, приказано је како би изгледало међу централним појединцима у оквиру мреже. На Y оси је кумулативни случај заразе, а на Х оси је време. А са десне стране приказани су исти подаци, али овде са дневном инциденцом. Овде је приказано да је само неколико људи инфицирано, све више довде, а овде је врхунац епидемије. Али с леве стране је оно што се догађа централним појединцима. Та разлика у времену између ова два је то рано откривање, рано упозорење које можемо добити, о предстојећој епидемији у људској популацији.
The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.
Међутим, проблем је што мапирање људских друштвених мрежа није увек могуће. Може бити скупо, веома тешко, неетичко, или, искрено, само немогуће да се тако нешто уради. Дакле, како можемо утврдити ко су централни појединци у некој мрежи а да не мапирамо ту мрежу? Дошли смо на идеју да истражимо стару чињеницу, или познату чињеницу, о друштвеним мрежама, која је следећа: Да ли знате да ваши пријатељи имају више пријатеља него ви? Ваши пријатељи имају више пријатеља него ви. Ово је познато као парадокс пријатељства. Замислите веома популарну особу у друштвеној мрежи - на пример домаћина забаве који има стотине пријатеља - и мизантропа који има само једног пријатеља, и изаберете насумично неког из популације; та особа ће вероватније познавати тог домаћина забаве. И ако означе да им је домаћин пријатељ, тај домаћин има стотине пријатеља, и на тај начин има више пријатеља него они. Ово је, у суштини, познато као парадокс пријатељства. Пријатељи насумично одабраних људи имају виши степен и централнији су, него сами ти насумични људи.
And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.
Можете интуитивно схватити ово, ако замислите само људе на ивицама мреже. Ако одаберете ову особу, једини пријатељ кога могу да наведу је ова особа, која, по конструкцији, мора имати барем два, а заправо и више, пријатеља. И то се дешава са сваким периферним чвором. Уствари, дешава се кроз мрежу, како пролазите њоме, свако кога изаберете, када они одаберу неког... када насумична особа наведе једног свог пријатеља, приближавате се центру мреже. Ми смо мислили да истражимо ову идеју како бисмо видели можемо ли да предвидимо феномене унутар мрежа. Јер сада, са овом идејом, можемо узети насумични узорак људи, тражити да наведу своје пријатеље, ти пријатељи ће бити централнији и то бисмо урадили без мапирања мреже.
And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.
Ову идеју тестирали смо са епидемијом H1N1 грипа, на Харварду у јесен и зиму 2009., пре само неколико месеци. Узели смо 1300 насумично одабраних студената, замолили их да наведу своје пријатеље, и пратили смо и насумичне студенте и њихове пријатеље дневно у одређено време, да видимо да ли су заражени или не. То смо чинили пасивно, посматрајући да ли иду у студентске амбуланте. Такође су нам они слали мејлове неколико пута недељно. Десило се управо оно што смо предвидели. Црвена линија представља насумичну групу. Епидемија међу пријатељима померила се улево, овде. А разлика између две групе је 16 дана. Посматрајући групу пријатеља, могли смо да добијемо упозорење о долазећој епидемији у овој популацији 16 дана унапред.
Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.
Сад, поврх тога, ако сте аналитичар који покушава да проучи епидемију или предвиди усвајање неког производа на пример, могли бисте узети насумичан узорак из популације, такође тражити да именују своје пријатеље и пратити пријатеље, и пратити и пријатеље и насумичну групу. Међу пријатељима, први доказ пораста изнад нуле у прихватању неке иновације, не пример, био би доказ предстојеће епидемије. Или бисте први пут видели да се две кривуље разилазе, као што је приказано с леве стране. Када су пријатељи отишли и оставили насумичне, а њихова кривуља почела да се мења? То се, као што показује бела линија, десило 46 дана пре врхунца епидемије. Дакле ово би била техника којом бисмо више од месец ипо дана унапред добили упозорење о епидемији грипа у некој популацији.
I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.
Морам да кажем да, добијање раног упозорења о нечему зависи од сијасет фактора. Може зависити од природе патогена - различитих патогена, коришћењем ове технике добили бисте разна упозорења - или других феномена који се шире, или, заправо од структуре мреже. Сада, у нашем случају, иако није било потребно, могли смо такође да мапирамо мрежу студената.
So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.
Дакле, ово је мапа 714 студената и њихових пријатељских веза. За тренутак ћу покренути ову мапу. Направићемо дневни преглед кроз мрежу у трајању од 120 дана. Црвене тачке ће бити случајеви грипа, а жуте тачке ће бити пријатељи људи са грипом. А величина тачака биће пропорционална броју пријатеља који имају грип. Веће тачке значе да више ваших пријатеља има грип. Ако погледате ову слику - сада смо у 13. септемрбу - видећете да се појављује неколико случајева. Видећете неку врста процвата грипа у средини. Овде смо у 19. октобру. Нагиб епидемије се приближава сад, у новембру. Бенг, бенг, бенг, бенг, бенг, видећете много процвата у средини, и онда ћете видети заравњење, све мање и мање случајева до краја децембра. Ова врста визуализације приказује да се овакве епидемије јављају и утичу прво на централне појединце, пре него што погоде друге.
Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.
Сад, као што сам рекао, овај метод није ограничен на бациле, него на било шта што се шири у популацијама. Информације се шире у популацијама. Норме могу да се шире. Понашања могу да се шире. Под тиме мислим на криминална понашања, или гласање, брига о здравственом стању, као што је пушење, вакцинација, или прихватање неког производа, или друге врсте понашања које имају везе са интерперсоналним утицајем. Ако ћу ја урадити нешто што утиче на људе око мене, ова техника може дати рано упозорење, рано откривање, прихватања у популацији. Кључна ствар је, да би функционисало, неопходно је да постоји интерперсонални утицај. Не дешава се тако што неки механизам емитовања утиче на све једнако.
Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.
Исти ови налази могу се користити - који се односе на мреже - могу се користити и на друге начине, на пример, у корист циљања на одређене људе за интервенције. На пример, већина вас је вероватно упозната са идејом "имунитета стада". дакле, имамо популацију од хиљаду људи, и желимо да је учинимо имуном на неки патоген, не морамо да вакцинишемо сваку поједину особу. Ако имунизирамо њих 960, то је као да смо имунизирали 100 посто. Јер чак иако се један или двоје од неимунизираних зарази, нема никога коме би пренели. Окружени су имунизованим људима. Дакле, 96% је једнако добро као и 100%. Па, неки други научници су проценили шта би се догодило кад бисте узели 30% насумичног узорка од ових 1000 људи, њих 300 и имунизовали их. Да ли бисте добили имунитет на нивоу популације? Одговор је не. Али ако узмете тих 30%, тих 300 људи, и тражите да наведу своје пријатеље и узмете исти број доза вакцина, и вакцинишете пријатеље од тих 300 људи, 300 пријатеља, можете добити исти ниво "имунитета стада" као да сте вакцинисали 96% популације, са много већом ефикасношћу и ограниченим буџетом.
And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].
Сличне идеје се могу користити, на пример, за циљање дистрибуције ствари као што су балдахини у земљама у развоју. Кад бисмо разумели структуру мрежа у селима, могли бисмо одредити на коме треба интервенисати да бисмо покренули ова ширења. Или за рекламирање свих врста производа. Кад бисмо разумели како да циљамо, то би утицало на ефикасност онога што желимо да постигнемо. Данас за ово можемо да користимо податке из свакаквих извора.
This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.
Ово је мапа осам милиона корисника телефона у једној европској земљи. Свака тачка је једна особа, а свака линија представља количину позива међу људима. Можемо користити такве податке, који се пасивно скупљају, да мапирамо читаве земље и разумемо ко је где лоциран у мрежи. Не бисмо морали ни да их испитујемо, а добили бисмо увид у структуру. И друге врсте информација су, као што знате, доступне о тим особинама, као комуницирање мејловима, интеракције на интернету, друштвене мреже на интернету, итд. Уствари, налазимо се у ери коју зовем "масовно-пасивно" прикупљање података. Постоје многи начини да искористимо масовно прикупљене податке да бисмо створили мреже сензоре пратили популацију, разумели шта се дешава у популацији, и интервенисали у популацији због добробити. Јер ове нове технологије нам не говоре само ко с ким разговара, него где се сви налазе, и о чему размишљају, на основу онога што постављају на интернет, и шта купују, на основу њихових куповина. И сви ови примењиви подаци могу да се скупе и обраде да би се разумело људско понашање као што никада пре нисмо могли.
So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.
На пример, возачи камиона купују гориво. камионџије само раде свој посао, и купују гориво. И видимо пораст куповине горива и знамо да се рецесија ближи крају. Или можемо посматрати брзину којом се људи са мобилним телефонима крећу по ауто путу и телефонске компаније могу видети, како се брзина успорава, да постоји саобраћајна гужва. Ту информацију могу послати својим претплатницима, али само онима који се налазе на истом ауто путу иза саобраћајне гужве! Или можемо пасивно да посматрамо шта доктори преписују, и видимо како се ширење нових лекова јавља међу мрежама доктора. Или опет, можемо посматрати куповно понашање међу људима, и видети како се ови феномени могу ширити међу људским популацијама.
And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.
Мислим да постоје три начина на које се овако прикупљени подаци могу користити. Један је потпуно пасиван, као што сам управо описао - као у примеру са камионџијама, где се не мешамо у популацију ни на који начин. Један је квази-активан, као пример са грипом, где неки људи наводе своје пријатеље, и онда пасивно посматрамо њихове пријатеље - имају ли грип или не? - и онда добијемо упозорење. Или још један пример био би, ако сте телефонска компанија, сазнате ко је централан у некој мрежи и питате те људе, "Да ли бисте нам написали вашу температуру сваког дана? Само нам пошаљите колика вам је температура." И скупите огромне количине података о температурама људи али од индивидуа које су у центру. И можете, у великом обиму, посматрати долазећу епидемију са веома мало података од људи. Или коначно, може бити потпуно активно - знам да ће и наредни говорници о томе причати данас - где људи могу глобално учествовати у викијима, или фотографисати или посматрати изборе и постављати информације тако да можемо да их скупљамо како бисмо разумели друштвене процесе и друштвене феномене.
In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.
Уствари, мислим да доступност ових података најављује нову еру онога што ја и други волимо да зовемо "рачунарска друштвена наука". Како кад је Галијеј изумео - или, није изумео - почео да користи телескоп и могао да види небеса на нови начин, или кад је Ливенхок открио микроскоп - или изумео - и могао да види биологију на нов начин. Али сада имамо приступ овим врстама података који нам дозвољавају да разумемо друштвене процесе и друштвене феномене на потпуно нов начин који никада није био могућ. И са овом науком, можемо разумети како је тачно целина већа од збира својих делова. И заправо, можемо користити ова сазнања да побољшамо друштво и добробит људи.
Thank you.
Хвала вам.