Nicholas Christakis: How social networks predict epidemics

Die letzten 10 Jahre habe ich meine Zeit damit verbracht, herauszufinden wie und warum menschliche Wesen sich in sozialen Netzwerken zusammenfinden. Und die Art sozialer Netzwerke, die ich meine ist nicht die jüngste Online-Variante, sondern vielmehr die Art sozialer Netzwerke, die menschliche Wesen seit hundert tausenden von Jahren gebildet haben, seit wir aus der afrikanischen Savanne hervorgingen. Ich gehe also Freundschaften und kollegiale und geschwisterliche und Verwandtschafts-Beziehungen mit anderen Leuten ein, die wiederum ähnliche Beziehungen mit anderen Leuten haben. Und das geht endlos so weiter. Und man bekommt ein Netzwerk, das so aussieht. Jeder Punkt ist eine Person. Jede Linie dazwischen ist eine Beziehung zwischen zwei Leuten -- unterschiedliche Arten von Beziehungen. Und man kann diese quasi enorme Struktur der Menschheit bekommen, in die wir alle eingebettet sind.

For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.

Und mein Kollege James Fowler und ich untersuchen seit einer ganzen Weile, was die mathematischen, sozialen, biologischen und psychologischen Regeln sind, die bestimmen, wie diese Netzwerke sich zusammensetzen, und was die ähnlichen Regeln sind, die bestimmen, wie sie funktionieren, wie sie sich auf unser Leben auswirken. Und kürzlich haben wir uns gefragt, ob es möglich wäre, diese Erkenntnis zu nutzen, um tatsächlich Wege zu finden, die Welt zu verbessern, etwas besser zu machen, die Dinge tatsächlich in Ordnung zu bringen, nicht nur zu verstehen. Eine der ersten Sachen, die wir dachten anzugehen, sollte die Art sein, wie wir Epidemien vorhersagen.

And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.

Und der aktuelle Stand der Technik bei der Vorhersage einer Epidemie -- ob man die CDC oder eine andere nationale Einrichtung ist -- ist, in der Mitte zu sitzen, wo man ist, und Daten von Ärzten und Labors im Feld zu sammeln, die die Prävalenz oder Inzidenz bestimmter Leiden berichten. Bei diesen und jenen Patienten wurde etwas diagnostiziert [hier drüben], oder andere Patienten wurden diagnostiziert [da drüben], und all diese Daten werden mit etwas Verspätung in einen zentralen Speicher gespeist. Und wenn alles glatt läuft wird man in ein oder zwei Wochen wissen, wo die Epidemie heute war. Und vor ungefähr einem Jahr gab es tatsächlich diese Art Verkündiung dieser Idee der Google Grippe-Trends, wo man in Bezug auf die Grippe, indem man sich das Suchverhalten der Leute heute anschaut, wissen konnte, wo die Grippe... was der Stand der Epidemie heute war, was die Prävalenz der Epidemie heute ist.

And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.

Aber was ich Ihnen heute zeigen möchte, ist ein Mittel, durch das wir nicht nur schnelle Warnungen vor einer Epidemie bekommen könnten, sondern tatsächlich auch Früherkennung einer Epidemie. Und in der Tat kann diese Idee nicht nur benutzt werden, um Epidemien von Krankheitserregern vorherzusagen, sondern um alle möglichen Epidemien vorherzusagen. Zum Beispiel kann alles, was sich durch eine Form sozialer Ansteckung verbreitet, so verstanden werden, von abstrakten Ideen auf der einen Seite, wie Patriotismus oder Altruismus oder Religion, bis zu Praktiken wie Diätverhalten oder Buchkäufen oder Trinken oder Fahrradhelm-Nutzung und anderen Sicherheitspraktiken, oder Produkten, die Leute vielleicht kaufen, der Kauf elektronischer Güter, alles, wo es eine Art zwischenmenschliche Verbreitung gibt. Eine Art Diffusion von Innovationen könnte verstanden und vorhergesagt werden durch den Mechanismus, den ich Ihnen jetzt zeigen werde.

But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.

Wie also alle von Ihnen wahrscheinlich wissen ist die klassische Art, darüber nachzudenken, die Diffusion von Innovationen oder die "Adoptionskurve". Hier auf der Y-Achse haben wir also die Prozent der betroffenen Leute, und auf der X-Achse haben wir die Zeit. Und ganz am Anfang sind nicht allzu viele Leute betroffen und man bekommt diese klassisch sigmoidale oder S-förmige Kurve. Und der Grund für diese Form ist, dass ganz am Anfang sagen wir ein oder zwei Leute von der Sache betroffen oder angesteckt sind, und die beeinflussen oder stecken dann zwei Leute an, die wiederum vier, acht, 16 und so weiter beeinflussen, und man bekommt die epidemische Wachstumsphase der Kurve. Und irgendwann sättigt man die Population. Es gibt immer weniger Leute, die noch verfügbar sind, die man anstecken könnte, und dann erreicht man dieses Plateu der Kurve und man bekommt diese klassische sigmoidale Kurve. Und das trifft zu auf Krankheitserreger, Ideen, Produkt-Akzeptanz, Verhalten und so weiter. Aber Dinge verbreiten sich in menschlichen Populationen nicht zufällig. Sie verbreiten sich tatsächlich durch Netzwerke. Denn, wie ich sagte, leben wir in Netzwerken und diese Netzwerke haben eine bestimmte Art Struktur.

So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.

Wenn Sie sich nun ein Netzwerk wie dieses anschauen... Das sind 105 Leute. Und die Linien stellen... die Punkte sind die Leute, und die Linien stellen Freundschaftsbeziehungen dar. Sie können sehen, dass Leute unterschiedliche Orte innerhalb des Netzwerks besetzen. Und es gibt verschiedene Arten von Beziehungen zwischen den Leuten. Man könnte Freundschaftsbeziehungen, Geschwisterbeziehungen, eheliche Beziehungen, kollegiale Beziehungen, nachbarschaftliche Beziehungen und so weiter haben. Und unterschiedliche Arten Dinge verbreiten sich entlang unterschiedlicher Arten Verbindungen. Sexuall übertragbare Krankheiten verbreiten sich zum Beispiel entlang sexualler Beziehungen. Oder das Rauchverhalten der Leute könnte zum Beispiel von ihren Freunden beeinflusst werden. Oder ihr altruistisches oder Spenden-Verhalten könnte beeinflusst sein durch ihre Kollegen oder ihre Nachbarn. Aber nicht alle Positionen im Netzwerk sind gleich.

Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.

Wenn Sie sich das also anschauen, können Sie sofort verstehen, dass unterschiedliche Leute unterschiedlich viele Verbindungen haben. Manche Leute haben eine Verbindung, manche zwei, manche sechs, manche haben 10 Verbindungen. Und das nennt man den Grad eines Knotens oder die Anzahl der Verbindungen, die ein Knoten hat. Aber zusätzlich ist da etwas anderes. Wenn Sie sich also Knoten A und B anschauen haben sie beide sechs Verbindungen. Aber wenn Sie dieses Bild aus der Vogelperspektive sehen können Sie einsehen, dass da etwas ganz verschieden ist zwischen den Knoten A und B. Lassen Sie mich also fragen -- ich kann diese Intuition durch eine Frage fördern -- wer wären Sie lieber, wenn ein tödlicher Erreger sich im Netzwerk verbreiten würde, A oder B? (Publikum: B.) Nicholas Christakis: B, das ist klar. B befindet sich am Rand des Netzwerks. Nun, wer wären Sie lieber wenn sich ein saftiges Gerücht im Netzwerk verbreiten würde? A. Und Sie haben eine unmittelbare Einschätzung, dass A mit einer höheren Wahrscheinlichkeit das Ding bekommt, das sich ausbreitet, und es früher bekommt, aufgrund der strukturellen Lage innerhalb des Netzwerks. A ist in der Tat zentraler, und das kann mathematisch formalisiert werden. Wenn wir also etwas verfolgen wollen, das sich in einem Netzwerk ausbreitet, würden wir idealerweise Sensoren auf den zentralen Personen im Netzwerk einrichten, inklusive Knoten A, die Leute beobachten, die genau da in der Mitte des Netzwerks sind, und irgendwie eine Früherkennung bekommen von dem, was sich da auch immer im Netzwerk verbreitet.

So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.

Wenn Sie die also einen Erreger oder eine Information einfangen sehen würden, wüssten Sie, dass in nicht allzu langer Zeit sich jeder diesen Erreger einfangen würde, oder diese Information. Und das wäre viel besser als sechs zufällig ausgewählte Leute zu beobachten ohne Bezug auf die Struktur der Population. Wenn Sie das tatsächlich machen könnten würden Sie so etwas sehen: Auf der linken Seite haben wir wieder die s-förmige Adoptionskurve. Mit der gepunkteten roten Linie zeigen wir, wie die Adoption bei den zufälligen Leuten sein würde und in der linken Linie, die nach links verschoben ist, zeigen wir, wie die Adoption bei den zentralen Personen im Netzwerk sein würde. Auf der Y-Achse sind die kumulativen Ansteckungsfälle und auf der X-Achse ist die Zeit. Und auf der rechten Seite zeigen wir die selben Daten, aber hier mit täglichen Fällen. Und was wir hier zeigen ist -- wie hier -- dass sehr wenige Leute betroffen sind, immer mehr, immer mehr und bis hier, und hier ist der Höhepunkt der Epidemie. Aber nach links verschoben ist, was mit den zentralen Personen passiert. Und diese zeitliche Differenz zwischen den beiden ist die Früherkennung, die Frühwarnung, die wir über eine bevorstehende Epidemie in der menschlichen Population bekommen können.

So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.

Das Problem ist aber, dass es nicht immer möglich ist, menschliche soziale Netzwerke abzubilden. Das kann teuer [nicht machbar], unethisch, oder einfach nicht möglich sein. Wie können wir also herausfinden, wer die zentralen Leute in einem Netzwerk sind, ohne das Netzwerk tatsächlich abzubilden? Worauf wir gekommen sind war die Idee, eine sehr alte Tatsache auszunutzen, oder einen bekannten Fakt über soziale Netzwerke, und der geht so: Wussten Sie, dass Ihre Freunde mehr Freunde haben als Sie? Ihre Freunde haben mehr Freunde als Sie. Und das ist als Freundschafts-Paradox bekannt. Stellen Sie sich eine sehr beliebte Person in dem sozialen Netzwerk vor -- wie den Gastgeber einer Party, der hunderte Freunde hat -- und einen Menschenfeind, der nur einen Freund hat, und sie wählen jemanden zufällig aus der Population aus; die Person kennt mit einer viel größeren Wahrscheinlichkeit den Gastgeber. Und wenn sie den als ihren Freund nennen hat der Gastgeber der Party hundert Freunde, und daher mehr Freunde als sie. Und das ist im Wesentlichen, was als Freundschafts-Paradox bekannt ist. Die Freunde zufällig ausgewählter Leute haben höhere Grade und sind zentraler als die zufälligen Leute selbst.

The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.

Und Sie können ein intuitives Verständnis dafür bekommen, wenn Sie sich nur die Leute am Rand des Netzwerks vorstellen. Wenn Sie diese Person auswählen kann die als einzigen Freund diese Person benennen, die naturgemäß mindestens zwei haben muss, und meistens mehr Freunde. Und das passiert an jedem äußeren Knoten. Und tatsächlich passiert es im ganzen Netzwerk während man tiefer rückt, jeden, den man auswählt, wenn der eine zufällige... wenn eine zufällige Person einen Freund benennt bewegt man sich näher zur Mitte des Netzwerks. Wir dachten also, wir würden diese Idee nutzen, um zu prüfen, ob wir Phänomene in Netzwerken vorhersagen können. Denn mit dieser Idee können wir jetzt eine Zufallsstichprobe an Leuten ziehen, sie ihre Freunde benennen lassen, diese Freunde wären zentraler, und wir könnten das tun, ohne das Netzwerk abbilden zu müssen.

And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.

Und wir untersuchten diese Idee anhand eines Ausbruchs der H1N1-Grippe an der Harvard Universität im Herbst und Winter 2009, vor nur ein paar Monaten. Wir nahmen 1.300 zufällig ausgewählte Studierende, ließen sie ihre Freunde benennen, und wir verfolgten sowohl die zufälligen Studierenden als auch ihre Freunde täglich über die Zeit, um zu sehen ob sie die Grippe-Epidemie hatten oder nicht. Und das machten wir passiv, indem wir uns ansahen, ob sie den Gesundheitsdienst der Universität aufsuchten oder nicht. Und wir ließen uns ein paarmal pro Woche E-Mails von ihnen schicken. Es passierte genau das, was wir vorhergesagt hatten. Die zufällige Gruppe ist also die rote Linie. Die Epidemie in der Freundes-Gruppe hat sich nach links verschoben, hier drüben. Und der Unterschied zwischen den beiden beträgt 16 Tage. Durch das Beobachten der Freundes-Gruppe konnten wir 16 Tage Vorabwarnung vor einer bevorstehenden Epidemie in dieser menschlichen Population bekommen.

And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.

Wenn Sie ein Analytiker wären, der versucht, eine Epidemie zu erforschen oder zum Beispiel die Annahme eines Produkts vorherzusagen, könnten Sie nun zusätzlich eine Zufallsstichprobe der Population ziehen und die ihre Freunde benennen lassen und den Freunden folgen, und sowohl den Zufälligen als auch den Freunden folgen. Bei den Freunden wäre der erste Hinweis einer Zacke über Null, bei der Annahme der Innovation zum Beispiel, ein Hinweis auf eine bevorstehende Epidemie. Oder Sie könnten das erste Mal ansehen, wo die zwei Kurven auseinander gehen, wie hier links. Wann hoben die Zufälligen... wann hoben die Freunde ab und ließen die Zufälligen zurück, und deren Kurve begann, sich zu verschieben? Und das, wie durch die weiße Linie angezeigt, passierte 46 Tage vor dem Höhepunkt der Epidemie. Das wäre also eine Methode, durch die wir mehr als anderthalb Monate Warnung vor einer Grippe-Epidemie in einer bestimmten Population bekommen könnten.

Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.

Ich sollte erwähnen, dass, wie weit im Voraus wir Nachricht über etwas bekommen können, von einer Menge Faktoren abhängt. Es könnte von der Art des Erregers abhängen -- für unterschiedliche Erreger würde man mit dieser Methode unterschiedliche Warnungen bekommen -- oder andere Phänomene, die sich verbreiten, oder, offen gesagt, die Struktur des menschlichen Netzwerks. In unserem Fall konnten wir nun, obwohl das nicht nötig war, das Netzwerk der Studierenden auch tatsächlich abbilden.

I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.

Das ist also eine Karte von 714 Studierenden und ihren Freundschafts-Verbindungen. Und in einer Minute werde ich diese Karte in Bewegung setzen. Wir werden 120 Tage lang tägliche Schnitte durch das soziale Netz machen. Die roten Punkte werden die Grippe-Fälle sein, und die gelben Punkte werden Freunde der Leute mit Grippe sein. Und die Größe der Punkte wird proportional dazu sein, wie viele ihrer Freunde die Grippe haben. Größere Punkte bedeuten, dass mehr Ihrer Freunde die Grippe haben. Und wenn Sie sich das Bild anschauen -- hier haben wir jetzt den 13. September -- sehen Sie ein paar Fälle aufleuchten. Sie werden die Grippe in der Mitte sozusagen aufblühen sehen. Hier sind wir am 19. Oktober. Der Anstieg der Epidemie-Kurve kommt jetzt im November. Peng, peng, peng, peng, peng, Sie werden viel Aufblühen in der Mitte sehen, und dann werden Sie eine Art Abflachen sehen, immer weniger Fälle gegen Ende Dezember. Und diese Art Visualisierung kann zeigen, dass Epidemien wie diese Fuß fassen und zentrale Personen zuerst betreffen, bevor sie andere betreffen.

So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.

Wie ich bereits angedeutet habe, ist diese Methode nicht auf Krankheitserreger beschränkt, sondern auf alles, was sich in Populationen verbreitet. Informationen verbreiten sich in Populationen. Normen können sich in Populationen verbreiten. Verhalten kann sich in Populationen verbreiten. Und unter Verhalten kann man Dinge wie Kriminalverhalten verstehen oder Wahlverhalten oder Gesundheitsverhalten wie Rauchen oder Impfen oder die Annahme eines Produkts oder andere Arten von Verhalten, die mit zwischenmenschlichem Einfluss zu tun haben. Wenn ich mit hoher Wahrscheinlichkeit etwas tue, das andere um mich herum beeinflusst, kann diese Methode eine Frühwarnung oder Früherkennung über die Annahme innerhalb der Population geben. Das Ding ist, damit das funktioniert, muss es zwischenmenschlichen Einfluss geben. Das kann nicht durch irgendeine Art Rundsendung sein, die jeden gleichermaßen betrifft.

Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.

Die selben Einsichten können auch ausgenutzt werden -- in Bezug auf Netzwerke -- können auch auf andere Art ausgenutzt werden, zum Beispiel, indem man bestimmte Leute für Interventionen auswählt. Zum Beispiel sind die meisten von Ihnen wahrscheinlich vertraut mit dem Gedanken der Herdenimmunität. Wenn wir also eine Population von tausend Leuten haben und wir die gegen ein Pathogen immunisieren wollen, brauchen wir nicht jede einzelne Person zu immunisieren. Wenn wir 960 von ihnen immunisieren ist es als ob wir hundert [Prozent ]von ihnen immunisiert hätten. Denn selbst wenn ein oder zwei der nicht-immunen Leute infiziert werden, gibt es keinen, den sie anstecken können. Sie sind von immunen Leuten umgeben. 96 Prozent sind also so gut wie 100 Prozent. Nun, einige andere Wissenschaftler haben eingeschätzt, was passieren würde, wenn man eine Zufallsstichprobe von 30% dieser 1.300 Leute nehmen und die immunisieren würde. Würde man Immunität auf Populations-Ebene erhalten? Die Antwort ist nein. Aber wenn man diese 30 Prozent, diese 300 Leute nehmen würde und sie ihre Freunde benennen lassen würde, und die selbe Anzahl Impfstoff-Dosen nehmen würde, und die Freunde der 300 impfen würde, die 300 Freunde, würde man das gleiche Maß an Herdenimmunität erreichen wie wenn man 96 Prozent der Population geimpft hätte, sehr viel effizienter, mit einem knappen Budget.

Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.

Und ähnliche Ideen können zum Beispiel genutzt werden, um das Austeilen von Dingen wie Moskitonetzen in Entwicklungsländern zu planen. Wenn wir die Struktur von Netzwerken in Dörfern verstehen könnten, könnten wir planen, wem wir die Interventionen geben sollten, um diese Art Verbreitung zu unterstützen. Oder, offen gesagt, für Werbung für alle möglichen Produkte. Wenn wir verstehen könnten, auf wen wir zielen, könnte das die Effizienz dessen, was wir zu erreichen versuchen, beeinflussen. Und in der Tat können wir heutzutage [dazu] Daten aus allen möglichen Quellen nutzen.

And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].

Das ist eine Karte von acht Millionen Telefon-Nutzern in einem europäischen Land. Jeder Punkt ist eine Person und jede Linie stellt ein Anruf-Volumen zwischen den Leuten dar. Und wir können solche Daten, die passiv erhoben wurden, nutzen, um diese ganzen Länder abzubilden und zu verstehen, wer sich wo innerhalb des Netzwerks befindet. Ohne die alle tatsächlich befragen zu müssen können wir diese Art strukturelle Einsicht erlangen. Und andere Informationsquellen, wie Sie zweifellos wissen, sind verfügbar über Informationen aus E-Mail-Interaktionen, Online Interaktionen, sozialen Netzwerken online und so weiter. Und in der Tat sind wir in der Ära dessen, was ich "massiv-passive" Datenerhebungs-Bemühungen nennen würde. Das sind alles mögliche Arten, massiv gesammelte Daten zu nutzen, um Sensoren-Netzwerke zu schaffen, um die Population zu verfolgen, zu verstehen, was in der Population passiert, und in der Population zum Besseren zu intervenieren. Weil diese neuen Technologien uns nicht nur sagen, wer mit wem spricht, sondern wo jeder ist und was sie denken, basierend auf dem, was sie ins Internet hochladen und was sie kaufen, basierend auf ihren Käufen. Und all diese Überwachungs-Daten können zusammengezogen und verarbeitet werden, um menschliches Verhalten auf eine nie dagewesene Art zu verstehen.

This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.

Wir könnten also zum Beispiel die Benzinkäufe der Lkw-Fahrer nehmen. Die Fahrer gehen also nur ihrer Arbeit nach und kaufen Benzin. Und wir sehen eine Zacke nach oben in den Benzinkäufen der Lkw-Fahrer, und wir wissen, dass eine Rezession bald endet. Oder wir können die Geschwindigkeit beobachten, mit der Leute sich mit ihren Handys auf einer Autobahn bewegen, und die Telefongesellschaft kann daran, wie die Geschwindigkeit abnimmt, sehen, dass es einen Stau gibt. Und sie können diese Information ihren Vertragskunden rückmelden, aber nur den Vertragskunden auf der selben Autobahn, die sich hinter dem Stau befinden. Oder wir können das Verschreibungsverhalten von Ärzten passiv beobachten und sehen, wie die Verbreitung von pharmazeutischen Innovationen unter Ärzten passiert. Oder wiederum können wir Kaufverhalten von Leuten beobachten und sehen, wie diese Phänomene sich in menschlichen Populationen verbreiten können.

So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.

Und es gibt, denke ich, drei Arten auf die diese massiv-passiven Daten genutzt werden können. Eine ist vollkommen passiv, wie ich gerade beschrieben habe. Das Lkw-Szenario zum Beispiel, wo wir auf überhaupt nicht in die Population eingreifen. Eine ist quasi-aktiv, wie mein Grippebeispiel, wo wir einige Leute dazu bekommen, ihre Freunde zu nennen, und dann deren Freunde passiv beobachten -- haben sie die Grippe oder nicht? -- und dann eine Warnung erhalten. Oder ein anderes Beispiel wäre, wenn Sie als Telefongesellschaft herausfinden, wer im Netzwerk zentral ist, und diese Leute fragen: "Schauen Sie, könnten Sie uns einfach jeden Tag ihre Temperatur per SMS schicken? Schicken Sie uns einfach Ihre Temperatur." Und riesige Mengen Informationen über die Körpertemperatur der Leute sammeln, aber von zentralen Personen. Und in großem Maßstab in der Lage sein, eine bevorstehende Epidemie zu beobachten mit minimalem Input von Leuten. Oder das kann aktiver sein -- wie ich weiß werden kommende Vortragende heute auch darüber sprechen -- wo Leute global vielleicht bei Wikis mitmachen, oder fotografieren, oder Wahlen beobachten und Informationen hochladen, so dass wir sie sammeln können, um soziale Prozesse zu verstehen, und soziale Phänomene.

And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.

In der Tat glaube ich, dass die Verfügbarkeit dieser Daten eine Art neues Zeitalter einläutet das ich und andere gerne "Computergestützte Sozialwissenschaft" nennen würden. (computational social science) Das ist fast so wie als Galileo das Teleskop erfand -- oder nein, nicht erfand, benutzte -- und den Himmel auf eine neue Art sehen konnte, oder als Leeuwenhoek sich des Mikroskops bewusst wurde -- oder es tatsächlich erfand -- und die Biologie auf neue Art sehen konnte. Aber nun haben wir Zugang zu dieser Art Daten, die uns erlauben, soziale Prozesse zu verstehen, und soziale Phänomene, und einen völlig neuen Weg, der nie zuvor möglich war. Und mit dieser Wissenschaft können wir verstehen, wie genau es kommt, dass das Ganze größer als die Summe seiner Teile ist. Und tatsächlich können wir diese Erkenntnisse nutzen, um die Gesellschaft und menschliches Wohlbefinden zu verbessern.

In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.

Danke.

Thank you.

Danke.

Thank you.

Nicholas Christakis: How social networks predict epidemics

Nicholas Christakis: How social networks predict epidemics

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading