Nicholas Christakis: How social networks predict epidemics

For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.

Pendant les 10 dernières années, j'ai passé mon temps à essayer de comprendre comment et pourquoi les êtres humains se rassemblent dans des réseaux sociaux. Et le type de réseau social dont je parle n'est pas la nouvelle variété en ligne, mais plutôt, le genre de réseaux sociaux que les êtres humains ont construit depuis des centaines de milliers d'années, depuis que nous avons émergé [de] la savane africaine. Donc, je construis un réseau d’amis, de collègues, fraternel et familial avec d'autres personnes qui à leur tour ont des relations similaires avec d'autres personnes. Et cela s'étend à l'infini avec la distance. Et vous obtenez un réseau qui ressemble à ceci. Chaque point est une personne. Chaque ligne entre elles est une relation entre deux personnes -- différents types de relations. Et vous pouvez obtenir ce genre de vaste tissu de l'humanité, dans lequel nous sommes tous intégrés.

And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.

Et mon collègue, James Fowler, et moi avons étudié pendant quelques temps quelles sont les règles mathématiques, sociales, biologiques et psychologiques qui régissent la façon dont ces réseaux sont assemblés et quelles sont les règles similaires qui régissent la façon dont ils fonctionnent, dont ils affectent nos vies. Et récemment, nous nous sommes demandés s'il ne serait pas possible de tirer parti de cette idée, pour effectivement trouver des moyens d’améliorer le monde, de faire quelque chose de mieux, pour en réalité réparer les choses, pas seulement les comprendre. Ainsi, l'une des premières choses que nous pensions aborder serait de savoir comment nous pouvions prévoir des épidémies.

And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.

Et l'état de la situation concernant la prédiction d’une épidémie -- si vous êtes le CDC ou un autre organisme national -- est de rester dans le milieu où vous vous trouvez et recueillir des données des médecins et des laboratoires sur le terrain qui rapportent la prévalence ou l'incidence de certaines conditions. Ainsi, tel et tel patients ont été diagnostiqués avec quelque chose [ici], ou d'autres patients ont été diagnostiqués [là-bas], et toutes ces données sont enregistrées dans un référentiel central, avec un certain retard. Et si tout se passe bien, dans une à deux semaines à partir de maintenant, vous saurez où était l'épidémie aujourd'hui. Et en fait, environ un an auparavant, il y avait cette promulgation de l'idée de Google Flu Trends, à l'égard de la grippe, où, en regardant le comportement de recherche des gens aujourd'hui, on pourrait savoir où la grippe ... quel est le statut de l'épidémie aujourd'hui, quelle est la prévalence de l'épidémie en ce moment.

But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.

Mais ce que je voudrais vous montrer aujourd'hui est un moyen par lequel nous pourrions obtenir pas seulement une alerte rapide sur une épidémie, mais aussi la détection précoce d'une épidémie. Et, en fait, cette idée peut être utilisée non seulement pour prévoir les épidémies de microbes, mais aussi pour prévoir les épidémies en tout genre. Par exemple, tout ce qui se propage par une forme de contagion sociale pourrait être interprété de cette façon, des idées abstraites sur la gauche comme le patriotisme, ou l'altruisme, ou la religion, aux pratiques comme le comportement alimentaire, ou l'achat de livres, ou la boisson, ou le port du casque [et] autres pratiques de sécurité, ou les produits que les gens peuvent acheter, achats de biens électroniques, tout ce qui a une sorte de propagation interpersonnelle. Une sorte de diffusion de l'innovation pourrait être comprise et prédite par le mécanisme que je vais vous montrer maintenant.

So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.

Donc, comme vous le savez probablement, la façon classique de penser à ça est la diffusion de l'innovation, ou la courbe d'adoption. Donc, ici, sur l'axe Y, nous avons le pourcentage de personnes touchées, et sur l'axe X, nous avons le temps. Et dès le début, peu de personnes sont touchées, et vous obtenez ce sigmoïde classique, ou courbe en S. Et la raison de cette forme est qu’au début, disons une ou deux personnes sont affectés ou infectés, par la chose, puis elles affectent, ou infectent, deux personnes, qui affectent à leur tour quatre, huit, 16 et ainsi de suite, et vous obtenez la phase de croissance de la courbe de l'épidémie. Et finalement, vous saturez la population. Il y a de moins en moins de gens qui sont encore disponibles que vous pourriez infecter, et puis vous obtenez le plateau de la courbe, et donc cette courbe sigmoïde classique. Et ceci est vrai pour les germes, les idées, l'adoption d’un produit, les comportements, et autres. Mais les choses ne diffusent pas dans les populations humaines au hasard. En fait, ils diffusent à travers les réseaux. Parce que, comme je l'ai dit, nous vivons notre vie dans les réseaux, et ces réseaux ont une architecture particulière.

Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.

Maintenant, si vous regardez un réseau comme celui-ci ... C'est 105 personnes. Et les lignes représentent ... les points sont les gens, et les lignes représentent les relations d'amitié. Vous pouvez voir que les gens occupent différents endroits dans le réseau. Et il y a différents types de relations entre les personnes. Vous pourriez avoir des relations d'amitié, des relations fraternelles, des relations conjugales, des relations professionnelles, des relations de voisinage, etc. Et différentes sortes de choses diffusent suivant différents types de liens. Par exemple, les maladies sexuellement transmissibles diffuseront sur les liens sexuels. Ou, par exemple, le comportement tabagique des gens peut être influencé par leurs amis. Ou leur comportement altruiste ou leurs dons de charité peuvent être influencés par leurs collègues, ou par leurs voisins. Mais tous les nœuds du réseau ne sont pas les mêmes.

So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.

Donc, si vous regardez cela, vous pouvez saisir immédiatement que des personnes différentes ont des nombres différents de connexions. Certaines personnes ont une connexion, certains en ont deux, certains six, certains ont 10 connexions. Et c'est ce qu'on appelle le "degré" d'un nœud, ou le nombre de connexions que le nœud a. Mais, en plus, il y a autre chose. Donc, si vous regardez les nœuds A et B, ils ont tous deux six connexions. Mais si vous pouvez avoir cette image [du réseau] vue de haut, vous pouvez le constater qu'il y a quelque chose de très différent au sujet des nœuds A et B. Alors, laissez-moi vous poser cette question -- je peux confirmer cette intuition en posant une question -- qui préféreriez-vous être si un germe mortel se propageait à travers le réseau, A ou B? (Audience: B.) Nicholas Christakis: B, c'est évident. B est situé sur la périphérie du réseau. Maintenant, qui préféreriez-vous être si un morceau juteux de ragots se propageait à travers le réseau? A. Et vous avez une appréciation immédiate : A va être plus susceptible d’obtenir la chose qui se propage et de l'obtenir plus tôt en vertue de sa situation structurelle au sein du réseau. A, en fait, est plus central, et cela peut être une formalisation mathématique. Donc, si nous voulons suivre quelque chose qui se propageait à travers un réseau, ce que nous aimerions idéalement faire est de mettre en place des capteurs sur les individus centraux du réseau, y compris le nœud A, surveiller les personnes qui sont là au milieu du réseau, et en quelque sorte avoir une détection précoce de quoi que ce soit qui se répand à travers le réseau.

So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.

Autrement dit, si vous les avez vus contracter une maladie ou un morceau d'information, vous savez que, assez vite, tout le monde était sur le point de contracter cette maladie ou cette information. Et ce serait beaucoup mieux que de suivre six personnes choisies au hasard, sans référence à la structure de la population. Et en fait, si vous pouviez le faire, ce que vous voyez est quelque chose comme ça. Sur le panneau de gauche, encore une fois, nous avons la courbe en S de l'adoption. Dans la ligne pointillée rouge, nous montrons ce que l'adoption serait avec des gens choisis au hasard, et dans la ligne de gauche, déplacé vers la gauche, nous montrer ce que l'adoption serait avec des individus centraux au sein du réseau. Sur l'axe des Y on a le nombre cumulé de contagions, et sur l'axe X, le temps. Et sur le côté droit, nous montrons les mêmes données, mais ici avec une incidence quotidienne. Et ce que nous montrons ici est que -- comme, ici -- très peu de gens sont touchés, puis de plus en plus jusqu'à ici, et voici le pic de l'épidémie. Mais vers la gauche est ce qui se passe chez les individus centraux. Et cette différence de temps entre les deux est la détection précoce, l'alerte précoce que nous pouvons obtenir, au sujet d'une épidémie imminente dans la population humaine.

The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.

Le problème, cependant, est que la cartographie des réseaux sociaux humains n'est pas toujours possible. Ca peut être coûteux, [très difficile], contraire à l'éthique, ou, franchement, tout simplement impossible de faire une telle chose. Alors, comment pouvons-nous comprendre qui sont les personnages centraux sont dans un réseau sans faire la cartographie du réseau ? Ce que nous avons mis en place est d'exploiter un fait ancien, ou un fait connu, sur les réseaux sociaux, qui est la chose suivante : Savez-vous que vos amis ont plus d'amis que vous ? Vos amis ont plus d'amis que vous. Et c'est ce qu'on appelle le paradoxe de l'amitié. Imaginez une personne très populaire dans le réseau social -- comme un organisateur de soirées qui a des centaines d'amis -- et un misanthrope qui n'a qu'un seul ami, et vous prenez quelqu'un au hasard dans la population ; ils sont beaucoup plus susceptibles de connaître l'hôte. Et s'ils désignent l'hôte comme leur ami, cette personne a une centaine d'amis, par conséquent, a plus d'amis qu’eux. Et ce, en substance, est ce qu'on appelle le paradoxe de l'amitié. Les amis de personnes choisies au hasard ont un plus haut degré, et sont plus centraux, que les gens au hasard eux-mêmes.

And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.

Et vous pouvez vous faire une idée intuitive de cela si vous regardez juste les gens de la périphérie du réseau. Si vous choisissez cette personne, le seul ami qu'ils peuvent nommer est celui-ci, qui, par construction, doit avoir au moins deux, et donc plus d’amis. Et c’est ce qui se passe à chaque nœud périphérique. Et en fait, cela arrive dans tout le réseau à mesure que vous vous déplacez, quiconque vous choisissez, quand ils nomment au hasard ... quand une personne tirée au sort désigne un de ses amis, vous vous rapprochez du centre du réseau. Donc, nous avons pensé à exploiter cette idée afin de voir si nous pouvions prévoir les phénomènes au sein des réseaux. Parce que maintenant, avec cette idée, nous pouvons prendre un échantillon aléatoire de personnes, les inviter à désigner leurs amis, ceux-ci seraient plus centraux, et nous pourrions le faire sans avoir à la carte du réseau.

And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.

Et nous avons testé cette idée avec une épidémie de grippe H1N1 au Collège Harvard à l'automne et l'hiver 2009, il y a quelques mois. Nous avons pris 1 300 étudiants choisis au hasard, ils ont indiqué leurs amis, et nous avons suivi à la fois les étudiants tirés au sort et leurs amis tous les jours pour voir si ils avaient ou non contracté la grippe. Et nous avons fait cela passivement en regardant si oui ou non ils étaient allés aux services de santé universitaires. Et aussi, nous leur avions demandé de nous envoyer un email plusieurs fois par semaine. Ce que nous avions exactement prédit est arrivé. Le groupe aléatoire est cette ligne rouge. L'épidémie dans le groupe d'amis s'est déplacée vers la gauche, par ici. Et la différence entre les deux est de 16 jours. En surveillant le groupe d'amis, nous avons pu obtenir une alerte 16 jours à l'avance d'une épidémie imminente dans cette population humaine.

Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.

Maintenant, en plus de cela, si vous étiez un analyste qui essaie d'étudier une épidémie ou de prévoir l'adoption d'un produit, par exemple, ce que vous pouvez faire est de choisir un échantillon aléatoire de la population, leur demander d’indiquer leurs amis et suivre ces amis, et suivre la population aléatoire et les amis. Parmi les amis, la première preuve que vous avez vu d'un top au-dessus de zéro dans l'adoption de l'innovation, par exemple, serait la preuve d'une épidémie imminente. Ou vous pouvez chercher la première fois que les deux courbes divergent, comme indiqué sur la gauche. Quand les aléatoires... quand les amis ont-ils décollé et laissé les "aléatoires", et [quand] la courbe a-t-elle commencé à virer ? Et ceci, comme indiqué par la ligne blanche, s’est produit 46 jours avant le pic de l'épidémie. Ce serait donc une technique avec laquelle nous pourrions obtenir une alerte plus d'un mois et demi avant une épidémie de grippe dans une population donnée.

I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.

Je dois dire que l’avance avec laquelle on peut obtenir une information sur quelque chose dépend d'une multitude de facteurs. Cela peut dépendre de la nature de l'agent pathogène - différents agents pathogènes, avec cette technique, vous obtiendrez des alertes différentes -- ou d'autres phénomènes qui se répandent, ou, franchement, de la structure du réseau humain. Maintenant, dans notre cas, bien que ce n’était pas nécessaire, nous pourrions également faire la carte du réseau des étudiants.

So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.

Donc, voici la carte des 714 étudiants et leurs liens d'amitié. Et dans une minute, je vais mettre cette carte en mouvement. Nous allons prendre des photos quotidiennes à travers le réseau pendant 120 jours. Les points rouges vont être les cas de grippe, et les points jaunes, les amis des personnes atteintes de la grippe. Et la taille des points va être proportionnelle au nombre d’amis qui ont la grippe. Donc, plus les points sont gros, plus de vos amis ont la grippe. Et si vous regardez cette image -- nous voici maintenant le 13 Septembre -- vous allez voir quelques cas se déclarer. Vous allez voir une sorte d’éclosion de la grippe au milieu. Ici nous sommes le 19 Octobre. La pente de la courbe de l'épidémie est proche maintenant, en Novembre. Bang, bang, bang, bang, bang, vous allez voir beaucoup d’éclosions au milieu, et puis vous allez voir une sorte de nivellement, de moins en moins de cas vers la fin de Décembre. Et ce type de visualisation peut montrer que les épidémies comme celle-ci prennent racine et affectent les individus du centre d'abord, avant qu'ils n'affectent les autres.

Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.

Maintenant, comme je l'ai laissé entendre, cette méthode n'est pas limitée aux germes, mais en fait, à tout ce qui se propage dans les populations. L'information se répand dans les populations. Des normes peuvent se propager dans les populations. Des comportements peuvent se propager dans les populations. Et par des comportements, je veux dire des choses comme un comportement criminel, ou le comportement de vote, ou le comportement relatif à la santé comme le tabagisme, ou la vaccination, l'adoption d'un produit ou, ou d'autres types de comportements qui ont trait à l'influence interpersonnelle. Si je suis susceptible de faire quelque chose qui affecte les autres autour de moi, cette technique peut donner une alerte précoce, ou une détection précoce, sur l'adoption au sein de la population. Le point clé est que, pour que cela fonctionne, il doit y avoir de l'influence interpersonnelle. Cela ne marche pas avec un mécanisme de diffusion qui touche tout le monde de manière uniforme.

Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.

Maintenant, les mêmes idées peuvent également être exploitées - à l'égard de réseaux - peuvent également être exploitées d'autre façons, par exemple, dans l'utilisation du ciblage de personnes en particulier pour les interventions. Ainsi, par exemple, la plupart d'entre vous sont probablement familiers avec la notion d'immunité collective. Donc, si nous avons une population d'un millier de personnes, et nous voulons en faire une population immunitaire à un agent pathogène, nous n'avons pas à immuniser chaque personne. Si nous immunisons 960 d'entre eux, c'est comme si nous avions vacciné la population tout entière. Parce que même si un ou deux des personnes non immunisées sont infectées, il n'y a personne d’autre à infecter. Ils sont entourés par des gens immunisés. Ainsi, 96 % est aussi bon que 100 %. Eh bien, d'autres scientifiques ont estimé ce qui arriverait si vous aviez pris un échantillon aléatoire de 30 % de ces 1000 personnes, 300 personnes et les faire vacciner. Obtiendrez-vous une immunité au niveau de la population ? Et la réponse est non. Mais si vous avez suivi ces 30%, ces 300 personnes, et leur avez fait nommer leurs amis puis pris le même nombre de vaccins pour vacciner les amis de ces 300, les 300 amis, vous pouvez obtenir le même niveau d'immunité de groupe que si vous aviez vaccinés 96 % de la population avec une plus grande efficacité, et une contrainte budgétaire stricte.

And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].

Et des idées similaires peuvent être utilisés, par exemple, pour cibler la distribution de choses comme les moustiquaires dans les pays en voie de développement. Si nous pouvions comprendre la structure des réseaux dans les villages, nous pourrions cibler les interventions pour promouvoir ce type de structure. Ou, franchement, pour la publicité de toutes sortes de produits. Si nous pouvions comprendre comment cibler, cela pourrait influencer l'efficacité de ce que nous essayons de réaliser. Et en fait, nous pouvons utiliser les données de toutes sortes de sources de nos jours [pour le faire].

This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.

Ceci est la carte de huit millions d'utilisateurs de téléphone dans un pays européen. Chaque point est une personne, et chaque ligne représente un volume d'appels entre les personnes. Et nous pouvons utiliser ces données, qui sont obtenues de manière passive pour cartographier ces pays entiers et comprendre qui est où dans le réseau. Sans avoir à les interroger tous, nous pouvons obtenir ce genre d'une vision structurelle. Et d'autres sources d'information, comme vous le savez sans doute, sont disponibles sur de telles caractéristiques, à partir des interactions e-mail, interactions en ligne, réseaux sociaux en ligne, et ainsi de suite. Et en fait, nous sommes à l'ère de ce que j'appellerais les efforts de collecte de données "massives et passives". Il y a toutes sortes de façons d’utiliser les données recueillies massivement de créer des réseaux de capteurs pour suivre la population, comprendre ce qui se passe dans la population, et d'intervenir dans la population pour le bien. Parce que ces nouvelles technologies nous disent non seulement qui parle à qui, mais où chacun se trouve, et ce qu'ils pensent sur ce qu'ils téléchargent sur Internet, et ce qu'ils achètent en fonction de leurs achats. Et toutes ces données administratives peuvent être rassemblées et traitées pour comprendre le comportement humain d'une manière que nous n'avons jamais pu faire auparavant.

So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.

Ainsi, par exemple, nous pourrions utiliser les achats de carburant des camionneurs. Donc, les camionneurs ne vaquent qu’à leurs occupations, et ils achètent du carburant. Et nous voyons un soubresaut dans les achats de carburant des camionneurs, et nous savons que la récession touche à sa fin. Ou nous pouvons contrôler la vitesse avec laquelle les gens se déplacent avec leurs téléphones sur une route, et l’opérateur téléphonique peut voir, lorsque la vitesse décroit, qu'il y a un embouteillage. Et ils peuvent transmettre cette information à leurs abonnés, mais seulement à leurs abonnés sur la même route situés derrière les embouteillages ! Ou nous pouvons surveiller les habitudes de prescription des médecins, passivement, et voir comment la diffusion de l'innovation avec des produits pharmaceutiques se produit dans les [réseaux] de médecins. Ou encore, nous pouvons surveiller le comportement d'achat des gens, et voir comment ces types de phénomènes peuvent se diffuser dans les populations humaines.

And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.

Et il y a trois façons, je pense, d’utiliser ces données massives-passives. L'une est entièrement passive, comme je viens de le décrire -- comme dans l'exemple du camionneur, où nous n'intervenons en aucune façon au sein de la population. L’une est quasi-active, comme dans l'exemple de grippe que j'ai donné, où nous demandons à des gens de nommer leurs amis pour suivre passivement ces amis -- ont-ils la grippe, ou pas? -- Puis obtenir une alerte. Ou un autre exemple serait, si vous êtes chez un opérateur de téléphone, vous déterminez qui est central dans le réseau, et vous demandez à ces gens : "Bon, pouvez-vous nous envoyer un SMS sur votre état de fièvre tous les jours ? Envoyez-nous juste votre température." Et vous recueillez de grandes quantités d'informations sur la température des gens, mais toutes d'individus centraux. Et vous êtes capable, à grande échelle, de surveiller une épidémie imminente avec une participation très minime de personnes. Ou, enfin, elle peut être complètement active -- Je sais que les orateurs suivants en parleront aussi aujourd'hui -- où les gens peuvent contribuer à l'échelle mondiale sur des wikis , ou sur la photographie, le suivi des élections, et télécharger des informations d'une manière qui nous permet de mettre en commun l'information afin de comprendre les processus sociaux et les phénomènes sociaux.

In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.

En fait, la disponibilité de ces données, je crois, annonce une sorte de nouvelle ère de ce que moi et d'autres aimeraient appeler "La science sociale numérique." C'est un peu comme lorsque Galilée a inventé – non, n’a pas inventé – est venu à utiliser un télescope et pu voir le ciel d'une manière nouvelle, ou Leeuwenhoek a pris connaissance du microscope -- ou l’a réellement inventé -- et pu voir la biologie d'une manière nouvelle. Mais maintenant nous avons accès à ces types de données qui nous permettent de comprendre les processus sociaux et les phénomènes sociaux d'une manière entièrement nouvelle qui n'a jamais été possible auparavant. Et avec cette science, nous pouvons comprendre exactement comment l'ensemble vient à être plus que la somme de ses parties. Et effectivement, nous pouvons utiliser ces données pour améliorer la société et améliorer le bien-être.

Thank you.

Je vous remercie.

Thank you.

Je vous remercie.

Nicholas Christakis: How social networks predict epidemics

Nicholas Christakis: How social networks predict epidemics

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading