Nicholas Christakis: How social networks predict epidemics

Τα τελευταία δέκα χρόνια, περνάω τον καιρό μου προσπαθώντας να καταλάβω πώς και γιατί τα ανθρώπινα όντα συναθροίζονται σε κοινωνικά δίκτυα. Το είδος των κοινωνικών δικτύων για το οποίο μιλάω δεν είναι η πρόσφατη online ποικιλία, αλλά περισσότερο, το είδος των κοινωνικών δικτύων στα οποία τα ανθρώπινα όντα συναθροίζονται εδώ και εκατοντάδες χιλιάδες χρόνια, από τότε που εμφανιστήκαμε στην Αφρικανική σαβάνα. Λοιπόν, δημιουργώ φιλίες και συνεργατικές και αδελφικές και συγγενικές σχέσεις με άλλους ανθρώπους που με τη σειρά τους έχουν παρόμοιες σχέσεις με άλλους ανθρώπους. Και αυτό εξαπλώνεται αδιάκοπα σε μεγάλη απόσταση. Και παίρνετε ένα δίκτυο που μοιάζει με αυτό. Κάθε τελεία είναι ένα άτομο. Κάθε γραμμή ανάμεσά τους είναι μια σχέση μεταξύ δυο ανθρώπων -- διάφορα είδη σχέσεων. Και μπορείτε να πάρετε αυτό το είδος τεράστιου ιστού της ανθρωπότητας, στον οποίο όλοι είμαστε ενσωματωμένοι.

For the last 10 years, I've been spending my time trying to figure out how and why human beings assemble themselves into social networks. And the kind of social network I'm talking about is not the recent online variety, but rather, the kind of social networks that human beings have been assembling for hundreds of thousands of years, ever since we emerged from the African savannah. So, I form friendships and co-worker and sibling and relative relationships with other people who in turn have similar relationships with other people. And this spreads on out endlessly into a distance. And you get a network that looks like this. Every dot is a person. Every line between them is a relationship between two people -- different kinds of relationships. And you can get this kind of vast fabric of humanity, in which we're all embedded.

Ο συνεργάτης μου, ο Τζέιμς Φάουλερ κι εγώ μελετάμε εδώ και αρκετό καιρό ποιοι είναι οι μαθηματικοί, κοινωνικοί, βιολογικοί και ψυχολογικοί κανόνες που καθορίζουν πώς σχηματίζονται αυτά τα δίκτυα και ποιοι είναι οι παρόμοιοι κανόνες που καθορίζουν τον τρόπο που αυτά διευθύνουν, που επηρεάζουν τις ζωές μας. Και πρόσφατα, αναρωτιώμαστε αν θα ήταν δυνατό να επωφεληθούμε από αυτή την επίγνωση, ώστε πράγματι να βρούμε τρόπους να βελτιώσουμε τον κόσμο, να κάνουμε κάτι καλύτερο, πράγματι να διορθώσουμε πράγματα, όχι απλώς να τα καταλάβουμε. Έτσι ένα από τα πρώτα πράγματα που σκεφτήκαμε να αντιμετωπίσουμε ήταν πώς προσεγγίζουμε την πρόβλεψη επιδημιών.

And my colleague, James Fowler and I have been studying for quite sometime what are the mathematical, social, biological and psychological rules that govern how these networks are assembled and what are the similar rules that govern how they operate, how they affect our lives. But recently, we've been wondering whether it might be possible to take advantage of this insight, to actually find ways to improve the world, to do something better, to actually fix things, not just understand things. So one of the first things we thought we would tackle would be how we go about predicting epidemics.

Και η τρέχουσα πρακτική στην πρόβλεψη μιας επιδημίας -- αν είστε το ΚΕΕΛΠΝΟ ή κάποιο άλλο εθνικό σώμα -- είναι να καθήσεις στη μέση εκεί που είσαι και να συλλέγεις δεδομένα από γιατρούς και εργαστήρια του τομέα που αναφέρουν την εξάπλωση ή τη συχνότητα συγκεκριμένων καταστάσεων. Λοιπόν, τόσοι ασθενείς έχουν διαγνωστεί με κάτι ή άλλοι ασθενείς έχουν διαγνωστεί, και όλα αυτά τα δεδομένα τροφοδοτούν ένα κεντρικό αρχειοστάσιο, με κάποια καθυστέρηση. Και αν όλα κυλήσουν ομαλά, σε μία με δύο βδομάδες από τώρα, θα ξέρετε πού ήταν η επιδημία σήμερα. Και πράγματι, πριν από περίπου ένα χρόνο, υπήρξε αυτή η δημοσίευση της ιδέας του Google Flu Trends, αναφορικά με τη γρίπη, όπου, παρατηρώντας τι αναζητούν οι άνθρωποι σήμερα, θα μπορούσαμε να ξέρουμε που η γρίπη ... ποια ήταν η κατάσταση της επιδημίας σήμερα, ποια ήταν η εξάπλωση της επιδημίας σήμερα.

And the current state of the art in predicting an epidemic -- if you're the CDC or some other national body -- is to sit in the middle where you are and collect data from physicians and laboratories in the field that report the prevalence or the incidence of certain conditions. So, so and so patients have been diagnosed with something, or other patients have been diagnosed, and all these data are fed into a central repository, with some delay. And if everything goes smoothly, one to two weeks from now you'll know where the epidemic was today. And actually, about a year or so ago, there was this promulgation of the idea of Google Flu Trends, with respect to the flu, where by looking at people's searching behavior today, we could know where the flu -- what the status of the epidemic was today, what's the prevalence of the epidemic today.

Αλλά αυτό που θα ήθελα να σας δείξω σήμερα είναι ένα μέσο με το οποίο θα μπορούσαμε να πάρουμε όχι απλώς ταχεία προειδοποίηση για μια επιδημία, αλλά επίσης πραγματικά έγκαιρη ανίχνευση μιας επιδημίας. Και αυτή η ιδέα μπορεί να χρησιμοποιηθεί όχι απλά στην πρόβλεψη επιδημιών από μικρόβια αλλά επίσης στην πρόβλεψη επιδημιών κάθε είδους. Για παράδειγμα, κάθε τι που εξαπλώνεται με μια μορφή κοινωνικής μετάδοσης θα μπορούσε να γίνει κατανοητό με αυτό τον τρόπο, από αφηρημένες ιδέες στα αριστερά όπως ο πατριωτισμός, ή ο αλτρουισμός, ή η θρησκεία, μέχρι συνήθειες όπως διατροφικές συνήθειες, ή αγορά βιβλίων, ή κατανάλωση αλκοόλ, ή κράνη ποδηλάτων [και] άλλα μέτρα ασφαλείας, ή προϊόντα που οι άνθρωποι ίσως αγόραζαν, αγορές ηλεκτρονικών αγαθών, οτιδήποτε στο οποίο ενυπάρχει ένα είδος διαπροσωπικής εξάπλωσης. Ένα είδος διάχυσης καινοτομίας θα μπορούσε να γίνει κατανοητό και να προβλεφθεί από το μηχανισμό τον οποίο πρόκειται να σας δείξω τώρα.

But what I'd like to show you today is a means by which we might get not just rapid warning about an epidemic, but also actually early detection of an epidemic. And, in fact, this idea can be used not just to predict epidemics of germs, but also to predict epidemics of all sorts of kinds. For example, anything that spreads by a form of social contagion could be understood in this way, from abstract ideas on the left like patriotism, or altruism, or religion to practices like dieting behavior, or book purchasing, or drinking, or bicycle-helmet [and] other safety practices, or products that people might buy, purchases of electronic goods, anything in which there's kind of an interpersonal spread. A kind of a diffusion of innovation could be understood and predicted by the mechanism I'm going to show you now.

Λοιπόν, όπως πιθανώς όλοι γνωρίζετε, ο κλασικός τρόπος να σκεφτόμαστε γι' αυτό είναι η διάχυση καινοτομίας, ή η καμπύλη υιοθέτησης. Έτσι εδώ στον άξονα Υ, έχουμε το ποσοστό των ανθρώπων που επηρεάζονται, και στον άξονα Χ, έχουμε το χρόνο. Και ακριβώς στην αρχή, δεν έχουν επηρεαστεί πάρα πολλοί άνθρωποι, και παίρνετε αυτή την κλασική σιγμοειδή, ή σχήματος S, καμπύλη. Και ο λόγος γι' αυτό το σχήμα είναι ότι ακριβώς στην αρχή, ας πούμε ένας ή δυο άνθρωποι έχουν επηρεαστεί, ή μολυνθεί, από τον παράγοντα, και στη συνέχεια επηρεάζουν ή μολύνουν, δυο ανθρώπους, που με τη σειρά τους επηρεάζουν τέσσερις, οκτώ, δεκαέξι κ.ο.κ., και έχετε την επιδημική φάση αύξησης της καμπύλης. Και τελικά, γεμίζετε όλο τον πληθυσμό. Υπάρχουν όλο και λιγότεροι άνθρωποι που ακόμα θα μπορούσατε να μολύνετε, και τότε παίρνετε το πλατώ της καμπύλης, και έχετε αυτή την κλασική σιγμοειδή καμπύλη. Και αυτό ισχύει για μικρόβια, ιδέες, υιοθέτηση προϊόντων, συμπεριφορές, και τα συναφή. Αλλά τα πράγματα δεν διαχέονται απλά στους ανθρώπινους πληθυσμούς τυχαία. Στην πραγματικότητα διαχέονται μέσω δικτύων. Επειδή, όπως είπα, ζούμε τις ζωές μας σε δίκτυα, και αυτά τα δίκτυα έχουν ένα συγκεκριμένο είδος δομής.

So, as all of you probably know, the classic way of thinking about this is the diffusion-of-innovation, or the adoption curve. So here on the Y-axis, we have the percent of the people affected, and on the X-axis, we have time. And at the very beginning, not too many people are affected, and you get this classic sigmoidal, or S-shaped, curve. And the reason for this shape is that at the very beginning, let's say one or two people are infected, or affected by the thing and then they affect, or infect, two people, who in turn affect four, eight, 16 and so forth, and you get the epidemic growth phase of the curve. And eventually, you saturate the population. There are fewer and fewer people who are still available that you might infect, and then you get the plateau of the curve, and you get this classic sigmoidal curve. And this holds for germs, ideas, product adoption, behaviors, and the like. But things don't just diffuse in human populations at random. They actually diffuse through networks. Because, as I said, we live our lives in networks, and these networks have a particular kind of a structure.

Τώτα αν κοιτάξετε ένα δίκτυο σαν αυτό ... Αυτό είναι 105 άνθρωποι. Και οι γραμμές απεικονίζουν ... οι τελείες είναι οι άνθρωποι, και οι γραμμές απεικονίζουν φιλικές σχέσεις. Μπορεί να βλέπετε ότι οι άνθρωποι καταλαμβάνουν διαφορετικές θέσεις μέσα στο δίκτυο. Και υπάρχουν διαφορετικά είδη σχέσεων μεταξύ των ανθρώπων. Θα μπορούσατε να έχετε φιλικές σχέσεις, αδελφικές σχέσεις, συζυγικές σχέσεις, συναδελφικές σχέσεις, γειτονικές σχέσεις και τα συναφή. Και διαφορετικά είδη πραγμάτων εξαπλώνονται κατά μήκος διαφορετικών ειδών δεσμών. Για παράδειγμα, σεξουαλικώς μεταδιδόμενες ασθένειες θα εξαπλώνονται κατά μήκος σεξουαλικών δεσμών. Ή, για παράδειγμα, η καπνιστική συμπεριφορά των ανθρώπων θα μπορούσε να επηρεαστεί από τους φίλους τους. Ή η αλτρουιστική ή η φιλανθρωπική τους συμπεριφορά θα μπορούσε να επηρεαστεί από τους συνεργάτες τους, ή από τους γείτονές τους. Αλλά δεν είναι όλες οι θέσεις μέσα στο δίκτυο ίδιες.

Now if you look at a network like this -- this is 105 people. And the lines represent -- the dots are the people, and the lines represent friendship relationships. You might see that people occupy different locations within the network. And there are different kinds of relationships between the people. You could have friendship relationships, sibling relationships, spousal relationships, co-worker relationships, neighbor relationships and the like. And different sorts of things spread across different sorts of ties. For instance, sexually transmitted diseases will spread across sexual ties. Or, for instance, people's smoking behavior might be influenced by their friends. Or their altruistic or their charitable giving behavior might be influenced by their coworkers, or by their neighbors. But not all positions in the network are the same.

Έτσι αν κοιτάξετε αυτό, θα μπορούσατε αμέσως να αντιληφθείτε ότι διαφορετικοί άνθρωποι έχουν διαφορετικούς αριθμούς συνδέσμων. Μερικοί άνθρωποι έχουν ένα σύνδεσμο, μερικοί έχουν δύο, μερικοί έχουν έξι, μερικοί έχουν δέκα συνδέσμους. Και αυτό ονομάζεται "βαθμός" κόμβου, ή ο αριθμός των συνδέσμων που έχει ένας κόμβος. Αλλά, επιπροσθέτως, υπάρχει κάτι άλλο. Λοιπόν, αν κοιτάξετε τους κόμβους Α και Β, και οι δυο έχουν έξι συνδέσμους Αλλά αν μπορείτε να δείτε αυτή την εικόνα [του δικτύου] από ψηλά, μπορείτε να καταλάβετε ότι υπάρχει κάτι πολύ διαφορετικό σχετικά με τους κόμβους Α και Β. Λοιπον, επιτρέψτε μου να σας ρωτήσω το εξής -- Μπορώ να καλλιεργήσω αυτή τη διαίσθηση κάνοντας μια ερώτηση -- ποιος θα προτιμούσατε να είστε αν ένα θανατηφόρο μικρόβιο εξαπλωνόταν μέσω του δικτύου, ο Α ή ο Β; (Κοινό: ο Β) Νικόλας Χριστάκης: ο Β, είναι προφανές. Ο Β είναι τοποθετημένος στην άκρη του δκτύου. Τώρα, ποιος θα προτιμούσατε να είστε αν ένα ζουμερό κουτσομπολιό εξαπλωνόταν μέσω του δικτύου; Ο Α. Και έχετε μια άμεση εκτίμηση ότι ο Α είναι πιο πιθανό να πάρει αυτό που εξαπλώνεται και να το πάρει γρηγορότερα λόγω της δομικής του θέσης μέσα στο δίκτυο. Ο Α, στην πραγματικότητα, είναι πιο κεντρικός, και αυτό μπορεί να επικυρωθεί μαθηματικά. Έτσι, αν θέλαμε να εντοπίσουμε κάτι που εξαπλωνόταν μέσω ενός δικτύου, το ιδανικό θα ήταν να βάλουμε αισθητήρες στα κεντρικά άτομα μέσα στο δίκτυο, συμπεριλαμβανομένου του κόμβου A, να παρακολουθούμε εκείνους τους ανθρώπους που είναι ακριβώς εκεί στη μέση του δικτύου, και με κάποιο τρόπο να έχουμε μια έγκαιρη ανίχνευση από οτιδήποτε κι αν είναι αυτό που εξαπλώνεται μέσω του δικτύου.

So if you look at this, you might immediately grasp that different people have different numbers of connections. Some people have one connection, some have two, some have six, some have 10 connections. And this is called the "degree" of a node, or the number of connections that a node has. But in addition, there's something else. So, if you look at nodes A and B, they both have six connections. But if you can see this image [of the network] from a bird's eye view, you can appreciate that there's something very different about nodes A and B. So, let me ask you this -- I can cultivate this intuition by asking a question -- who would you rather be if a deadly germ was spreading through the network, A or B? (Audience: B.) Nicholas Christakis: B, it's obvious. B is located on the edge of the network. Now, who would you rather be if a juicy piece of gossip were spreading through the network? A. And you have an immediate appreciation that A is going to be more likely to get the thing that's spreading and to get it sooner by virtue of their structural location within the network. A, in fact, is more central, and this can be formalized mathematically. So, if we want to track something that was spreading through a network, what we ideally would like to do is to set up sensors on the central individuals within the network, including node A, monitor those people that are right there in the middle of the network, and somehow get an early detection of whatever it is that is spreading through the network.

Με άλλα λόγια, αν τους βλέπατε να έρχονται σε επαφή με ένα μικρόβιο ή μια πληροφορία, θα γνωρίζατε ότι, αρκετά σύντομα, ο καθένας θα επρόκειτο να έρθει σε επαφή με αυτό το μικρόβιο ή με αυτή την πληροφορία. Και αυτό θα ήταν πολύ καλύτερο από το να παρακολουθείς έξι τυχαία επιλεγμένους ανθρώπους, χωρίς αναφορά στη δομή του πληθυσμού. Και στην πραγματικότητα, αν θα μπορούσατε να κάνετε αυτό, αυτό που θα βλέπατε είναι κάτι σαν κι αυτό. Στον πίνακα στ' αριστερά, πάλι, έχουμε τη σιγμοειδή καμπύλη υιοθέτησης. Στη διακεκομμένη κόκκινη γραμμή, δείχνουμε πως θα ήταν η υιοθέτηση σε τυχαίους ανθρώπους, και στη γραμμή στ' αριστερά, μετατοπισμένη στ' αριστερά, δείχνουμε πως θα ήταν η υιοθέτηση στα κεντρικά άτομα μέσα στο δίκτυο. Στον άξονα Υ είναι οι αθροιστικές περιπτώσεις μετάδοσης, και στον άξονα των Χ είναι ο χρόνος. Και στη δεξιά πλευρά, δείχνουμε τα ίδια δεδομένα, αλλά εδώ με ημερήσια συχνότητα. Και αυτό που δείχνουμε εδώ είναι -- όπως εδώ -- πολύ λίγοι άνθρωποι επηρεάζονται, περισσότεροι και περισσότεροι και περισσότεροι και ως εδώ, και εδώ είναι η κορυφή της επιδημίας. Αλλά μετατοπισμένο στ' αριστερά είναι αυτό που συμβαίνει στα κεντρικά άτομα. Και αυτή η διαφορά στο χρόνο μεταξύ των δυο είναι η έγκαιρη ανίχνευση, η έγκαιρη προειδοποίηση που μπορούμε να έχουμε, για μια επικείμενη επιδημία στον ανθρώπινο πληθυσμό.

So if you saw them contract a germ or a piece of information, you would know that, soon enough, everybody was about to contract this germ or this piece of information. And this would be much better than monitoring six randomly chosen people, without reference to the structure of the population. And in fact, if you could do that, what you would see is something like this. On the left-hand panel, again, we have the S-shaped curve of adoption. In the dotted red line, we show what the adoption would be in the random people, and in the left-hand line, shifted to the left, we show what the adoption would be in the central individuals within the network. On the Y-axis is the cumulative instances of contagion, and on the X-axis is the time. And on the right-hand side, we show the same data, but here with daily incidence. And what we show here is -- like, here -- very few people are affected, more and more and more and up to here, and here's the peak of the epidemic. But shifted to the left is what's occurring in the central individuals. And this difference in time between the two is the early detection, the early warning we can get, about an impending epidemic in the human population.

Το πρόβλημα, πάντως, είναι ότι η χαρτογράφηση των ανθρώπινων κοινωνικών δικτύων δεν είναι πάντα δυνατή. Μπορεί να είναι ακριβή, [πολύ δύσκολη], ανήθικη, ή, ειλικρινά, απλά μη δυνατό να κάνεις κάτι τέτοιο. Λοιπόν, πώς μπορούμε να καταλάβουμε ποιοι είναι οι κεντρικοί άνθρωποι σε ένα δίκτυο χωρίς στην πραγματικότητα να χαρτογραφήσουμε το δίκτυο; Αυτό που σκεφτήκαμε ήταν μια ιδέα να εκμεταλλευτούμε ένα παλιό δεδομένο, ή ένα γνωστό δεδομένο, για τα κοινωνικά δίκτυα, που πηγαίνει κάπως έτσι: Γνωρίζετε ότι οι φίλοι σας έχουν περισσότερους φίλους από ότι εσείς; Οι φίλοι σας έχουν περισσότερους φίλους από εσάς. Και αυτό είναι γνωστό ως το παράδοξο της φιλίας. Φανταστείτε ένα πολύ δημοφιλές άτομο στο κοινωνικό δίκτυο -- όπως έναν οικοδεσπότη πάρτυ που έχει εκατοντάδες φίλους -- και έναν μισάνθρωπο που έχει μόνο ένα φίλο, και διαλέγετε τυχαία κάποιους από τον πληθυσμό, θα ήταν πολύ πιο πιθανό να γνωρίζουν τον οικοδεσπότη του πάρτυ. Και αν ονομάσουν τον οικοδεσπότη του πάρτυ φίλο τους, εκείνος ο οικοδεσπότης του πάρτυ έχει εκατό φίλους, συνεπώς, έχει περισσότερους φίλους από όσους έχουν αυτοί. Και αυτό, κατ' ουσίαν, είναι γνωστό ως το παράδοξο της φιλίας. Οι φίλοι τυχαία επιλεγμένων ανθρώπων έχουν υψηλότερο βαθμό, και είναι πιο κεντρικοί, από τους ίδιους τους τυχαίους ανθρώπους.

The problem, however, is that mapping human social networks is not always possible. It can be expensive, not feasible, unethical, or, frankly, just not possible to do such a thing. So, how can we figure out who the central people are in a network without actually mapping the network? What we came up with was an idea to exploit an old fact, or a known fact, about social networks, which goes like this: Do you know that your friends have more friends than you do? Your friends have more friends than you do, and this is known as the friendship paradox. Imagine a very popular person in the social network -- like a party host who has hundreds of friends -- and a misanthrope who has just one friend, and you pick someone at random from the population; they were much more likely to know the party host. And if they nominate the party host as their friend, that party host has a hundred friends, therefore, has more friends than they do. And this, in essence, is what's known as the friendship paradox. The friends of randomly chosen people have higher degree, and are more central than the random people themselves.

Και μπορείτε να έχετε μια διαισθητική εκτίμηση γι' αυτό αν φανταστείτε απλώς τους ανθρώπους στην περίμετρο του δικτύου. Αν διαλέξετε αυτό το άτομο, ο μόνος φίλος που έχουν να κατονομάσουν είναι αυτό το άτομο, ο οποίος, λόγω κατασκευής, πρέπει να έχει τουλάχιστον δύο, και τυπικά περισσότερους, φίλους. Και αυτό συμβαίνει σε κάθε περιφερειακό κόμβο. Και στην πραγματικότητα, αυτό συμβαίνει σε όλο το δίκτυο καθώς κινείσαι μέσα σ'αυτό, καθένας που διαλέγεις, όταν ονομάζουν έναν τυχαίο ... όταν ένα τυχαίο άτομο ονομάζει ένα φίλο του, κινείσαι πλησιέστερα προς το κέντρο του δικτύου. Λοιπόν, σκεφτήκαμε να εξερευνήσουμε αυτή την ιδέα με σκοπό να μελετήσουμε αν θα μπορούσαμε να προβλέψουμε φαινόμενα μέσα σε δίκτυα. Επειδή τώρα, με αυτή την ιδέα, μπορούμε να πάρουμε ένα τυχαίο δείγμα ανθρώπων, να τους ζητήσουμε να ονομάσουν τους φίλους τους, εκείνοι οι φίλοι θα ήταν πιο κεντρικοί, και θα μπορούσαμε να το κάνουμε χωρίς να χρειάζεται να χαρτογραφήσουμε το δίκτυο.

And you can get an intuitive appreciation for this if you imagine just the people at the perimeter of the network. If you pick this person, the only friend they have to nominate is this person, who, by construction, must have at least two and typically more friends. And that happens at every peripheral node. And in fact, it happens throughout the network as you move in, everyone you pick, when they nominate a random -- when a random person nominates a friend of theirs, you move closer to the center of the network. So, we thought we would exploit this idea in order to study whether we could predict phenomena within networks. Because now, with this idea we can take a random sample of people, have them nominate their friends, those friends would be more central, and we could do this without having to map the network.

Και τεστάραμε αυτή την ιδέα με μια έξαρση της γρίπης Η1Ν1 στο Κολλέγιο Χάρβαρντ το φθινόπωρο και το χειμώνα του 2009, μόλις λίγους μήνες πριν. Πήραμε 1300 τυχαία επιλεγμένους φοιτητές, τους ζητήσαμε να ονομάσουν τους φίλους τους, και ακολουθήσαμε και τους τυχαίους φοιτητές και τους φίλους τους καθημερινά για να δούμε αν είχαν ή όχι την επιδημία γρίπης. Και το κάναμε αυτό παθητικά εξετάζοντας αν είχαν πάει ή όχι στις υπηρεσίες υγείας του πανεπιστημίου. Και επίσης, τους ζητήσαμε [ενεργητικά] να μας στέλνουν ένα ηλεκτρονικό μήνυμα δυο φορές την εβδομάδα. Ακριβώς αυτό που προβλέψαμε συνέβη. Λοιπόν η τυχαία ομάδα είναι στην κόκκινη γραμμή. Η επιδημία στην ομάδα των φίλων έχει μετατοπιστεί στα αριστερά, εδώ. Και η διαφορά ανάμεσα στα δυο είναι 16 μέρες. Παρακολουθώντας την ομάδα των φίλων, θα μπορούσαμε να έχουμε προειδοποίηση 16 μέρες πριν από μια επικείμενη επιδημία σε αυτό τον ανθρώπινο πληθυσμό.

And we tested this idea with an outbreak of H1N1 flu at Harvard College in the fall and winter of 2009, just a few months ago. We took 1,300 randomly selected undergraduates, we had them nominate their friends, and we followed both the random students and their friends daily in time to see whether or not they had the flu epidemic. And we did this passively by looking at whether or not they'd gone to university health services. And also, we had them [actively] email us a couple of times a week. Exactly what we predicted happened. So the random group is in the red line. The epidemic in the friends group has shifted to the left, over here. And the difference in the two is 16 days. By monitoring the friends group, we could get 16 days advance warning of an impending epidemic in this human population.

Λοιπόν, επιπροσθέτως, αν ήσασταν ένας αναλυτής που προσπαθούσε να μελετήσει μια επιδημία ή να προβλέψει την υιοθέτηση ενός προϊόντος, για παράδειγμα, αυτό που να μπορούσατε να κάνετε είναι να διαλέξετε ένα τυχαίο δείγμα του πληθυσμού να τους ζητήσετε να ονομάσουν τους φίλους τους και να ακολουθήσουν τους φίλους τους, και να ακολουθήσετε και τους τυχαίους και τους φίλους. Ανάμεσα στους φίλους, η πρώτη ένδειξη που θα βλέπατε μιας μικρής μεταβολής πάνω από το μηδέν στην υιοθέτηση καινοτομίας, για παράδειγμα, θα ήταν στοιχείο για μια επικείμενη επιδημία. Ή θα μπορούσατε να δείτε την πρώτη φορά που οι δυο καμπύλες απέκλιναν, όπως φαίνεται στ' αριστερά. Πότε οι τυχαίοι ... πότε οι φίλοι απομακρύνθηκαν και άφησαν τους τυχαίους, και [πότε] οι καμπύλες άρχισαν να μετατοπίζονται; Και αυτό, όπως φαίνεται από τη λευκή γραμμή, συνέβη 46 μέρες πριν την έξαρση της επιδημίας. Έτσι αυτό θα μπορούσε να είναι μια τεχνική όπου θα μπορούσαμε να πάρουμε προειδοποίηση ενάμιση μήνα νωρίτερα για μια επιδημία γρίπης σε ένα συγκεκριμένο πληθυσμό.

Now, in addition to that, if you were an analyst who was trying to study an epidemic or to predict the adoption of a product, for example, what you could do is you could pick a random sample of the population, also have them nominate their friends and follow the friends and follow both the randoms and the friends. Among the friends, the first evidence you saw of a blip above zero in adoption of the innovation, for example, would be evidence of an impending epidemic. Or you could see the first time the two curves diverged, as shown on the left. When did the randoms -- when did the friends take off and leave the randoms, and [when did] their curve start shifting? And that, as indicated by the white line, occurred 46 days before the peak of the epidemic. So this would be a technique whereby we could get more than a month-and-a-half warning about a flu epidemic in a particular population.

Θα έλεγα ότι το πόσο νωρίς θα μπορούσε κάποιος να έχει μια προειδοποίηση για κάτι εξαρτάται από διάφορους παράγοντες. Θα μπορούσε να εξαρτηθεί από τη φύση του παθογόνου -- διαφορετικά παθογόνα, με αυτή την τεχνική, θα παίρνατε διαφορετικές προειδοποιήσεις -- ή από άλλα φαινόμενα που εξαπλώνονται, ή, ειλικρινά, από τη δομή του ανθρώπινου δικτύου. Τώρα, στην περίπτωσή μας, αν και δεν ήταν απαραίτητο, θα μπορούσαμε στην πραγματικότητα να χαρτογραφήσουμε το δίκτυο των φοιτητών.

I should say that how far advanced a notice one might get about something depends on a host of factors. It could depend on the nature of the pathogen -- different pathogens, using this technique, you'd get different warning -- or other phenomena that are spreading, or frankly, on the structure of the human network. Now in our case, although it wasn't necessary, we could also actually map the network of the students.

Αυτός, λοιπόν, είναι ένας χάρτης 714 φοιτητών και των φιλικών δεσμών τους. Και σε ένα λεπτό, πρόκειται να θέσω αυτό το χάρτη σε κίνηση. Πρόκειται να πάρουμε καθημερινές τομές μέσα στο δίκτυο για 120 μέρες. Οι κόκκινες τελείες θα είναι περιπτώσεις γρίπης, και οι κίτρινες τελείες θα είναι φίλοι των ανθρώπων με γρίπη. Και το μέγεθος των τελειών θα είναι ανάλογο με το πόσοι από τους φίλους τους έχουν γρίπη. Έτσι μεγαλύτερες τελείες σημαίνει ότι περισσότεροι από τους φίλους σου έχουν γρίπη. Και αν κοιτάξετε αυτή την εικόνα -- εδώ είμαστε τώρα στις 13 Σεπτεμβρίου -- θα δείτε λίγες περιπτώσεις να φωτίζονται. Πρόκειται να δείτε κάτι σαν έξαρση της γρίπης στη μέση. Εδώ είμαστε στις 19 Οκτωβρίου. Η κλίση της επιδημικής καμπύλης πλησιάζει εδώ, στο Νοέμβριο. Μπανγκ, μπανγκ, μπανγκ, μπανγκ, μπανγκ, πρόκειται να δείτε πολλές εξάρσεις στη μέση, και πρόκειται να δείτε ένα είδος ύφεσης, όλο και λιγότερες περιπτώσεις προς τα τέλη Δεκεμβρίου. Και αυτός ο τύπος οπτικοποίησης μπορεί να δείξει ότι επιδημίες σαν κι αυτή ξεκινούν και επηρεάζουν τα κεντρικά άτομα πρώτα, πριν επηρεάσουν άλλους.

So, this is a map of 714 students and their friendship ties. And in a minute now, I'm going to put this map into motion. We're going to take daily cuts through the network for 120 days. The red dots are going to be cases of the flu, and the yellow dots are going to be friends of the people with the flu. And the size of the dots is going to be proportional to how many of their friends have the flu. So bigger dots mean more of your friends have the flu. And if you look at this image -- here we are now in September the 13th -- you're going to see a few cases light up. You're going to see kind of blooming of the flu in the middle. Here we are on October the 19th. The slope of the epidemic curve is approaching now, in November. Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle, and then you're going to see a sort of leveling off, fewer and fewer cases towards the end of December. And this type of a visualization can show that epidemics like this take root and affect central individuals first, before they affect others.

Λοιπόν, όπως προτείνω, αυτή η μέθοδος δεν περιορίζεται σε μικρόβια, αλλά στην πραγματικότητα σε οτιδήποτε εξαπλώνεται σε πληθυσμούς. Οι πληροφορίες εξαπλώνονται σε πληθυσμούς. Τα πρότυπα μπορούν να εξαπλώνονται σε πληθυσμούς. Οι συμπεριφορές μπορούν να εξαπλώνονται σε πληθυσμούς. Και λέγοντας συμπεριφορές, μπορώ να εννοώ πράγματα όπως η εγκληματική συμπεριφορά, ή η εκλογική συμπεριφορά, ή η συμπεριφορά σχετικά με την υγεία, όπως το κάπνισμα, ή ο εμβολιασμός, ή η υιοθέτηση προϊόντος, ή άλλα είδη συμπεριφοράς που σχετίζονται με διαπροσωπική επιρροή. Αν είναι πιθανό να κάνω κάτι που επηρεάζει άλλους γύρω μου, αυτή η τεχνική μπορεί να δώσει έγκαιρη προειδοποίηση, ή έγκαιρη ανίχνευση, γύρω από την υιοθέτηση μέσα στον πληθυσμό. Το σημείο κλειδί είναι, ότι για να δουλέψει, θα πρέπει να υπάρχει διαπροσωπική επιρροή. Δε μπορεί να είναι λόγω κάποιου μηχανισμού μετάδοσης που επηρεάζει όλους ομοιόμορφα.

Now, as I've been suggesting, this method is not restricted to germs, but actually to anything that spreads in populations. Information spreads in populations, norms can spread in populations, behaviors can spread in populations. And by behaviors, I can mean things like criminal behavior, or voting behavior, or health care behavior, like smoking, or vaccination, or product adoption, or other kinds of behaviors that relate to interpersonal influence. If I'm likely to do something that affects others around me, this technique can get early warning or early detection about the adoption within the population. The key thing is that for it to work, there has to be interpersonal influence. It cannot be because of some broadcast mechanism affecting everyone uniformly.

Τώρα τις ίδιες επιγνώσεις μπορούμε επίσης να τις εκμεταλλευτούμε - αντίστοιχα με τα δίκτυα -- μπορούν επίσης να χρησιμοποιηθούν με άλλους τρόπους, για παράδειγμα, στη στοχοποίηση συγκεκριμένων ανθρώπων για παρεμβάσεις. Λοιπόν, για παράδειγμα, οι περισσότεροι από εσάς πιθανώς γνωρίζετε την έννοια της ανοσίας της αγέλης. Λοιπόν, αν έχουμε ένα πληθυσμό χιλίων ανθρώπων, και θέλουμε να ανοσοποιήσουμε τον πληθυσμό σε ένα παθογόνο, δε χρειάζεται να ανοσοποιήσουμε κάθε ένα άτομο. Αν ανοσοποιήσουμε 960 απ' αυτούς, είναι σα να είχαμε ανοσοποιήσει το 100% αυτών. Επειδή ακόμα κι αν ένας ή δύο από τους μη ανοσοποιημένους ανθρώπους μολυνθούν, δεν υπάρχει κανένας που να μπορούν να μολύνουν. Περιβάλλονται από ανοσοποιημένους ανθρώπους. Έτσι το 96% είναι τόσο καλό όσο και το 100%. Λοιπόν, κάποιοι άλλοι επιστήμονες έχουν υπολογίσει τι θα συνέβαινε αν παίρνατε ένα τυχαίο δείγμα του 30% από αυτούς τους 1000 ανθρώπους, 300 ανθρώπους και τους ανοσοποιούσατε. Θα είχατε ανοσία σε επίπεδο πληθυσμού; Και η απάντηση είναι όχι. Αλλά αν παίρνατε αυτό το 30%, αυτούς τους 300 ανθρώπους, και τους ζητούσατε να ονομάσουν τους φίλους τους και παίρνατε τον ίδιο αριθμό δόσεων εμβολίων και εμβολιάζατε τους φίλους των 300, τους φίλους των 300, θα μπορέσετε να έχετε το ίδιο επίπεδο ανοσίας της αγέλης σα να είχατε εμβολιάσει το 96% του πληθυσμού με πολύ μεγαλύτερη αποτελεσματικότητα, με αυστηρά περιορισμένο προϋπολογισμό.

Now the same insights can also be exploited -- with respect to networks -- can also be exploited in other ways, for example, in the use of targeting specific people for interventions. So, for example, most of you are probably familiar with the notion of herd immunity. So, if we have a population of a thousand people, and we want to make the population immune to a pathogen, we don't have to immunize every single person. If we immunize 960 of them, it's as if we had immunized a hundred [percent] of them. Because even if one or two of the non-immune people gets infected, there's no one for them to infect. They are surrounded by immunized people. So 96 percent is as good as 100 percent. Well, some other scientists have estimated what would happen if you took a 30 percent random sample of these 1000 people, 300 people and immunized them. Would you get any population-level immunity? And the answer is no. But if you took this 30 percent, these 300 people and had them nominate their friends and took the same number of vaccine doses and vaccinated the friends of the 300 -- the 300 friends -- you can get the same level of herd immunity as if you had vaccinated 96 percent of the population at a much greater efficiency, with a strict budget constraint.

Και παρόμοιες ιδέες μπορούν να χρησιμοποιηθούν, για παράδειγμα, για να κατευθύνετε την κατανομή αντικειμένων όπως οι κουνουπιέρες στον αναπτυσσόμενο κόσμο. Αν μπορούσαμε να καταλάβουμε τη δομή των δικτύων στα χωριά, θα μπορούσαμε να εστιάσουμε σε ποιον θα αναθέταμε τη μεσολάβηση για να προωθήσει αυτά τα είδη των εξαπλώσεων. Ή, ειλικρινά, για να διαφημίσουμε προϊόντα κάθε είδους. Αν μπορούσαμε να καταλάβουμε πώς να στοχεύσουμε, αυτό θα μπορούσε να επηρεάσει την αποτελεσματικότητα αυτού που προσπαθούμε να επιτύχουμε. Και στην πραγματικότητα, μπορούμε να χρησιμοποιήσουμε δεδομένα από πηγές κάθε είδους στις μέρες μας [για να το κάνουμε].

And similar ideas can be used, for instance, to target distribution of things like bed nets in the developing world. If we could understand the structure of networks in villages, we could target to whom to give the interventions to foster these kinds of spreads. Or, frankly, for advertising with all kinds of products. If we could understand how to target, it could affect the efficiency of what we're trying to achieve. And in fact, we can use data from all kinds of sources nowadays [to do this].

Αυτός είναι ένας χάρτης οκτώ εκατομμυρίων χρηστών τηλεφώνου σε μια Ευρωπαϊκή χώρα. Κάθε τελεία είναι ένα άτομο, και κάθε γραμμή απεικονίζει έναν όγκο κλήσεων μεταξύ των ανθρώπων. Και μπορούμε να χρησιμοποιήσουμε τέτοια στοιχεία, που συλλέγονται παθητικά, για να χαρτογραφήσουμε ολόκληρες χώρες και να καταλάβουμε ποιος είναι τοποθετημένος πού μέσα στο δίκτυο. Πράγματι, χωρίς καθόλου να χρειαστεί να τους ρωτήσουμε, μπορούμε να έχουμε αυτό το είδος δομικής επίγνωσης. Και άλλες πηγές πληροφοριών, όπως χωρίς αμφιβολία γνωρίζετε, είναι διαθέσιμες για τέτοια χαρακτηριστικά, από την επικοινωνία με ηλεκτρονικά μηνύματα, on line επικοινωνία, online κοινωνικά δίκτυα, κ.ο.κ. Και στην πραγματικότητα, είμαστε στην εποχή αυτού που θα αποκαλούσα «μαζικές-παθητικές» προσπάθειες συλλογής δεδομένων. Υπάρχουν κάθε είδους τρόποι που μπορούμε να χρησιμοποιήσουμε μαζικώς συλλεγμένα δεδομένα να δημιουργήσουμε δίκτυα αισθητήρων να ακολουθήσουμε τον πληθυσμό, να καταλάβουμε τι συμβαίνει στον πληθυσμό, και να παρέμβουμε στον πληθυσμό προς το καλύτερο. Επειδή αυτές οι νέες τεχνολογίες μας λένε όχι μόνο ποιος μιλά σε ποιον, αλλά πού είναι ο καθένας, και τι σκέφτονται με βάση τι ανεβάζουν στο διαδίκτυο, και τι αγοράζουν με βάση τα ψώνια τους. Και όλα αυτά τα διαχειριστικά δεδομένα μπορούν να συγκεντρωθούν και να επεξεργαστούν για να καταλάβουμε την ανθρώπινη συμπεριφορά με ένα τρόπο που ποτέ πριν δεν μπορούσαμε.

This is a map of eight million phone users in a European country. Every dot is a person, and every line represents a volume of calls between the people. And we can use such data, that's being passively obtained, to map these whole countries and understand who is located where within the network. Without actually having to query them at all, we can get this kind of a structural insight. And other sources of information, as you're no doubt aware are available about such features, from email interactions, online interactions, online social networks and so forth. And in fact, we are in the era of what I would call "massive-passive" data collection efforts. They're all kinds of ways we can use massively collected data to create sensor networks to follow the population, understand what's happening in the population, and intervene in the population for the better. Because these new technologies tell us not just who is talking to whom, but where everyone is, and what they're thinking based on what they're uploading on the Internet, and what they're buying based on their purchases. And all this administrative data can be pulled together and processed to understand human behavior in a way we never could before.

Για παράδειγμα θα μπορούσαμε να χρησιμοποιήσουμε τις αγορές καυσίμων των φορτηγατζήδων. Έτσι οι φορτηγατζήδες απλώς κάνουν την δουλειά τους, και αγοράζουν καύσιμα. Και εμείς βλέπουμε μια μικρή άνοδο στις αγορές καυσίμων των φορτηγατζήδων, και ξέρουμε ότι μια ύφεση βρίσκεται στο τέλος της. Ή μπορούμε να καταγράψουμε την ταχύτητα με την οποία οι άνθρωποι κινούνται με τα τηλέφωνά τους σε μια λεωφόρο, και η τηλεφωνική εταιρία μπορεί να δει, καθώς η ταχύτητα μειώνεται, ότι υπάρχει ένα μποτιλιάρισμα. Και μπορούν να προωθήσουν την πληροφορία στους συνδρομητές τους, αλλά μόνο στους συνδρομητές αυτούς που βρίσκονται στον ίδιο αυτοκινητόδρομο και μάλιστα πίσω από το μποτιλιάρισμα! Ή μπορούμε να παρακολουθήσουμε τις συμπεριφορές συνταγογράφησης των γιατρών, παθητικά, και να δούμε πώς η διάχυση καινοτομίας με τα φάρμακα συμβαίνει μέσα στα [δίκτυα των] γιατρών. Ή πάλι, μπορούμε να καταγράψουμε την αγοραστική συμπεριφορά σε ανθρώπους, και να παρακολουθήσουμε πώς αυτοί οι τύποι φαινομένων μπορούν να διαχυθούν μέσα στους ανθρώπινους πληθυσμούς.

So, for example, we could use truckers' purchases of fuel. So the truckers are just going about their business, and they're buying fuel. And we see a blip up in the truckers' purchases of fuel, and we know that a recession is about to end. Or we can monitor the velocity with which people are moving with their phones on a highway, and the phone company can see, as the velocity is slowing down, that there's a traffic jam. And they can feed that information back to their subscribers, but only to their subscribers on the same highway located behind the traffic jam! Or we can monitor doctors prescribing behaviors, passively, and see how the diffusion of innovation with pharmaceuticals occurs within [networks of] doctors. Or again, we can monitor purchasing behavior in people and watch how these types of phenomena can diffuse within human populations.

Και υπάρχουν τρεις τρόποι, νομίζω, που μπορούν να χρησιμοποιηθούν αυτά τα μαζικά-παθητικά δεδομένα. Ο ένας είναι εντελώς παθητικά, όπως μόλις περιέγραψα -- όπως, για παράδειγμα, στο παράδειγμα των φορτηγατζήδων, όπου στην πραγματικότητα δεν παρεμβαίνουμε στον πληθυσμό με κανένα τρόπο. Ένας είναι ημι-ενεργητικός, όπως το παράδειγμα της γρίπης που παρουσίασα, όπου πείθουμε κάποιους ανθρώπους να ονομάσουν τους φίλους τους και μετά παθητικά παρακολουθούμε τους φίλους τους -- έχουν τη γρίπη, ή όχι - και μετά παίρνουμε την προειδοποίηση. Ή ένα άλλο παράδειγμα θα ήταν, αν ήσασταν μια εταιρεία τηλεφωνίας, θα καταλαβαίνατε ποιοι είναι κεντρικοί στο δίκτυο, και θα τους ρωτούσατε, «Θα μας στέλνετε σε μήνυμα για τη θερμοκρασία σας κάθε μέρα; Απλώς στείλτε μας τη θερμοκρασία σας». Και θα συγκεντρώνατε τεράστιες ποσότητες πληροφοριών για τη θερμοκρασία των ανθρώπων, αλλά από κεντρικά τοποθετημένα άτομα. Και θα μπορούσατε, σε μεγάλη κλίμακα, να παρακολουθείσετε μια επικείμενη επιδημία με πολύ λιγες καταχωρήσεις από ανθρώπους. Ή, τέλος, μπορεί να είναι εντελώς ενεργητικά -- όπως γνωρίζω οι επόμενοι ομιλητές θα μιλήσουν επίσης γι' αυτό σήμερα -- όπου άνθρωποι θα μπορούσαν παγκοσμίως να συμμετέχουν σε wikis, ή φωτογραφίζοντας ή καταγράφοντας εκλογές, και να ανεβάζουν πληροφορίες με ένα τρόπο που μας επιτρέπει να συγκεντρώσουμε πληροφορίες για να καταλάβουμε κοινωνικές διαδικασίες και κοινωνικά φαινόμενα.

And there are three ways, I think, that these massive-passive data can be used. One is fully passive, like I just described -- as in, for instance, the trucker example, where we don't actually intervene in the population in any way. One is quasi-active, like the flu example I gave, where we get some people to nominate their friends and then passively monitor their friends -- do they have the flu, or not? -- and then get warning. Or another example would be, if you're a phone company, you figure out who's central in the network and you ask those people, "Look, will you just text us your fever every day? Just text us your temperature." And collect vast amounts of information about people's temperature, but from centrally located individuals. And be able, on a large scale, to monitor an impending epidemic with very minimal input from people. Or, finally, it can be more fully active -- as I know subsequent speakers will also talk about today -- where people might globally participate in wikis, or photographing, or monitoring elections, and upload information in a way that allows us to pool information in order to understand social processes and social phenomena.

Στην πραγματικότητα, η διαθεσιμότητα αυτών των δεδομένων, νομίζω, κηρύττει ένα είδος νέας εποχής αυτού που εγώ και άλλοι θα θέλαμε να αποκαλέσουμε «υπολογιστική κοινωνική επιστήμη». Είναι κάπως όπως όταν ο Γαλιλαίος εφηύρε - ή, δεν εφηύρε -- χρησιμοποίησε το τηλεσκόπιο και μπορούσε να δει τους ουρανούς με ένα καινούργιο τρόπο, ή ο Λέβενχουκ έμαθε για το μικροσκόπιο -- ή στην πραγματικότητα το εφήυρε -- και μπορούσε να δει τη βιολογία με ένα νέο τρόπο. Αλλά τώρα έχουμε πρόσβαση σε αυτά τα είδη πληροφοριών που μας επιτρέπει να κατανοούμε κοινωνικές διαδικασίες και κοινωνικά φαινόμενα με έναν εντελώς νέο τρόπο που ποτέ πριν δεν ήταν δυνατό. Και με αυτή την επιστήμη, μπορούμε να κατανοήσουμε πώς ακριβώς το όλον καταλήγει να γίνει σπουδαιότερο από το σύνολο των μερών του. Και στην πραγματικότητα, μπορούμε να χρησιμοποιήσουμε αυτή την επίγνωση για να βελτιώσουμε την κοινωνία και να βελτιώσουμε την ανθρώπινη ευημερία.

In fact, the availability of these data, I think, heralds a kind of new era of what I and others would like to call "computational social science." It's sort of like when Galileo invented -- or, didn't invent -- came to use a telescope and could see the heavens in a new way, or Leeuwenhoek became aware of the microscope -- or actually invented -- and could see biology in a new way. But now we have access to these kinds of data that allow us to understand social processes and social phenomena in an entirely new way that was never before possible. And with this science, we can understand how exactly the whole comes to be greater than the sum of its parts. And actually, we can use these insights to improve society and improve human well-being.

Σας ευχαριστώ.

Thank you.

Σας ευχαριστώ.

Thank you.

Nicholas Christakis: How social networks predict epidemics

Nicholas Christakis: How social networks predict epidemics

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading

Related talks

Nicholas Christakis: The hidden influence of social networks

Dan Dennett: Dangerous memes

Laurie Garrett: Lessons from the 1918 flu

Gary Slutkin: Let's treat violence like a contagious disease

Andreas Raptopoulos: No roads? There's a drone for that

Eric Berlow and Sean Gourley: Mapping ideas worth spreading