Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Eric Berlow : Je suis écologiste, Sean est physicien, et nous étudions les réseaux complexes. Nous nous sommes rencontrés il y a quelques années, après avoir découvert que nous avions tous deux indépendamment parlé de l'écologie de guerre dans des conférences TED, et nous avons réalisé que nous étions reliés par les idées que nous partagions avant même de nous rencontrer. Nous nous sommes dit : il y a des milliers d'autres conférences, notamment les TEDx, qui pullulent partout dans le monde. Comment sont-elles liées ? À quoi ressemble cette conversation mondiale ? Sean va donc vous décrire comment nous avons répondu à ces interrogations.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Sean Gourley : Nous avons pris 24 000 conférences TEDx venant du monde entier : 147 pays. Nous avons pris ces conférences et nous voulions trouver les structures mathématiques qui exprimaient les idées qu'elles contenaient. Nous voulions voir de quelle manière ces idées étaient connectées entre elles.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
Bien sûr, pour pouvoir réaliser ce genre de chose, il faut beaucoup de données. Les données, on les trouve sur un engin génial qui s'appelle YouTube, et on peut exploiter toutes les informations qui s'y trouvent : tous les commentaires, le nombre de vues, savoir qui regarde les vidéos d'où elles sont regardées, et ce qu'il est dit dans les commentaires. Mais on peut aussi analyser tous les textes de conférences en utilisant les transcriptions, et ça marche aussi pour les gens qui ont un accent bizarre comme moi ! Ainsi, on peut prendre le texte et faire des trucs plutôt chouette. On peut utiliser des algorithmes de traitement du langage naturel pour qu'un ordinateur « lise » les données, ligne par ligne, pour en extraire les concepts-clés. Puis on prend ces concepts-clés, qui en fait representent une idée sous forme de structure mathématique. On appelle ça un « mème-ome ». Ce « mème-ome », pour faire simple, désigne l'interprétation mathématique d'une idée, et on peut faire des analyses très intéressantes avec ça, et j'aimerais les partager avec vous aujourd'hui.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Donc chaque idée a son propre « mème-ome », chaque idée est unique, mais bien sûr, les idées, s'inspirent les unes des autres parfois même elles puisent les unes des autres, et puis elles s'appuient évidement les unes sur les autres. Ainsi, on peut faire une analyse mathématique, prendre le « mème-ome » d'une conférence et le comparer aux « mème-ome » de toutes les autres conférences, et s'il y a une similarité avec une autre conférence, on peut créer un lien et illustrer ça sur un graphique, et c'est sur ce même principe qu'Eric et moi sommes reliés.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
C'est la théorie, c'est formidable. Voyons comment ça marche en pratique. Donc ici, nous avons l'empreinte mondiale de toutes les conférences TEDx des 4 dernières années de New York jusqu'à la Nouvelle-Zélande en bas à droite. Nous avons donc analysé le top de 25 % des conférences, et nous avons commencé à chercher où étaient les connections, où elles se connectaient entre elles. Cameron Russell qui parle d'image et de beauté est connecté à l'Europe. Nous avons une conversation plus étendue sur l'Israël et la Palestine rayonnant vers l'extérieur à partir du Moyen-Orient. Et nous avons quelque chose d'un peu plus large comme les données volumineuses avec une empreinte véritablement mondiale qui évoque une conversation qui se passe partout dans le monde.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
Donc sur cette base, on se heurte un peu aux limites de ce qu'on peut faire avec une projection géographique, mais heureusement, la technologie informatique permet d'utiliser un espace multidimensionnel. Ainsi nous pouvons prendre notre projection de réseau et trier les conférences par l’intermédiaire d'un moteur physique, qui fait en sorte de regrouper les conférences qui sont similaires et d’écarter celles qui diffèrent, et on obtient quelque chose d'assez beau.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
EB : Alors, je veux juste souligner ici que chaque nœud est une conférence, et qu'elles sont reliées si elles partagent des idées similaires. Ceci est déterminé par une lecture informatique des transcriptions des conférences, et toutes ces thématiques qui apparaissent ne surgissent pas des mots-clés. Elle proviennent de la structure du réseau des idées interconnectées. Continue.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
SG: Absolument. J'ai survolé ce point un peu trop rapidement mais il est là pour me ralentir. On voit que l'éducation est connectée à la narration d'histoires triangulées avec les médias sociaux. On a, bien sûr, le cerveau humain, juste à côté de la santé, ce dont on aurait pu se douter, mais on a aussi les jeux vidéo, qui sont à côté, car ces deux espaces communiquent entre eux.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Mais je veux vous emmener dans une grappe qui m'importe particulièrement qui est l'environnement. Et je veux zoomer là-dessus et voir si on peut obtenir une plus grande résolution. En fait, ce dont on s'aperçoit, en appliquant ce moteur physique, c'est qu'une conversation se compose en réalité de plusieurs petites conversations. La structure commence à émerger, et on voit un comportement fractal des mots et du langage que l'on utilise pour décrire les choses qui sont importantes pour nous tout autour du monde. On a l'économie alimentaire et la nourriture locale en haut, les gaz à effet de serre, le solaire et les déchets nucléaires. Ce qu'on obtient est une gamme de petites conversations, chacune reliées aux autres à travers les idées et la langue qu'elles partagent, créant un concept plus large de l'environnement. Et bien sûr, à partir d'ici on peut zoomer et voir, et bien, que regardent les jeunes ? Ils s'intéressent aux technologies de l'énergie et à la fusion nucléaire. C'est ce à quoi ils s'intéressent dans les conversations qui tournent autour de la thématique de l'environnement. Si nous séparons selon le sexe, nous pouvons voir que les femmes s'intéressent fortement à l'économie alimentaire, mais aussi à l'espoir et à l'optimisme.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
Et donc on peut faire des tas de choses passionnantes, et je vais laisser la parole à Eric pour la prochaine partie.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
EB : Oui, je voudrais d'abord souligner qu'on ne peut pas obtenir ce genre de perspective par une simple recherche de mots-clés sur YouTube. Faisons maintenant un zoom arrière sur la totalité des conversations et regardons l'ensemble des conférences. Souvent, lorsqu'on est confronté à cette quantité de contenu, on fait quelques opérations pour simplifier. Nous pourrions dire, et bien, quelles sont les conférences les plus populaires ? Et quelques-unes remontent à la surface. Il y a une conférence à propos de la gratitude. Il y en a une autre sur la santé et la nutrition. Et bien sûr, il y en a une sur le porno ! Et alors, nous pourrions dire : la gratitude, c'était l'an dernier. Qu'est-ce qui est en vogue ? Qu'est-ce qui est populaire en ce moment ? Et nous pouvons voir que le nouveau thème le plus en vogue est celui de l'intimité numérique.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
Donc c'est très bien. Ça simplifie les choses. Mais en même temps, il y a tellement de contenu créatif que l'on néglige quand on procède de cette manière. Et je déteste ça. Comment faire émerger les choses qui sont peut-être vraiment créatives et intéressantes ? Eh bien, nous pouvons revenir à la structure du réseau d'idées pour faire ça. N'oubliez pas : c'est cette structure en réseau qui crée ces thématiques émergentes. Supposant qu'on souhaite choisir deux d'entre elles, comme les villes et la génétique et voir s'il existe des conférences qui combinent ces deux disciplines très différentes, de façon créative ? Et c'est ce genre de mélange créatif qui est l'une des marques de fabrique de l'innovation. Et bien en voici une presentée par Jessica Green sur l'écologie microbienne des bâtiments. Elle traite littéralement d'un nouveau domaine. Et nous pourrions revenir à ces thématiques et se demander : quelles sont les conférences centrales de ces conversations ? Dans la grappe sur les villes, une des plus centrales est celle de Mitch Joachim sur les villes écologiques, et dans la grappe sur la génétique, on a une conférence sur la biologie synthétique présentée par Craig Venter. Ce sont des conférences qui lient de nombreuses autres au sein de leur discipline. On pourrait à l'opposé se demander quelles sont les conférences qui font la synthèse de nombreux types de domaines différents. Nous avons utilisé une mesure de la diversité écologique pour obtenir cela. Par exemple, une conférence présentée par Steven Pinker sur l'histoire de la violence, est très synthétique.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
Et puis, bien sûr, il y a des conférences qui sont si uniques, qu'on a l'impression qu'elles se trouvent dans la stratosphère, dans leur propre endroit spécial, et on appelle ça l'index Colleen Flanagan. Et si vous ne connaissez pas Colleen, et bien c'est une artiste, à qui j'ai d'ailleurs demandé, « C'est comment là-bas dans la stratosphère de notre espace d'idée ? » Et apparemment, ça sent le bacon. Apparemment. Ainsi, nous utilisons ces motifs de réseau pour trouver des conférences qui sont uniques, celles qui sont une synthèse créative de nombreux domaines différents, celles qui sont centrales pour leur thématique, et celles qui combinent des domaines disparates de façon créative. Nous ne les aurions jamais trouvé avec notre obsession de la nouveauté. Et tout cela vient de l'architecture de la complexité, ou de la façon dont les choses sont liées.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
SG : Donc, c'est exactement ça. Nous sommes dans un monde qui est extrêmement complexe, et nous avons utilisé des algorithmes pour le simplifier pour pouvoir y naviguer. Ces algorithmes, tout en étant utile, sont également très, très limités, et nous pouvons faire mieux que cela, parce qu'on peut se rendre compte que cette complexité n'est pas aléatoire. Elle a une structure mathématique, et nous pouvons utiliser cette structure mathématique pour explorer des choses comme le monde des idées pour voir ce qui est dit, ce qui n'est pas dit, et pour être un peu plus humain et, je l'espère, un peu plus intelligent.
Thank you.
Merci.
(Applause)
(Applaudissements)