Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Eric Berlow: Ik ben ecoloog en Sean is natuurkundige. We bestuderen allebei complexe netwerken. We ontmoetten elkaar een paar jaar geleden toen we ontdekten dat we allebei een korte TED Talk hadden gegeven over de ecologie van oorlog. Toen realiseerden we ons dat we verbonden waren door de ideeën die we gedeeld hadden voordat we elkaar ooit ontmoet hadden. Toen bedachten we dat er duizenden andere talks bestaan, vooral TEDx Talks, die over de hele wereld verschijnen. Hoe zijn die verbonden en hoe ziet die wereldwijde conversatie eruit? Sean zal jullie iets vertellen over hoe we dat gedaan hebben.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Sean Gourley: Precies. We namen 24.000 TEDx Talks van over de hele wereld, uit 147 landen, en we wilden uitzoeken welke wiskundige structuren ten grondslag liggen aan de ideeën achter deze talks. Dat wilden we doen om te kunnen zien hoe ze met elkaar verbonden waren.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
Als je zoiets gaat doen, heb je veel gegevens nodig. De gegevens die je hebt, zijn iets geweldigs dat YouTube heet. We kunnen alle beschikbare gegevens uit YouTube halen, We kunnen alle beschikbare gegevens uit YouTube halen, alle commentaren, hoe vaak en door wie wordt het bekeken, waar ze ernaar kijken en wat ze erover zeggen in het commentaar. Maar we kunnen ook, met spraakherkenningssoftware, het hele transcript ophalen. Dat werkt zelfs voor mensen met vreemde accenten zoals ik. Dus kunnen we met die transcripten behoorlijk coole dingen doen. We kunnen met natuurlijke taalverwerkingsalgoritmen regel voor regel met een computer de belangrijke concepten eruit halen. Die belangrijke concepten vormen zoiets als de mathematische structuur van een idee. Dat noemen wij het meme-oom. Het meme-oom is gewoonweg de wiskunde die ten grondslag ligt aan een idee en daar kunnen we behoorlijk interessante analyses op loslaten, die ik nu met jullie wil delen.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Ieder idee heeft dus zijn eigen meme-oom en ieder idee is daar uniek in, maar natuurlijk lenen ideeën van elkaar, stelen soms een beetje, en bouwen zeker voort op elkaar. We kunnen op wiskundige wijze het meme-oom van één talk doorlopen en het vergelijken met het meme-oom van alle andere talks en als ze op elkaar lijken, kunnen we een verbinding maken en dat als een grafiek voorstellen, net zoals Eric en ik verbonden zijn.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
Dat is dus de theorie, dat is geweldig. Laten we eens kijken hoe dat in de praktijk werkt. Wat we hier nu hebben, is de wereldwijde afdruk van alle TEDx Talks van de afgelopen vier jaar, die wereldwijd explosief zijn toegenomen van New York helemaal naar dat oude, vertrouwde Nieuw Zeeland in de hoek. We hebben de top 25% daarvan geanalyseerd en we begonnen te zien waar de verbindingen optraden, waar ze met elkaar verbonden waren. Cameron Russells voordracht over imago en schoonheid was verbonden met Europa. We hebben een grotere conversatie over Israël en Palestina die uit het Midden Oosten straalt. En we hebben een wat breder iets, als 'big data', met een werkelijk wereldwijde afdruk, die lijkt op een conversatie die overal plaatsvindt.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
Hiermee knallen we eigenlijk een beetje tegen de limieten op van wat we met geografische projectie kunnen doen maar computertechnologie laat ons gelukkig uitwijken naar multidimensionale ruimten. Dus kunnen we op onze netwerkprojectie een natuurkundig programma toepassen, zodat de op elkaar lijkende talks bijeen worden gekwakt en de verschillende uiteen vliegen, waar we iets best moois aan overhouden.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
EB: Ik wil alleen even aangeven dat alle knopen praatjes zijn, die verbonden zijn als ze vergelijkbare ideeën delen. Dit komt uit automatisch gelezen transcripten van hele talks, Dit komt uit automatisch gelezen transcripten van hele talks, zodat al die onderwerpen die ontstaan, niet uit labels of sleutelwoorden komen, maar uit de netwerkstructuur van onderling verbonden ideeën. Ga verder.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
SG: Absoluut. Ik was een beetje snel, maar hij zal me afremmen. Onderwijs is verbonden met verhalen vertellen, en beide zijn verbonden met sociale media. Natuurlijk ligt het menselijk brein direct naast gezondheidszorg, wat je zou kunnen verwachten, maar aangrenzend zijn videogames, wat daar ongeveer naast ligt, omdat die twee ruimten verbindingen met elkaar delen.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Maar ik wil jullie meenemen in een cluster die ik bijzonder belangrijk vind, en dat is het milieu. Daar wil ik in iets meer detail naar kijken en zien of we een iets betere resolutie kunnen krijgen. Dus als we hierin gaan, zullen we beginnen te zien-- pas het natuurkundige programma weer toe-- dan zien we dat één conversatie, is opgebouwd uit vele kleinere. De structuur begint op te komen, waar we een soort fractaalgedrag zien van de woorden en de taal die we gebruiken om dingen die belangrijk voor ons zijn overal in deze wereld te beschrijven. Dus heb je voedseleconomie en lokaal voedsel bovenaan, net als broeikasgassen, zonne-energie en kernafval. Wat je krijgt, is een spectrum van kleinere conversaties, elk verbonden met elkaar via de ideeën en de taal die ze delen, wat een breder concept van het milieu creëert. Daarvandaan kunnen we inzoomen en bijvoorbeeld zien waar jonge mensen naar kijken. Zij kijken naar energietechnologie en kernfusie. Zo weerklinkt als het ware hun conversatie rond het milieu. Als we een verdeling maken naar geslacht, zien we vrouwen duidelijk naar voren komen bij voedseleconomie, maar ook daarginds, bij hoop en optimisme.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
Dus er zijn een boel spannende dingen die we hier kunnen doen. Voor het volgende stuk geef ik het over aan Eric.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
EB: Ja, om nog even duidelijk te maken, je kunt zo'n perspectief niet krijgen van een gewone label-zoekopdracht op YouTube. Laten we nu weer uitzoomen naar de wereldwijde conversatie uit het milieu en kijken naar alle praatjes bij elkaar. Als we zulke grote hoeveelheden inhoud tegenkomen, doen we vaak een paar dingen om het te vereenvoudigen. We kunnen gewoon zeggen, wat zijn de meest populaire talks die er zijn? Dan komen er een paar naar boven. Er is een talk over dankbaarheid. Een andere over persoonlijke gezondheid en voeding. En natuurlijk moet er eentje over porno gaan, niet? Dus zouden we dan kunnen zeggen: dankbaarheid, dat was vorig jaar. Wat is er nu 'trending'? Wat is de populaire talk nu? We kunnen zien dat het nieuwe, opkomende, 'top-trending' onderwerp digitale privacy is.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
Dus dit is geweldig. Het maakt de zaken makkelijker. Maar er is zo veel creatieve inhoud onderaan begraven. Dat haat ik. Hoe laten we iets bovendrijven dat misschien wel heel creatief en interessant is? Daarvoor kunnen we teruggaan naar de ideeën-netwerkstructuur. Daarvoor kunnen we teruggaan naar de ideeën-netwerkstructuur. Bedenk dat het die netwerkstructuur is, die deze opkomende onderwerpen creëert. Stel dat we er twee van zouden kunnen nemen, zoals steden en genetica, en zeggen: zijn er talks die deze heel uiteenlopende disciplines creatief overbruggen? In essentie is zo'n soort creatieve bundeling een van de kenmerken van innovatie. Hier is er één door Jessica Green over de microbische ecologie van gebouwen. Het definieert een nieuw veld. We zouden terug kunnen gaan naar die onderwerpen en zeggen: welke talks staan centraal in die conversaties? In het stedencluster, is een van de meest centrale een talk door Mitch Joachim over ecologische steden. In het genetische cluster zien we een talk door Craig Venter over synthetische biologie. Dat zijn talks die veel talks verbinden in hun discipline. We zouden de andere kant op kunnen gaan en zeggen: wat zijn talks die een brede synthese maken van veel verschillende velden. Om dat te vinden, gebruikten we een maat van ecologische diversiteit. Zoals een talk van Steven Pinker over de geschiedenis van geweld, heel synthetisch.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
En dan zijn er talks die zo uniek zijn, zo'n beetje in de stratosfeer, op hun eigen speciale plekje. We noemen dat de Colleen Flanagan index. En als je Colleen niet kent, zij is een artieste, en ik vroeg haar: "Hoe is het daar in de stratosfeer van onze ideeënruimte?" Schijnbaar ruikt het naar spek. Ik zou het niet weten. Dus we gebruiken deze netwerkmotieven om talks te vinden die uniek zijn, andere die creatief een boel verschillende velden synthetiseren, talks die centraal staan in hun onderwerp, en talks die echt creatief uiteenlopende velden overbruggen. We zouden die nooit hebben gevonden met onze obsessie voor wat nu 'trending' is. Dat komt allemaal voort uit de architectuur van complexiteit, of de patronen van hoe dingen verbonden zijn.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
SG: Dat klopt precies. We hebben onszelf in een wereld gebracht die onwaarschijnlijk complex is. We hebben algoritmen gebruikt om het zo'n beetje uit te filteren zodat we erdoor kunnen navigeren. Die algoritmen zijn, hoewel best bruikbaar, ook heel erg nauw. Dat kunnen we verbeteren, omdat we ons kunnen realiseren dat hun complexiteit niet willekeurig is. Ze heeft mathematische structuur. Die mathematische structuur kunnen we gebruiken om zaken als de ideeënwereld te gaan verkennen, om te zien wat er wordt gezegd, te zien wat er niet wordt gezegd, en om wat menselijker te zijn, en hopelijk een beetje slimmer.
Thank you.
Bedankt.
(Applause)
(Applaus)