Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Eric Berlow: Eu sou ecólogo e Sean é físico, e nós dois estudamos redes complexas. Nós nos conhecemos há alguns anos quando descobrimos que nós dois tínhamos dado uma palestra curta no TED sobre a ecologia da guerra, e percebemos que estávamos conectados pelas ideias que tínhamos antes de nos conhecermos. E então pensamos, sabe, há milhares de outras palestras por aí, especialmente palestras TEDx, que estão surgindo por todo o mundo. Como elas se conectam e com o que se parece essa conversa global? Então Sean vai lhes contar um pouco sobre como nós fizemos isso.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Sean Gourley: Exatamente. Nós pegamos 24 mil palestras TEDx de todo o mundo, 147 países diferentes, e nós pegamos essas palestras e nós queríamos achar as estruturas matemáticas que sustentavam as ideias por trás delas. E queríamos fazer isso para ver como elas se conectam entre si.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
E assim, claro, se você vai fazer esse tipo de coisa, você precisa de muitos dados. Então os dados que temos são uma coisa enorme chamada YouTube, e nós podemos ir lá e basicamente extrair todas as informações livres do YouTube, todos os comentários, visualizações, quem está assistindo, de onde estão assistindo, o que dizem nos comentários. Mas nós também podemos tirar, usando tradução de voz para texto, podemos tirar a transcrição integral, e isso funciona mesmo com pessoas com sotaques engraçados como eu. Então nós pegamos as transcrições e na realidade fizemos coisas bem legais. Podemos usar algoritmos de processamento de linguagem natural para meio que ler por meio de um computador, linha por linha, extraindo conceitos chave do texto. E pegamos esses conceitos chave e eles meio que formam essa estrutura matemática de uma ideia, E nós o chamados de "meme-ome". E o meme-ome, sabem, basicamente, é a matemática que fundamenta uma ideia, e nós podemos fazer análises muito interessantes com ela, que é o que queremos partilhar com vocês agora.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Então cada ideia tem sua própria meme-ome, e cada ideia é única em relação a ela, mas é claro, ideias, elas apropriam-se umas das outras, elas roubam às vezes, e certamente dependem umas das outras, e nós podemos analisar matematicamente e pegar o meme-ome de uma palestra e compará-lo com o meme-ome de todas as outras palestras, e se houver uma similaridade entre duas delas, nós podemos criar uma conexão e representá-la como um diagrama, assim como Eric e eu estamos conectados.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
Essa é a teoria, ótimo. Vamos ver como ela funciona na prática. O que nós temos aqui é a cobertura global de todas as palestras TEDx ao longo dos últimos quatro anos explodindo em todo o mundo desde Nova Iorque até a parte de baixo na Nova Zelândia no canto. E o que fizemos com isso foi analisar os primeiros 25% delas, e começamos a ver onde as conexões aconteciam, onde elas se conectavam entre si. A palestra de Cameron Russell sobre imagem e beleza conectou-se com a Europa. Nós temos uma discussão maior sobre Israel e Palestina irradiando para fora do Oriente Médio. E temos algo um pouco mais amplo, como "big data" com uma cobertura realmente global relacionado a uma conversa que está acontecendo em todos os lugares.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
Então a partir disso, nós chegamos nos limites daquilo que podemos realmente fazer com a projeção geográfica, mas felizmente a tecnologia computacional nos permite sair para o espaço multidimensional. Assim nós podemos pegar nossa projeção de rede e aplicar um mecanismo de física a ela, e as palestras similares tipo que se fragmentam juntas, e as diferentes se separam, e o que nos resta é algo muito bonito.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
EB: Eu quero só ressaltar que cada nó é uma palestra, eles estão ligados se partilham ideias similares, e isso é feito com uma máquina de leitura de transcrições integrais de palestras, e então todos os temas que surgem, eles não se referem a "tags" e palavras-chave. Eles vem da estrutura de rede de ideias interconectadas. Continue.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
SG: Absolutamente. Eu passei um pouco rápido por isso, mas ele vai me desacelerar. Nós temos educação conectada com narrativas de história trianguladas com mídia social. Temos, claro, o cérebro humano bem próximo de assistência médica, o que se poderia esperar, mas também temos vídeo games, que é meio que vizinho, enquanto aqueles dois espaços interagem entre si.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Mas quero levá-los para um grupo que é particularmente importante para mim, e é o do meio ambiente. E eu quero aproximá-lo um pouco e ver se nós podemos ter um pouco mais de resolução. Então à medida que nos aproximamos, começamos a ver, aplicando o mecanismo de física de novo, nós percebemos que uma conversa é na verdade composta por muitas discussões menores. A estrutura começa a emergir onde vemos um tipo de comportamento fractal das palavras e da língua que nós usamos para descrever as coisas que são importantes para nós em todo o mundo. Então temos economia alimentar e alimentação local no topo, temos gases de efeito estufa, energia solar e resíduos nucleares. O que temos é um conjunto de discussões menores, cada uma conectada com as outras pelas ideias e pela língua em comum, criando um conceito mais amplo de meio ambiente. E é claro, a partir daí, nós podemos avançar e aproximá-los e ver, bem, o que os jovens estão assistindo? E eles estão assistindo tecnologia energética e fusão nuclear. Essa é meio que a ressonância deles para a discussão sobre meio ambiente. Se nós dividirmos por linhas de gênero, podemos ver entre mulheres repercutindo fortemente a economia alimentar, mas também ali fora em esperança e otimismo.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
E assim há muita coisa interessante que podemos fazer aqui, e eu vou passar para o Eric para próxima parte.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
EB: Sim, quero dizer, apenas para ressaltar, não se pode pegar esse tipo de perspectiva de uma procura simples por "tag" no YouTube. Vamos agora voltar para toda a discussão global além de meio ambiente, e observar todas as palestras juntas. Muitas vezes, quando nos deparamos com essa quantidade de conteúdo, nós fazemos algumas coisas para simplificá-lo. Podemos apenas dizer, bem, quais são as palestras mais populares? E algumas sobem para a superfície. Tem uma palestra sobre gratidão. Tem outra sobre saúde pessoal e nutrição. E é claro, tem que ter uma sobre pornografia, certo? E então nós podemos dizer, bem, gratidão, essa foi no ano passado. O que é tendência agora? Qual é a palestra popular agora? E nós podemos ver que o tema novo, emergente, a tendência principal é a privacidade digital.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
Então isso é ótimo. Simplifica as coisas. Mas tem tanto conteúdo criativo que acabou escondido no fundo. E eu odeio isso. Como nós trazemos à tona as coisas que talvez sejam realmente criativas e interessantes? Bem, nós podemos voltar para a estrutura de rede de ideias para fazer isso. Lembrem-se, é essa estrutura de rede que está criando esses temas emergentes, e digamos que pudéssemos pegar dois deles, como cidades e genética, e dizer, bem, tem algumas palestras que criativamente interligam essas duas disciplinas realmente diferentes. E isso -- Essencialmente, esse tipo de "remix" criativo é um das marcas da inovação. Bem, aqui tem uma palestra de Jessica Green sobre a ecologia microbiana de edifícios. Ela está literalmente definindo um novo campo. E nós poderíamos voltar para aqueles temas e dizer, bem, quais palestras são centrais para aquelas discussões? No grupo das cidades, uma das principais foi uma de Mitch Joachim sobre cidades ecológicas, e no grupo da genética, nós temos uma palestra sobre biologia sintética de Craig Venter. São palestras que estão conectando muitas palestras dentro da sua disciplina. Nós poderíamos ir na outra direção e dizer, bem, quais são as palestras que estão sintetizando amplamente muitos tipos diferentes de campos? Nós usamos uma medida de diversidade ecológica para saber disso. Por exemplo, uma palestra de Steven Pinker sobre a história da violência, muito sintética.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
E assim, claro, tem palestras que são tão únicas que estão meio que na estratosfera, em seu lugar especial próprio, e nós chamamos isso de índice Colleen Flanagan. E se você não conhece Colleen, ela é uma artista, eu perguntei a ela, "Bom, como é lá fora na estratosfera do nosso espaço de ideias?" E aparentemente lá cheira a bacon. Eu não saberia. Então nós estamos usando essas figuras de redes para encontrar palestras que são únicas, aquelas que criativamente sintetizam campos diferentes, que são centrais para o seu tema, e que estão realmente interligando criativamente campos separados. Certo? Nós nunca as teríamos encontrado com a nossa obsessão com o que é tendência agora. E tudo isso vem da arquitetura da complexidade, ou dos padrões de como as coisas estão conectadas.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
SG: Então, é exatamente isso. Nós nos encontramos em um mundo que é extremamente complexo, e nós estivemos usando algoritmos para filtrá-lo para poder navegar por ele. E esses algoritmos, embora sendo um pouco úteis, também são muito, muito limitados, e podemos fazer mais do que isso, porque podemos perceber que a sua complexidade não é aleatória. Ela tem uma estrutura matemática, e podemos usar a estrutura matemática para avançar e explorar coisas como o mundo das ideias para ver o que tem sido dito, o que não tem sido dito, e para ser um pouco mais humano e, esperamos que, um pouco mais inteligente.
Thank you.
Obrigado.
(Applause)
(Aplausos)