Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Eric Berlow: Sou ecologista, e o Sean é físico, e dedicamo-nos ambos ao estudo de sistemas complexos. Encontrámo-nos há uns anos e descobrimos que ambos tínhamos dado uma palestra TED sobre a ecologia da guerra e percebemos que estávamos ligados pelas ideias que já partilhávamos antes de nos conhecermos. E depois pensámos nos milhares de outras palestras, especialmente as TED, que vão aparecendo em todo o mundo. Que ligações existirão entre elas, como será essa conversa global? O Sean vai contar-vos um pouco do que fizemos.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Sean Gourley: Exato. Portanto, pegámos em 24 000 palestras TED de todo o mundo, de 147 países, e o que queríamos era descobrir as estruturas matemáticas subjacentes às ideias nelas contidas. O que queríamos era ver de que forma elas se relacionavam entre si.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
Claro que, para fazer isso, são necessários imensos dados. Ora os dados estão numa coisa fantástica chamada YouTube, e basicamente pode ir-se lá e tirar toda essa informação aberta, todos os comentários, os visitantes, quem vê o quê, onde se encontra e o que diz nos comentários. Mas também podemos usar tradução direta do discurso oral para texto e obter a transcrição integral, o que resulta bem até para pessoas com sotaques meio esquisitos como eu. Portanto, podemos pegar nas transcrições e fazer uma série de coisas giras. Podemos usar algoritmos de processamento de linguagem para fazer uma espécie de leitura por computador, linha a linha, e extrair conceitos-chave. E depois pegamos nesses conceitos, e eles formam uma espécie de estrutura matemática de uma ideia. A isso chamamos um meme-ome. E sabem, o meme-ome não passa da matemática subjacente a uma ideia, e com ele podemos fazer algumas análises bastante interessantes, e é isso que vou partilhar convosco agora.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Então, cada ideia tem o seu meme-ome e nisso cada ideia é única, mas claro que as ideias pedem emprestado umas às outras, às vezes como que roubam umas às outras e sem dúvida que se constroem umas a partir das outras. Assim, podemos extrair o meme-ome matematicamente de uma palestra e compará-lo com os meme-omes de todas as outras e, se houver similaridades entre eles, podemos criar uma ligação e representá-la num gráfico, tal como eu e o Eric estamos interligados.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
Isto é a teoria, ótimo. Agora vamos ver como funciona na prática. Portanto, o que temos aqui é a pegada global de todas as palestras TED dos útimos quatro anos a explodirem por todo o mundo de Nova Iorque à pequena Nova Zelândia ali no canto. O que fizemos foi analisar 25% das palestras de topo e começámos a verificar onde ocorriam as ligações, onde é que se ligavam umas às outras. A palestra de Cameron Russell sobre a imagem e a beleza tinha ligações em toda a Europa. Depois, havia uma outra conversa bem maior acerca de Israel e da Palestina que irradiava desde o Médio Oriente. E obtivemos algo mais lato, uma espécie de grande conjunto de dados com uma verdadeira pegada global, evocando uma conversa que se está a estabelecer em todo o lado.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
A partir daí, debatemo-nos com o que podemos realmente fazer com uma projeção geográfica, mas, felizmente, a tecnologia informática permite-nos chegar ao espaço multidimensional. Assim, pegámos na nossa projeção em rede e aplicámos-lhe um sistema de física, e as palestras semelhantes agruparam-se como que em colisão, enquanto as diferentes se afastaram, e chegámos a isto, que é algo bastante bonito.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
EB: Só quero salientar que cada um dos nós é uma palestra, que estão interligados se partilharem ideias semelhantes e que isto decorre da leitura mecânica das transcrições integrais de palestras; e que os tópicos que saltam à vista não são nem "tags" nem palavras-chaves. Eles decorrem da estrutura em rede de ideias interligadas. Continua.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
SG: Claro. Apressei-me um bocado, mas ele faz-me abrandar. Temos a educação ligada à narração de histórias em triangulação junto dos "media" sociais. Temos, como é óbvio, o cérebro humano mesmo ao lado dos cuidados de saúde, o que seria de esperar, mas também temos os jogos vídeo, que são adjacentes, dado que os dois espaços comunicam entre si.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Mas quero mostrar-vos um conjunto que me é particularmente caro, que é o do ambiente. E quero fazer uma ampliação e ver se conseguimos maior resolução. À medida que nos aproximamos, o que começamos a ver, aplicamos de novo o sistema de física, vemos que há uma conversa que é composta de muitas outras de menor dimensão. A estrutura começa a emergir e vemos como que um comportamento fractal das palavras e da linguagem que usamos para descrever aquilo que achamos importantes em todo o mundo. Assim, no topo, temos economia alimentar e alimentação local, temos gases de efeito de estufa, energia solar e resíduos nucleares. O que encontramos é uma variedade de conversas de menor dimensão, ligadas umas às outras através das ideias e da linguagem que partilham entre si e assim criando um conceito mais abrangente de ambiente. E a partir daqui, claro que podemos ampliar para ver o que é que preocupa os jovens. E ver que eles falam de tecnologia energética e de fusão nuclear. É esta a sua relevância no que diz respeito à conversa sobre o ambiente. Se fizermos a divisão por sexos, vemos que as mulheres dão grande importância à economia alimentar, mas de uma forma otimista e esperançosa.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
Portanto, podemos fazer muitas coisas espantosas, e agora passo a palavra ao Eric.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
EB: Bom, quero salientar que não podemos chegar a este tipo de perspetiva a partir de uma simples busca das "tags" do YouTube. Regressemos à visão anterior da conversa global e olhemos para todas as palestras. Bom, quando confrontados com conteúdos tão vastos, muitas vezes tentamos simplificá-los. Podemos, por exemplo, perguntarmo-nos quais são as palestras com maior popularidade. E assim emergem algumas delas. Há uma sobre gratidão. Há uma outra sobre nutrição e saúde pessoal. E claro que tinha de haver uma sobre a pornografia, não é? E podíamos dizer, bom, gratidão foi no ano passado. E agora? O que é que está mais na berra? E assim chegamos à conclusão de que o tema mais popular agora tem a ver com a privacidade digital.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
É ótimo. Simplifica as coisas. Mas há tanto material criativo enterrado no fundo. O que eu detesto. Como é que podemos trazer à superfície aquilo que talvez seja realmente criativo e interessante? Bom, podemos voltar à estrutura em rede das ideias para o fazermos. Lembrem-se, é essa estrutura em rede que cria estes tópicos emergentes. Digamos que pegamos em dois deles, por exemplo cidades e genética, e vemos se existem palestras que façam, de uma forma criativa, a ponte entre estas duas disciplinas tão diferentes. Bom — essencialmente este tipo de "remix" criativo é uma das marcas da inovação. Aqui está uma palestra de Jessica Green acerca da ecologia microbiana dos edifícios, que define literalmente um novo campo. E podíamos voltar àqueles tópicos e, por exemplo, ver quais são as palestras que são essenciais para aquelas conversas. No grupo das cidades, uma das mais importantes foi a de Mitch Joachim acerca das cidades ecológicas e, no grupo sobre genética, temos uma palestra sobre biologia sintética de Craig Venter. Ambas são palestras que ligam muitas outras dentro da sua área disciplinar. Podíamos ir noutra direção e, por exemplo, ver quais são as palestras que sintetizam, de uma forma geral, muitos tipos diferentes de áreas. Para isto usámos uma medida de diversidade ecológica. Por exemplo, uma palestra de Steven Pinker sobre a história da violência, muito sucinta.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
E, claro, depois há umas que são tão únicas e especiais que estão numa espécie de estratosfera, num local especial que lhes é próprio, a que chamamos o índice Colleen Flanagan. E para quem não sabe quem ela é, a Colleen é uma artista. Perguntei-lhe: "Como é que é estares "na estratosfera do nosso espaço de ideias?" E, aparentemente, cheira a bacon. Não faço ideia. Portanto, usamos estes temas centrais em rede para descobrirmos palestras únicas, as que sintetizam criativamente muitos campos diferentes, as que são essencias para o seu tema, e as que são realmente criativas a fazer a ponte entre campos díspares. Ok? Nunca as teríamos encontrado com a nossa obsessão com o que está mais na berra. E tudo isto advém da arquitetura da complexidade ou dos modelos de como as coisas se ligam entre si.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
SG: É isso mesmo. Encontramo-nos num mundo que é de uma complexidade monumental e temos estado a usar algoritmos para o filtrar e assim podermos navegar através dele. E esses algoritmos, se bem que úteis, são também muito, muito estreitos, e podemos fazer melhor, porque nos apercebemos de que a sua complexidade não é aleatória. Tem uma estrutura matemática, e podemos utilizar essa estrutura para explorarmos coisas como o mundo das ideias para ver o que anda a ser dito, o que não anda a ser dito, e a sermos um pouco mais humanos e, com sorte, um pouco mais inteligentes.
Thank you.
Muito obrigado.
(Applause)
(Aplausos)