Eric Berlow: Já jsem ekolog a Sean je fyzik, a oba zkoumáme komplexní sítě. Potkali jsme se před pár lety, kdy jsme zjistili, že jsme už oba měli krátkou přednášku na TEDu na téma ekologie války a uvědomili jsme si, že jsme byli spjati společnými myšlenkami dávno před tím, než jsme se potkali. Víte, přemýšleli jsme pak nad tím, že existují tisíce dalších přednášek, hlavně na TEDx Talks, které se objevují po celém světě. Jak jsou propojeny a jak taková celosvětová konverzace vypadá? Sean vám teď řekne něco málo o tom, jak jsme to udělali.
Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Sean Gourley: Přesně. Vzali jsme 24 000 TEDx přednášek z celého světa, ze 147 různých zemí, vzali jsme je a chtěli jsme najít matematickou konstrukci, která tvoří základ myšlenek na jejich pozadí. Chtěli jsme to udělat, abychom mohli usoudit, jak jsou mezi sebou propojené.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Pochopitelně, když se chystáte něco takového provést, potřebujete spoustu dat. Zdrojem těch dat, která máme, je úžasná věc nazývaná YouTube a my tam můžeme vstoupit a v podstatě odtud vytahat všechny volně dostupné informace, všechny ty komentáře, názory, kdo co sleduje, kde to sleduje, k čemu se lidé zrovna vyjadřují. Za pomoci strojového překladu řeči do textu jsme také schopni získat kompletní přepis přednášky a funguje to i u lidí s komickým přízvukem jako mám já. Můžeme vzít přepis přednášky a vlastně s ním udělat dost senzační věci. Pomocí algoritmů na rozpoznávání lidské řeči ho můžeme nechat přečíst počítačem, řádek po řádku a získat z něho klíčové pojmy. Klíčové pojmy vezmeme a zformujeme z nich matematickou konstrukci myšlenky. Říkáme tomu meme-ome. A meme-ome, víte, je prostě matematika, která tvoří základ myšlenky. S ní pak můžeme provádět docela zajímavé analýzy a o ty bych se s vámi teď chtěl podělit.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
Každá myšlenka má tedy svůj meme-ome, a ten určuje její jedinečnost, ale samozřejmě, nápady si vzájemně půjčujeme, někdy se svým způsobem kradou, a ovšem i staví jeden na druhém. Můžeme se nimi matematicky probírat, vzít meme-one z jedné přednášky porovnat ho s meme-ome kterékoliv jiné přednášky a pokud je mezi nimi nějaká podobnost, můžeme je propojit a spojení vyjádřit grafem, zrovna tak jako jsme propojeni já a Eric.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Tak to je teorie, to je skvělé. Podívejme se, jak to funguje v běžné praxi. Tady jsme zachytili celkovou podobu všech TEDx Talks za poslední 4 roky, jak explodují po celém světě cestou od New Yorku až po trochu starý Nový Zéland v rohu. A pak jsme analyzovali nejaktivnějších 25 procent, a začali jsme sledovat, ve kterém místě propojení vznikají a kde se na sebe napojují. Cameron Russell, hovořící o obrazu a kráse, se propojil do Evropy. Máme velké téma o Izraeli a Palestině paprskovitě vycházející ze Středního východu. A máme i něco trochu širšího, něco jako velká data se skutečně globálním vlivem, upomínající na téma, které se probíralo všude.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
Tady jakýmsi způsobem narážíme na hranice toho, co lze vlastně zeměpisnou projekcí vyjádřit. Naštěstí nám ale počítačová technologie umožňuje přejít do vícerozměrného prostoru. A tak můžeme vzít naší síťovou projekci a aplikovat na ni fyzikální model. Přednášky s podobnými tématy se zbortí k sobě, ty s odlišnými se oddálí a to co z toho zůstane, je něco velmi krásného.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
EB: Jen bych tu chtěl zdůraznit, že každý z uzlů je přednáška, které jsou propojené, pokud sdílí společnou myšlenku. Text je získaný strojovým čtením všech přepisů přednášek a potom se všechna témata, která vyplují na povrch, nesestávají jen ze štítků a klíčových slov. Pocházejí z propojených myšlenek celé struktury sítě. Pokračuj.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
SG: Přesně tak, Já jsem to trochu urychlil, ale on mě zpomalí. Máme tady vzdělání spojené s řečnictvím v trojúhelníku se sociálními médii. Samozřejmě, lidský mozek je hned vedle zdravotní péče, což se snad dá očekávat, ale poblíž jsou také video hry, protože tyto obory spolu mají styčné body.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
Ale já bych vám chtěl ukázat jedno seskupení, které je pro mě obzvlášť důležité, a to se týká životního prostředí. Rád bych si ho trochu zvětšil a podíval se na něho pod drobnohledem. Jak se přibližujeme, vidíme, opět po aplikaci fyzikálního modelu, že jedna konverzace se vlastně skládá z mnoha menších. Začne se vynořovat struktura, kde vidíme jakési fraktálové křivky ze slov a jazyka, který používáme k popisu věcí, které jsou pro nás důležité na celém světě. Hospodaření s potravinami a místní kuchyně jsou na vrcholu, skleníkové plyny, odpad z výroby solárních panelů a jaderných elektráren. Dostáváme řadu menších konverzací, které jsou propojené společnou myšlenkou a společným jazykem a vyvářejí tak širší pojetí životního prostředí. A samozřejmě, odtud můžeme pokračovat, zaměřovat se a sledovat, no, třeba o co se teď zajímají mladí lidé? Zajímají se o technologie bezpečné výroby energií a jadernou fúzi. Je to jejich způsob souznění s tématem životního prostředí. Když je rozdělíme podle pohlaví, můžeme vidět, že ženy se hodně zajímají o hospodaření s potravinami, ale mimo to také o naději a optimizmus.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Je spousta vzrušujících věcí, které se tady dají dělat, a tím nahrávám do další části Ericovi.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
EB: Ano, jen bych rád podotkl, že není možné pořídit takto ucelený obraz jen z jednoduchého hledání štítků na YouTube. Pojďme teď znova vyzoomovat ze životního prostředí na celou globální konverzaci a podívejme se na všechny přednášky dohromady. Často, když se probíráme takovým množstvím dat, uděláme pár kroků pro zjednodušení. Můžeme říct, no, jaké tam máme nejoblíbenější přednášky? A pár jich vypluje na povrch. Máme tu přednášku o vděčnosti. Jinou o osobní hygieně a výživě. A samozřejmě, musí tu být také nějaká o pornu, že? A pak můžeme říct, no, vděčnost vládla minulý rok. Co je v módě dnes? Která přednáška je oblíbená teď? Vidíme, že nové, rostoucí, módní téma, je digitální soukromí.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
Je to skvělé. Ulehčuje nám to práci. Ale je tu také sposta tvůrčího obsahu, který je ukrytý u dna. A to nesnáším. Jak vybublají na povrch věci, které mohou být opravdu tvůrčí a zajímavé? No, můžeme se vrátit zpátky k síťové struktuře myšlenek, abychom je našli. Vzpomeňte si, že právě ona síťová struktura vytváří tato nenadálá témata a řekněme, že vezmeme dvě z nich, třeba města a genetiku, a zkusíme se podívat, jestli existují přednášky, které tvůrčím způsobem přemosťují tyto dva obory. A toto - v podstatě takový druh tvůrčího remixu, je jeden z charakteristických znaků inovace. Tady je jedna od Jessicy Greenové o mikrobiální ekologii budov. Doslova definuje nový obor. A tak bychom se mohli vracet k tématům a ptát se, které z přednášek hrají v konverzacích ústřední roli? Ve skupině o městech byla jedna z nejdůležitějších ta od Mitche Joachima o ekologických městech a ve skupině o genetice máme přednášku o syntetické biologii od Craiga Ventera. Toto jsou přednášky, které v rámci oboru odkazují na mnoho dalších. Mohli bychom se vydat jiným směrem a ptát se, které z těch přednášek úplně uměle vytvářejí mnohá různorodá odvětví? K nalezení odpovědi jsme použili míru ekologické různorodosti. Třeba přednáška Stevena Pinkera o historii násilí odvětví hodně slučuje.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
A pak jsou samozřejmě přednášky, které jsou tak unikátní, jakoby někde ve stratosféře, ve svém vlastním zvláštním světě, které jsme pojmenovali index Colleen Flanaganové. A pokud Colleen neznáte, je to umělkyně, které jsem se zeptal: "Jaké je to tam ve stratosféře našeho vesmíru nápadů?" Údajně to voní jako slanina. To jsem netušil. Takže my používáme tyto síťové motivy k nalezení přednášek, které jsou jedinečné, těch, které tvůrčím způsobem uměle vytváří mnoho různorodých odvětví, těch, které jsou nejdůležitější k danému tématu a těch, které opravdu tvůrčím způsobem překlenují různá odvětví. Dobrá? Nikdy bychom je nenašli bez posedlosti vědět, jaké jsou dnes trendy. A to vše pochází ze skladby složitosti nebo z obrazců, které tvoří propojené věci.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
SG: Je to přesně tak. Dostali jsme se do světa, který je hrozně složitý a my jsme použili algoritmy pro jakýsi druh odfiltrovávání, abychom v něm mohli navigovat. A tyto algoritmy, i když vlastně užitečné, jsou zároveň velmi, velmi omezené a dá se na to jít lépe, protože si uvědomujeme, že jejich složitost není náhodná. Je to matematická konstrukce a my ji můžeme využít k prozkoumání světa nápadů a najít, co bylo i nebylo řečeno a být trochu lidštější a snad i chytřejší.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
Děkuji.
Thank you.
(Potlesk)
(Applause)