Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
벌로우: 저는 생태학자이고 션은 물리학자입니다. 저희는 복잡계 네트워크를 연구하죠. 몇 년 전 저희 둘 다 전쟁의 생태에 관하여 짧게 TED 강연을 했던 것을 계기로 서로 알게 되었습니다. 실제로 만나기 전부터 같은 생각을 공유함으로써 서로 연결되어 있었다는 것을 깨달았죠. 그리고 세상에 TEDx와 같은 강연이 수천 개씩 나오고 있는데 생각이 미쳤습니다. 이 강연들은 어떻게 연결되어 있으며 전세계 사람들은 어떤 대화를 하고 있을까요? 연구 과정을 션이 설명해 드리겠습니다.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
고얼리: 그렇습니다. 저희는 전세계 147개국에서 24,000개의 TEDx 강연을 바탕으로 주제들을 뒷받침하는 수학적 구조를 찾고자 했습니다. 그래서 각각의 아이디어들이 서로 어떻게 연결되는지 알고 싶었습니다.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
이런 연구를 하려면 먼저 자료가 많이 필요하죠. 지료는 유튜브라는 멋진 곳에서 구합니다. 유튜브에서 공개된 모든 정보를 모으는 거죠. 댓글, 조회 기록, 시청자층, 시청자의 위치와 댓글 내용 외에도 음성-텍스트 변환을 이용해 대사 전문을 기록할 수도 있습니다 저처럼 억양이 약간 이상해도 상관없어요 이렇게 영상을 기록한 사본으로 여러 가지 재미있는 작업을 할 수 있습니다 자연어 처리 알고리즘을 통해 컴퓨터로 이 사본을 한 줄 한 줄 읽어나가며 핵심이 되는 개념을 뽑아냅니다. 이렇게 모인 개념들은 한 아이디어를 구성하는 수학적 구조 같은 형태가 됩니다 우리는 이것을 문화적 유전자라고 합니다. 문화적 유전자란 간단히 말해서 어떤 개념을 뒷받침하는 수학적 속성인데 이것으로 여러가지 흥미로운 분석을 할 수 있습니다. 지금 여러분께 보여드리고 싶군요.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
각각의 아이디어는 고유한 문화적 유전자를 갖고 있고 각 아이디어는 독특합니다. 그러나 아이디어는 다른 아이디어를 빌리기도 하고 훔쳐오기도 하며 서로를 기반으로 발전하게 마련입니다. 수학적 분석을 통해 얻은 강연 하나의 문화적 유전자를 다른 강연의 문화적 유전자와 비교했을 때 유사한 부분이 있다면 연결고리를 만들어 그래프로 나타낼 수 있습니다. 에릭과 제가 연결된 것처럼요.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
일단 이론은 이렇습니다. 실제로 적용되면 어떻게 되는지 보죠. 지난 4년간 전세계에서 쏟아져나온 모든 TEDx 강연의 모습입니다. 뉴욕에서 구석에 있는 뉴질랜드에 이르기까지요. 상위 25%를 분석하자 연결고리가 어디서 일어나서 어디서 서로 연결되는지 보이기 시작했습니다. 카메론 러셀의 이미지와 미에 관한 강연은 유럽으로 연결되었습니다. 이스라엘과 팔레스타인에 대해서는 중동에서 많은 이들이 토론했군요. 빅 데이터처럼 보다 광범위한 주제는 실로 전세계를 누볐습니다. 마치 어딜 가도 들리는 대화 주제처럼 말입니다.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
지도로 나타낼 수 있는 것은 거의 여기까지가 한계입니다만, 컴퓨터 기술 덕에 다차원적 공간을 배경으로 더 많은 것을 할 수 있었습니다. 이 네트워크 투사도에 물리적 도구을 적용하면 비슷한 강연들은 가까이 붙고 다른 강연들은 멀어집니다. 이렇게 아름다운 구조가 형성되죠.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
벌로우: 여기 있는 교점 하나하나가 모두 강연이며 비슷한 개념을 다루는 경우는 연결되어 있습니다. 강연 전문을 컴퓨터로 읽어들여 분석한 것이죠. 이렇게 나타나는 주제들은 태그나 키워드를 종합해 얻은 게 아니라 서로 연결된 아이디어로 이루어진 네트워크에서 창출된 것입니다. 계속 하시죠.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
고얼리: 네, 제가 좀 성급히 진행했는데 에릭이 조절해 줄 테니 괜찮아요. '교육' 은 '이야기하기' 와 연결되었고 '소셜미디어'와 함께 삼각형을 이룹니다. '인간 두뇌'가 '의료' 옆에 있는 것은 이상하지 않을지 모르지만 '비디오 게임' 도 이 두 가지가 닿아 있는 위치에서 멀지 않은 곳에 있습니다.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
이제 집중할 곳은 제가 매우 중요하게 생각하는 환경에 관련된 부분입니다. 그쪽 군락을 확대해서 해상도를 좀 높여 보도록 하죠. 가까이 다가갈수록 드러나는 것이 있습니다. 물리적 도구를 다시 적용하면 하나의 토론이 실은 수많은 작은 토론으로 이루어져 있습니다. 구조가 드러나기 시작합니다. 세계 각처에서 중요하다고 여기는 것들을 묘사하는 단어와 표현들이 모여 일종의 프랙탈 양상을 띠고 있습니다. 맨 위에는 '식품 경제'와 '지역 음식'이 있네요. '온실 가스'와 '태양열', '핵 폐기물'도 있습니다. 보다 작은 규모의 토론과 대화들이 공통적인 개념과 언어를 통해 서로 연결되면서 '환경'이라는 개념을 확장시키는 겁니다. 여기서 더 세부적으로 들어가 보죠. 젊은이들은 무엇에 관심을 가지고 있을까요? 에너지 기술과 핵융합 관련 내용을 시청했네요. 젊은이들은 환경에 대한 토론에서 이러한 주제를 파생시키고 있습니다. 성별에 따라 분류해 보자면 여성들은 식품 경제를 많이 다루었지만 희망과 낙관주의에 대해서도 토론했습니다.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
이 자료는 정말 다방면으로 쓰일 수 있어요. 에릭이 계속 설명하겠습니다.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
벌로우: 네, 다시 말씀드리지만 유튜브에서 단순히 태그 검색으로는 불가능한 폭넓은 각도에서 데이터를 보는 겁니다. 이제 환경이라는 주제에서 다시 전세계적 시점으로 돌아가 강연 전체를 살펴봅시다. 자료가 이렇게 많을 때는 몇 가지 작업을 통해 단순화시킵니다. 예를 들어, 제일 인기있는 강연을 찾아보면 몇 가지가 추려집니다. '감사'에 대한 강연, 개인 건강과 영양에 대한 강연, 포르노에 대한 강연도 빼놓을 수 없겠죠. 감사에 대한 강연은 지난 해였는데 지금은 뭐가 유행일까요? 현재 인기있는 강연은 뭘까요? 새로 떠오르는 화제는 디지털 사생활이라는 것을 알 수 있습니다.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
좋습니다. 간단해지죠. 하지만 저 바닥에 창의적인 내용이 너무나 많이 묻혀 있어요. 그러면 안 되죠. 어떻게 해야 정말 창의적이고 재미있는 내용들이 수면 위로 떠오르게 할까요? 그러기 위해서는 아이디어 네트워크 구조로 돌아가야 합니다. 애초에 이런 토론 주제들이 떠오르게 된 계기가 네트워크라는 걸 기억하세요. 도시와 유전학이라는 판이한 두 가지 주제를 독창적으로 연결시키는 강연이 있는지 알아보도록 하죠. 이와 같은 창의적인 자료 조작은 혁신의 특징 중 하나입니다. 제시카 그린의 건물의 미생물 생태에 대한 강연을 찾았습니다. 새로운 분야의 개척이에요. 각 주제에 대한 토론의 중심에는 어떤 강연들이 있을까요? '도시' 무리 가장 중심에는 미치 요아킴의 생태 도시에 대한 강연이 있고 '유전학' 무리 중심에는 크레이크 벤터의 합성 생물학 강연이 있습니다. 각 분야 내 수많은 강연들을 이어주는 연결고리입니다. 반대로 다양한 분야를 폭넓게 아우르는 강연에는 어떤 것이 있는지 알아볼 수도 있습니다. 생태학적 다양성의 척도를 통해 얻은 결과인데 예를 들어 폭력의 역사에 관한 스티븐 핑커의 강연은 매우 종합적이죠.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
한편으로는 너무나 독특해서 연결점 없이 혼자 떨어져 있는 강연도 있습니다. 저희는 이를 '콜린 플래내건 지수'라고 부릅니다. 모르실까봐 말씀드리자면 콜린은 예술가입니다. 우리가 만든 아이디어의 우주에서 성층권에 혼자 떨어져 있는 기분이 어떠냐고 물었더니 베이컨 냄새가 난다고 하더군요. 저야 모를 일입니다. 이렇게 네트워크 주제를 이용해 독특한 강연과 여러 분야를 통합하는 강연 및 강연 주제의 중심이 되는 강연과 상이한 분야를 이어 주는 강연들을 찾아보았습니다. 지금 이 순간의 동향에 대한 집착을 버리지 않고서는 알아낼 수 없었을 겁니다. 이 모든 것의 근원은 복잡성의 구조, 즉 만물이 서로 연결되는 무늬를 바탕으로 합니다.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
고얼리: 바로 그렇습니다 우리가 사는 세상은 엄청나게 복잡해서 그 안에서 방향을 찾을 수 있도록 다양한 알고리즘을 통해 정보를 여과했습니다. 이런 알고리즘은 유용하긴 하지만 굉장히 폭이 좁아 개선의 여지가 있습니다. 세상은 복잡하나 사실 수학적 구조가 뒷받침하고 있으며 이 수학적 구조를 활용하면 방대한 아이디어의 세계를 탐험할 수 있기 때문이죠. 무엇을 말하고 무엇을 말하지 않는지를 찾고 보다 인간적이고 영리해질 수 있도록 말입니다
Thank you.
감사합니다
(Applause)
(박수)