Eric Berlow: I'm an ecologist, and Sean's a physicist, and we both study complex networks. And we met a couple years ago when we discovered that we had both given a short TED Talk about the ecology of war, and we realized that we were connected by the ideas we shared before we ever met. And then we thought, you know, there are thousands of other talks out there, especially TEDx Talks, that are popping up all over the world. How are they connected, and what does that global conversation look like? So Sean's going to tell you a little bit about how we did that.
Eric Berlow: Tôi là nhà sinh thái học, và Sean là nhà vật lí học, chúng tôi cùng nghiên cứu các mạng phức hợp. Chúng tôi đã gặp nhau vài năm trước khi phát hiện ra cả hai đều có bài nói ngắn trên TED Talk về chiến tranh sinh thái, và nhận ra rằng cả hai có liên hệ với nhau qua các ý tưởng được chia sẻ từ trước cả khi chúng tôi gặp nhau. Rồi sau đó chúng tôi nghĩ, như các bạn biết đó, có hàng nghìn các bài nói, đặc biệt là TEDx Talk, đang được lan rộng khắp nơi trên thế giới. Làm thế nào mà chúng được kết nối, và cuộc hội thoại toàn cầu đó diễn ra thế nào? Sau đây, Sean sẽ nói một chút về công việc mà chúng tôi đã làm.
Sean Gourley: Exactly. So we took 24,000 TEDx Talks from around the world, 147 different countries, and we took these talks and we wanted to find the mathematical structures that underly the ideas behind them. And we wanted to do that so we could see how they connected with each other.
Đúng vậy. Chúng tôi thu thập 24.000 bài nói chuyện TEDx từ khắp nơi trên thế giới, 147 nước khác nhau, và lấy những bài nói chuyện này và chúng tôi muốn tìm hiểu cấu trúc toán học ẩn sâu bên trong các ý tưởng đằng sau các bài nói. Và chúng tôi muốn làm việc đó để xem liệu chúng liên quan với nhau như thế nào.
And so, of course, if you're going to do this kind of stuff, you need a lot of data. So the data that you've got is a great thing called YouTube, and we can go down and basically pull all the open information from YouTube, all the comments, all the views, who's watching it, where are they watching it, what are they saying in the comments. But we can also pull up, using speech-to-text translation, we can pull the entire transcript, and that works even for people with kind of funny accents like myself. So we can take their transcript and actually do some pretty cool things. We can take natural language processing algorithms to kind of read through with a computer, line by line, extracting key concepts from this. And we take those key concepts and they sort of form this mathematical structure of an idea. And we call that the meme-ome. And the meme-ome, you know, quite simply, is the mathematics that underlies an idea, and we can do some pretty interesting analysis with it, which I want to share with you now.
Và dĩ nhiên rằng, nếu làm công việc này các bạn cần rất nhiều dữ liệu. Và dữ liệu mà các bạn có là một thứ tuyệt vời gọi là YouTube, và chúng ta có thể truy cập và xem tất cả thông tin mở trên YouTube, tất cả các lời bình luận, tất cả các lượt xem, ai đang xem xem ở đâu, nói gì trong phần bình luận. Nhưng chúng ta cũng có thể trích dẫn, sử dụng công cụ dịch giọng nói ra văn bản, chúng ta có thể trích toàn bộ văn bản nó thậm chí còn nhận được giọng của người có kiểu giọng buồn cười giống như tôi. Như vậy, chúng ta có thể lấy bản dịch và làm những việc hay ho từ đó. Chúng ta có thể dùng thuật toán xử lí ngôn ngữ gốc để đọc từng dòng một trên máy tính, trích rút các khái niệm quan trọng ở đó. Và chúng tôi lấy những khái niệm chủ chốt và chúng tạo nên cấu trúc toán học về ý tưởng này. Chúng tôi gọi nó là meme-ome. Và cái meme-ome đó, như các bạn biết, rất đơn giản, là toán học nằm sau một khái niệm. và chúng tôi tiến hành một số phân tích thú vị với nó, và tôi muốn chia sẻ nó với các bạn bây giờ.
So each idea has its own meme-ome, and each idea is unique with that, but of course, ideas, they borrow from each other, they kind of steal sometimes, and they certainly build on each other, and we can go through mathematically and take the meme-ome from one talk and compare it to the meme-ome from every other talk, and if there's a similarity between the two of them, we can create a link and represent that as a graph, just like Eric and I are connected.
Như vậy, mỗi ý niệm có một meme-ome riêng, và mỗi ý niệm đó đều có điểm đặc trưng riêng, nhưng tất nhiên, các ý niệm, chúng vay mượn lẫn nhau, chúng đôi khi còn đánh cắp lẫn nhau nữa, và chúng chắc chắn được xây dựng dựa vào nhau, và chúng tôi có thể kiểm tra về mặt toán học và lấy được meme-ome từ một bài nói chuyện so sánh nó với meme-ome từ các bài nói chuyện khác, và nếu có sự tương đồng giữa hai cái, chúng tôi có thể tạo ra một liên kết và biểu diễn nó lên biểu đồ, giống như Eric và tôi liên kết với nhau.
So that's theory, that's great. Let's see how it works in actual practice. So what we've got here now is the global footprint of all the TEDx Talks over the last four years exploding out around the world from New York all the way down to little old New Zealand in the corner. And what we did on this is we analyzed the top 25 percent of these, and we started to see where the connections occurred, where they connected with each other. Cameron Russell talking about image and beauty connected over into Europe. We've got a bigger conversation about Israel and Palestine radiating outwards from the Middle East. And we've got something a little broader like big data with a truly global footprint reminiscent of a conversation that is happening everywhere.
Như vậy, đó là lí thuyết, thật tuyệt vời. Chúng ta cùng xem nó làm việc thế nào trong thực tế. Vậy là, chúng ta đã có ở đây dấu tích toàn cầu của tất cả các bài nói chuyện TEDx trong bốn năm qua lan tỏa ra toàn thế giới từ New York xuống đến tận góc nhỏ của New Zealand. Và những gì chúng tôi đã làm đó là phân tích 25% bài nói hàng đầu, và xem xét sự kết nối này bắt nguồn từ đầu, từ đâu mà chúng kết nối với nhau. Cameron Russell nói về những hình ảnh và nét đẹp liên hệ trực tiếp với Châu Âu. Chúng ta có một cuộc đối thoại lớn hơn về Israel và Palestine lan ra ngoài từ phía Trung Đông. Và chúng ta có một vài thứ lớn hơn như dữ liệu lớn với dấu vết toàn cầu thật sự gợi nhớ về một cuộc trò chuyện đã diễn ra ở khắp mọi nơi.
So from this, we kind of run up against the limits of what we can actually do with a geographic projection, but luckily, computer technology allows us to go out into multidimensional space. So we can take in our network projection and apply a physics engine to this, and the similar talks kind of smash together, and the different ones fly apart, and what we're left with is something quite beautiful.
Vì vậy từ đó, chúng tôi gần như đi ngược lại với giới hạn của những gì mà chúng tôi làm với dự án địa lý, nhưng may thay, công nghệ máy tính đã cho phép chúng tôi với tới không gian đa chiều. Vì thế, chúng tôi có thể lấy dự án mạng lưới của mình và áp dụng một động cơ vật lý vào đó, và những bài nói tương tự sẽ được gộp lại với nhau, và những bài khác biệt thì sẽ tách ra, và những gì chúng tôi để lại là những thứ rất đẹp.
EB: So I want to just point out here that every node is a talk, they're linked if they share similar ideas, and that comes from a machine reading of entire talk transcripts, and then all these topics that pop out, they're not from tags and keywords. They come from the network structure of interconnected ideas. Keep going.
EB: Vì thế tôi muốn chỉ ra ở đây mỗi giao điểm là một bài thuyết trình, chúng được kết nối với nhau nếu chia sẻ những ý tưởng tương đồng, được lấy từ chiếc máy thông dịch của toàn bộ văn bản bài nói chuyện, và rồi tất cả những đề tài này sẽ nổi bật lên, không phải từ các thẻ và từ khoá. Chúng bắt nguồn từ cấu trúc mạng lưới của những ý tưởng liên kết với nhau. Cứ tiếp tục như vậy.
SG: Absolutely. So I got a little quick on that, but he's going to slow me down. We've got education connected to storytelling triangulated next to social media. You've got, of course, the human brain right next to healthcare, which you might expect, but also you've got video games, which is sort of adjacent, as those two spaces interface with each other.
SG: Tất nhiên. Vì thế tôi nói hơi nhanh về nó, nhưng anh ấy đang làm tôi chậm lại. Chúng tôi có sự giáo dục liên quan tới cách kể chuyện theo hình tam giác bên cạnh các phương tiện truyền thông xã hội. Bạn có, tất nhiên, não phải của con người ngay kế bên việc chăm sóc sức khoẻ, điều mà bạn có thể đang mong đợi, bạn còn có được những trò chơi điện tử, thứ đại loại là sự liền kề, vì hai không gian của chúng giao tiếp với nhau.
But I want to take you into one cluster that's particularly important to me, and that's the environment. And I want to kind of zoom in on that and see if we can get a little more resolution. So as we go in here, what we start to see, apply the physics engine again, we see what's one conversation is actually composed of many smaller ones. The structure starts to emerge where we see a kind of fractal behavior of the words and the language that we use to describe the things that are important to us all around this world. So you've got food economy and local food at the top, you've got greenhouse gases, solar and nuclear waste. What you're getting is a range of smaller conversations, each connected to each other through the ideas and the language they share, creating a broader concept of the environment. And of course, from here, we can go and zoom in and see, well, what are young people looking at? And they're looking at energy technology and nuclear fusion. This is their kind of resonance for the conversation around the environment. If we split along gender lines, we can see females resonating heavily with food economy, but also out there in hope and optimism.
Nhưng tôi muốn đưa bạn vào một trong những nhóm mà quan trọng đối với tôi, và đó là môi trường. Và tôi muốn đi sâu vào nó và xem nếu chúng ta có thể có nhiều độ phân giải hơn. Vì thế, khi đi đến đây, những gì chúng ta bắt đầu nhìn thấy, áp dụng các động cơ vật lý một lần nữa, chúng ta nhìn thấy rằng một cuộc nói chuyện là sự kết hợp giữa những cuộc nói chuyện nhỏ hơn. Cấu trúc bắt đầu nổi lên từ nơi mà chúng ta thấy một loạt phân đoạn các hành vi của những từ ngữ và ngôn ngữ mà chúng ta sử dụng để miêu tả những điều quan trọng đối với mình ở mọi nơi trên trái đất. bạn có được ngành kinh tế thực phẩm và thực phẩm địa phương ở hàng đầu, bạn có khí nhà kính, năng lượng mặt trời và chất thải hạt nhân. Những gì bạn đang có là một loạt những cuộc hội thoại, liên kết với nhau qua những ý tưởng và ngôn ngữ , sáng tạo ra một khái niệm rộng hơn về môi trường. Và tất nhiên, từ đây, chúng ta có thể đi tới và phóng to để nhìn, và có lẽ, người trẻ đang nhìn vào những gì? Và họ đang tìm hiểu về công nghệ năng lượng và hợp nhất hạt nhân nguyên tử. Đây là loại cộng hưởng của chúng cho cuộc nói chuyện xung quanh môi trường. Nếu phân chia theo dòng giới tính, chúng ta có thể nhìn thấy phụ nữ có cộng hưởng mạnh mẽ với nền kinh tế thực phẩm, và còn sự hy vọng và lạc quan.
And so there's a lot of exciting stuff we can do here, and I'll throw to Eric for the next part.
Và vì thế có rất nhiều những thứ rất thú vị mà chúng ta có thể làm ở đây, tôi sẽ để Eric nói phần tiếp theo.
EB: Yeah, I mean, just to point out here, you cannot get this kind of perspective from a simple tag search on YouTube. Let's now zoom back out to the entire global conversation out of environment, and look at all the talks together. Now often, when we're faced with this amount of content, we do a couple of things to simplify it. We might just say, well, what are the most popular talks out there? And a few rise to the surface. There's a talk about gratitude. There's another one about personal health and nutrition. And of course, there's got to be one about porn, right? And so then we might say, well, gratitude, that was last year. What's trending now? What's the popular talk now? And we can see that the new, emerging, top trending topic is about digital privacy.
EB: Vâng, ý tôi là, chỉ ra ở đây, bạn không thể hiểu được loại quan điểm này từ một từ khoá đơn giản trên Youtube. Giờ hãy phóng rộng ra toàn bộ cuộc nói chuyện trên toàn cầu nằm ngoài môi trường, và cùng nhìn vào tất cả những buổi nói chuyện. Thường thì giờ đây, khi đối mặt với số lượng nội dung này, chúng ta làm một vài điều để đơn giản hoá nó. Chúng ta có thể nói, như, Buổi nói chuyện nào là nổi tiếng nhất ? Và một số vấn đề nổi cộm, Có một cuộc nói chuyện về lòng biết ơn. Có cuộc nói chuyện khác về sức khoẻ và dinh dưỡng cá nhân. Và tất nhiên, sẽ có một cái về đề tài khiêu dâm, phải không? Và vì thế, chúng ta có thể nói, rồi về lòng biết ơn, nó đã Bây giờ thì xu hướng là gì? Cuộc nói chuyện nào là phổ biến? Và chúng ta có thể xem đề tài mới nổi và xu hướng là về tính riêng tư kỹ thuật số.
So this is great. It simplifies things. But there's so much creative content that's just buried at the bottom. And I hate that. How do we bubble stuff up to the surface that's maybe really creative and interesting? Well, we can go back to the network structure of ideas to do that. Remember, it's that network structure that is creating these emergent topics, and let's say we could take two of them, like cities and genetics, and say, well, are there any talks that creatively bridge these two really different disciplines. And that's -- Essentially, this kind of creative remix is one of the hallmarks of innovation. Well here's one by Jessica Green about the microbial ecology of buildings. It's literally defining a new field. And we could go back to those topics and say, well, what talks are central to those conversations? In the cities cluster, one of the most central was one by Mitch Joachim about ecological cities, and in the genetics cluster, we have a talk about synthetic biology by Craig Venter. These are talks that are linking many talks within their discipline. We could go the other direction and say, well, what are talks that are broadly synthesizing a lot of different kinds of fields. We used a measure of ecological diversity to get this. Like, a talk by Steven Pinker on the history of violence, very synthetic.
Vì thế nó rất tuyệt. Nó đơn giản hoá mọi điều. Nhưng có quá nhiều nội dung sáng tạo vừa bị chôn vùi dưới đáy. Và tôi ghét điều đó. Làm thế nào để đẩy chúng lên trên bề mặt khi mà chúng có thể thực sự sáng tạo và thú vị? Vậy thì, chúng ta có thể quay lại cấu trúc mạng lưới ý tưởng để làm điều đó. Nhớ rằng, đó là cấu trúc mạng lưới mà sáng tạo ra những đề tài nổi bật, và hãy nói rằng chúng ta có thể làm cả hai điều đó, giống như những thành phố và di truyền học, đó là bất cứ cuộc nói chuyện nào sáng tạo cầu nối giữa hai lĩnh vực khác nhau. Và đó - Quan trọng là, sự hòa trộn sáng tạo này là một trong những tâm điểm của sự cải tiến. Và đây là một bài nói của Jessica Green về hệ sinh thái thu nhỏ của các toà nhà. Nó định nghĩa một lĩnh vực mới. Và chúng ta quay lại những đề tài này và nói, thì bài nói nào là tâm điểm của những cuộc nói chuyện này? Ở cụm thành phố, một trong những bài nói trung tâm là bài nói của Mitch Joachim vềcác thành phố sinh thái, và trong cụm di truyền học, chúng ta có cuộc nói chuyện về sinh học tổng hợp của Craig Venter. Đây là những bài nói được kết nối từ nhiều bài nói chuyện khác cùng lĩnh vực. Chúng ta có thể đi theo hướng khác và nói, thì, những gì những cuộc nói chuyện tổng hợp được mở rộng ra nhiều lĩnh vực khác nhau. Chúng ta đã dùng thước đo về sự đa dạng sinh thái để hiểu về nó. Giống như, một buổi nói chuyện của Steven Pinker về lịch sử của bạo lực, rất tổng quát.
And then, of course, there are talks that are so unique they're kind of out in the stratosphere, in their own special place, and we call that the Colleen Flanagan index. And if you don't know Colleen, she's an artist, and I asked her, "Well, what's it like out there in the stratosphere of our idea space?" And apparently it smells like bacon. I wouldn't know. So we're using these network motifs to find talks that are unique, ones that are creatively synthesizing a lot of different fields, ones that are central to their topic, and ones that are really creatively bridging disparate fields. Okay? We never would have found those with our obsession with what's trending now. And all of this comes from the architecture of complexity, or the patterns of how things are connected.
Và rồi, tất nhiên, có nhiều bài nói rất đặc biệt chúng dường như ra khỏi tầng bình lưu, trong một không gian đặc biệt, và chúng ta gọi đó là chỉ số của Collegn Flanagan. Và nếu như bạn không biết Collen, cố ấy là một hoạ sỹ, và tôi hỏi cô ấy,"Sẽ như thế nào khi ở đó, ở tầng bình lưu của không gian ý tưởng của chúng ta? Và chắc rằng chúng có mùi như thịt xộng khói. Tôi cũng không biết. Vì thế, chúng tôi sử dụng mô- tuýp mạng lưới để tìm ra những bài nói đặc biệt những bài nói tổng hợp nhiều lĩnh vực khác nhau những bài trung tâm trong chủ đề của chúng, và những bài nói là cầu nối của những lĩnh vực khác nhau. Okay? Chúng ta sẽ chẳng bao giờ tìm ra những thứ mà ta ám ảnh với những gì đang trở thành xu hướn g hiện nay. Và tất cả chúng đều từ kiến trúc của sự phức tạp hoặc những phương thức mà ở đó mọi thứ liên kết với nhau.
SG: So that's exactly right. We've got ourselves in a world that's massively complex, and we've been using algorithms to kind of filter it down so we can navigate through it. And those algorithms, whilst being kind of useful, are also very, very narrow, and we can do better than that, because we can realize that their complexity is not random. It has mathematical structure, and we can use that mathematical structure to go and explore things like the world of ideas to see what's being said, to see what's not being said, and to be a little bit more human and, hopefully, a little smarter.
SG: Đúng như vậy. Chúng tôi đã tự đưa mình vào một thế giới cực kỳ phức tạp and sử dụng các thuật toán để sàng lọc những thứ mà ta có thể điều hướng. Và những thuật toán đó, mặc dù khá hữu dụng nhưng rất có giới hạn, và chúng ta có thể làm hơn thế, bởi vì ta nhận ra sự phức tạp đó không phải là ngẫu nhiên. Chúng có cấu trúc toán học, và chúng ta có thể sử dụng cấu trúc toán học đó để khám phá những điều như thế giới của ý tưởng để nhìn thấy những gì đã được nói tới, những gì chưa được nhắc đến, và một chút gì đó con người hơn và, hy vọng rằng, thông minh hơn một chút
Thank you.
Xin cám ơn.
(Applause)
(Vỗ tay)