Time flies. It's actually almost 20 years ago when I wanted to reframe the way we use information, the way we work together: I invented the World Wide Web. Now, 20 years on, at TED, I want to ask your help in a new reframing.
시간이 금방 가는군요 거의 20년이 넘은 것 같습니다. 당시 저는 우리가 정보를 다루는 방식에 새로운 틀을 짜보고 싶었습니다. 그래서 고안해 냈던 것이 월드와이드웹(WWW)이었죠. 이제 20년이 흘렀고 여기 TED에서 한가지 부탁을 드리고 싶습니다. 그 틀을 다시한번 새로이 짜보자는 것입니다.
So going back to 1989, I wrote a memo suggesting the global hypertext system. Nobody really did anything with it, pretty much. But 18 months later -- this is how innovation happens -- 18 months later, my boss said I could do it on the side, as a sort of a play project, kick the tires of a new computer we'd got. And so he gave me the time to code it up. So I basically roughed out what HTML should look like: hypertext protocol, HTTP; the idea of URLs, these names for things which started with HTTP. I wrote the code and put it out there.
1989년 저는 하이퍼텍스트 컨셉을 메모지 위에다 고안해 봤습니다. 그런 아이디어가 정말 실현 가능할거라곤 아무도 생각 못했죠. 그런데 그게 18달 뒤엔 정말 되더라구요. 혁신이란게 대개 그렇듯 말입니다. 제 상관이 사이드잡으로 한번 해보라더군요. 그냥 재미로 하는 프로젝트로요. 새로 받은 컴퓨터도 있겠다, 시간도 허락 받았겠다, 그래서 여러분들이 현재 아시는 바 html이라는 것의 초안을 만들게 됐습니다. 그걸 주고 받는 통신 규약인 HTTP도요. 어떤 정보의 위치를 담는 주소의 개념으로 URL이라는 것도 생각해 냈습니다. 잘 아시다시피 http://로 시작하죠. 프로그램 코드를 만들기 시작했습니다.
Why did I do it? Well, it was basically frustration. I was frustrated -- I was working as a software engineer in this huge, very exciting lab, lots of people coming from all over the world. They brought all sorts of different computers with them. They had all sorts of different data formats, all sorts, all kinds of documentation systems. So that, in all that diversity, if I wanted to figure out how to build something out of a bit of this and a bit of this, everything I looked into, I had to connect to some new machine, I had to learn to run some new program, I would find the information I wanted in some new data format. And these were all incompatible. It was just very frustrating. The frustration was all this unlocked potential.
왜 제가 여기에 관심을 가졌나 하면, 사실 기본적으로 좌절감 때문입니다. 그땐 소프트웨어 엔지니어로 일할때였는데 뭐 연구실은 크고 재미 있었죠. 세계 각지에서 온 정말 많은 사람과 일하게 되었죠. 그런데 이사람들 출신들이 다른 만큼 쓰는 컴퓨터들도 다 다르더라구요. 데이터 포맷도 제 각각이었구요. 문서화 시스템도 제 마음대로였구요. 다양성 하나 만큼은 끝내줬습니다. 뭔가 만들려고 조금 알려고하거나 알려 줄려고 하면 전부다 들여다 보려고 새 컴퓨터에 연결한 뒤 그 프로그램의 동작 방법을 익히고 정보를 찾아 새 데이터 포맷으로 만들어야 했습니다. 그렇게까지 해도 모자랐죠. 그러니 좌절 할 수 밖에 없었습니다. 하지만 그 좌절이 모든 가능성들을 열어주게 되었죠.
In fact, on all these discs there were documents. So if you just imagined them all being part of some big, virtual documentation system in the sky, say on the Internet, then life would be so much easier. Well, once you've had an idea like that it kind of gets under your skin and even if people don't read your memo -- actually he did, it was found after he died, his copy. He had written, "Vague, but exciting," in pencil, in the corner.
사실 과거 모든 문서들은 하드디스크에만 있었습니다. 한번 상상해 보십시오. 하늘 위에 엄청 큰 가상 문서 시스템이 있다면 어떨까요. 인터넷 처럼요. 삶이 훨씬 쉬워지지 않을까요? 음, 이런 종류의 상상이란 대체로 한번 심어놓으면 계속 발전하곤 합니다. 남들이 관심을 가져주지 않아도 말이죠. 근데 알고보니 제 상사는 제 생각이 담긴 메모에 코멘트를 남겼더군요. 사후에 발견됐는데, 코멘트를 남겨뒀더라구요. "명확하진않지만, 멋짐"
(Laughter)
(웃음소리)
But in general it was difficult -- it was really difficult to explain what the web was like. It's difficult to explain to people now that it was difficult then. But then -- OK, when TED started, there was no web so things like "click" didn't have the same meaning. I can show somebody a piece of hypertext, a page which has got links, and we click on the link and bing -- there'll be another hypertext page. Not impressive. You know, we've seen that -- we've got things on hypertext on CD-ROMs. What was difficult was to get them to imagine: so, imagine that that link could have gone to virtually any document you could imagine. Alright, that is the leap that was very difficult for people to make. Well, some people did. So yeah, it was difficult to explain, but there was a grassroots movement. And that is what has made it most fun. That has been the most exciting thing, not the technology, not the things people have done with it, but actually the community, the spirit of all these people getting together, sending the emails. That's what it was like then.
과정이 쉽진 않았습니다. 웹이 무엇인지 설명하는 건 정말 쉽지 않았습니다. 웹이 보편화된 지금도 어려운데 과거에는 뭐 말할필요도 없죠. 1984년 그러니까 TED가 시작될 때(역자주:1984)에는 웹이 없었고 당시만 해도 클릭을 한다는 행위가 갖는 의미가 지금하고는 많이 달랐습니다. 사람들에게 링크를 클릭하면 다른 문서로 넘어가고 그 안에서 또 링크를 클릭하면 또 뿅하고 다른 문서로 넘어가는 그런 하이퍼텍스트를 보여줄순 있었겠죠. 하지만 뭐가 신기했겠어요. 그런거야 이미 CD-ROM에 있는 하이퍼텍스트를 에서 많이 봐왔는데요. 문제는 사람들이 상상하도록 하는 것이었죠. 클릭 한번으로 지구상 어떤 문서든 볼 수 있도록 연결할 수 있다고 한번 상상해 보세요. 사람들에게는 이런 상상을 한다는 것 자체가 바로 가장 큰 어려움이었습니다. 몇몇 사람들은 여기에 성공했죠. 설명하기 어렵지만 밑으로 부터의 풀뿌리 변화였습니다. 풀뿌리. 바로 이게 웹이 재미있어 질 수 있는 이유였죠. 정말 신나는 일이었어요. 기술이 중요한게 아니라, 사람이 그 기술가지고 뭘 하느냐가 중요한게 아니라 밑으로부터의 변화에 참여하는 사람들이 함께 모여 보여주는 정신. 이메일을 주고받고, 또 커뮤니티를 이루고.. 그런 혼이 살아 있었던 겁니다.
Do you know what? It's funny, but right now it's kind of like that again. I asked everybody, more or less, to put their documents -- I said, "Could you put your documents on this web thing?" And you did. Thanks. It's been a blast, hasn't it? I mean, it has been quite interesting because we've found out that the things that happen with the web really sort of blow us away. They're much more than we'd originally imagined when we put together the little, initial website that we started off with. Now, I want you to put your data on the web. Turns out that there is still huge unlocked potential. There is still a huge frustration that people have because we haven't got data on the web as data.
근데 재밌는 건, 웬지 요즘 그때와 비슷한 분위기가 나타나고 있단 겁니다. 만나는 사람마다 부탁을 했어요. 문서 가진거 있음 좀 올려 달라구요. "내가 WWW란걸 만들었는데, 여기 니꺼 문서좀 올려주면 안될까?" 하며 말입니다. 그리고, 여러분들은 그렇게 해주셨습니다. 감사합니다. 20년 사이에 정말 뻥 터졌잖아요? 제말은 정말 흥미로웠단 이야기입니다. 맞잖아요? 지금껏 웹에서 일어난 일들을 한번 돌이켜 보세요. 너무나도 놀라운 일이죠. 이런 현상은 저희가 서로에게 문서를 올려달라며 서로에게 부탁해가면서 처음 웹을 고안했을 때 기대했던 것보다 훨씬 컸어요. 이제, 저는 여러분들께도 데이터를 웹에 올려주시길 부탁드립니다. 웹에는 여전히 커다란 잠재력이 있습니다만 여전히 커다란 좌절감이 존재합니다. 현재 웹에 널려있는 정보가 대체로 "문서"이지 "데이터"가 아니기 때문입니다.
What do you mean, "data"? What's the difference -- documents, data? Well, documents you read, OK? More or less, you read them, you can follow links from them, and that's it. Data -- you can do all kinds of stuff with a computer. Who was here or has otherwise seen Hans Rosling's talk? One of the great -- yes a lot of people have seen it -- one of the great TED Talks. Hans put up this presentation in which he showed, for various different countries, in various different colors -- he showed income levels on one axis and he showed infant mortality, and he shot this thing animated through time. So, he'd taken this data and made a presentation which just shattered a lot of myths that people had about the economics in the developing world.
데이터가 뭘 말하는거죠? 문서랑 데이터 차이가 뭔데요? 문서는 우리가 읽을수 있는겁니다, 이해되죠? 어쨋거나, 읽을수 있고, 링크를 따라갈수도 있죠. 그거면 됩니다. 데이터는 사람뿐 아니라 컴퓨터로도 처리할 수 있는 정보입니다. 여기 혹시 Hans Rosling의 TED 발표 보신분 계신가요? 정말 많은 분들이 보셨네요. 제 생각엔 최고의 TEDtalk 중의 하나입니다. Hans의 PT에 이런 게 나오죠. 다양한 국가에 각각의 색깔을 입히고 한축에는 소득 수준을, 또 다른 한 축에는 영아 사망률을 표시했습니다. 그리고 시간이 흐르면서 변화하는 모습을 애니메이션으로 보여줬습니다. 그렇게 그는 데이터를 가지고 새로운 형식의 발표자료를 만들었고, 바로 이게 사람들이 가졌던 편견을 깨뜨렸습니다. 개발 도상국의 경제 현실에 대한 편견을요.
He put up a slide a little bit like this. It had underground all the data OK, data is brown and boxy and boring, and that's how we think of it, isn't it? Because data you can't naturally use by itself But in fact, data drives a huge amount of what happens in our lives and it happens because somebody takes that data and does something with it. In this case, Hans had put the data together he had found from all kinds of United Nations websites and things. He had put it together, combined it into something more interesting than the original pieces and then he'd put it into this software, which I think his son developed, originally, and produces this wonderful presentation. And Hans made a point of saying, "Look, it's really important to have a lot of data." And I was happy to see that at the party last night that he was still saying, very forcibly, "It's really important to have a lot of data."
그는 슬라이드 한 장을 이런식으로 보여줍니다. 이건 전부 데이터를 가지고 수행되는겁니다. 사실 데이터는 딱딱하고 재미없고 진부합니다. 우린 데이터에 대해 이렇게 생각합니다. 그렇지 않나요? 왜냐하면 저걸 직접 사용할일이 별로 없었으니까요. 그치만 사실은, 데이터는 알게 모르게 우리 삶 속에 어마어마한 영향을 끼칩니다. 왜냐하면 누군가는 그 데이터를 가지고 무엇인가를 하기때문이죠. 이번 경우는, 한스는 데이터를 하나로 모았습니다. 한스는 UN의 수많은 웹사이트 전부를 다 뒤져 정보를 찾아내고는 그 데이터들을 한데 모았습니다. 그리고는 그 정보 조각들을 잘 조립해 훨씬 흥미로운 행태로 가공해 프로그램에 입력하고 돌린 거죠. 아마 그분 아들이 개발한 프로그램일거예요. 그랬더니 멋진 발표자료가 만들어졌습니다. 한스의 논지는 데이터의 양이 중요하다는 것이었어요. 어제 밤 파티에서 그를 보았는데요. 여전히 강조 하더군요. 데이터의 양이 엄청나게 중요하다고요.
So I want us now to think about not just two pieces of data being connected, or six like he did, but I want to think about a world where everybody has put data on the web and so virtually everything you can imagine is on the web and then calling that linked data. The technology is linked data, and it's extremely simple. If you want to put something on the web there are three rules: first thing is that those HTTP names -- those things that start with "http:" -- we're using them not just for documents now, we're using them for things that the documents are about. We're using them for people, we're using them for places, we're using them for your products, we're using them for events. All kinds of conceptual things, they have names now that start with HTTP.
같이 한번 생각해봅시다. 단지 두 조각의 데이터 혹은 그가 했듯이 여섯 조각의 데이터가 연결되는것이 아니라 누구나 데이터를 웹에 올리고 연결하는 생각을 해보자는 겁니다. 실질적으로 우리가 상상할수 있는 거의 모든 것이 웹에 존재하게 되겠죠. 데이터가 모두 연결되는 것입니다. 이런걸더러 "Linked Data"라고 하는데, 간단합니다. 웹에 무언가를 올린다고 생각해볼까요? 여기엔 세 가지 규칙이 있습니다. 첫번째 규칙은 바로 그러니까 HTTP: 으로 시작하는 주소가 있다는 겁니다. 요즘은 오직 웹페이지 문서에만 HTTP 주소가 필요한게 아닙니다. 최근엔 문서를 뛰어넘어 문서가 다루는 "실체"에도 주소가 생기기 시작했습니다. 우린 HTTP주소를 사람에도 장소에도, 심지어 사람에도 사용합니다. 그리고 또 상품에도, 행사에도 사용하고 있죠. 심지어는 추상적인 개념에까지도 HTTP로 시작하는 주소가 있습니다.
Second rule, if I take one of these HTTP names and I look it up and I do the web thing with it and I fetch the data using the HTTP protocol from the web, I will get back some data in a standard format which is kind of useful data that somebody might like to know about that thing, about that event. Who's at the event? Whatever it is about that person, where they were born, things like that. So the second rule is I get important information back.
두번째 규칙은 예를 들면 이런 것입니다. 사람들은 정보를 검색합니다. 웹에서 자기가 원하는 정보를 담고있는 HTTP주소를 찾는 거죠. HTTP라는 약속 프로토콜(규약)을 통해서 말입니다. 주소를 찾아가 약속과 형식에 따라 저장된 정보를 얻어 온다는 것이죠. 행사든 물건이든 뭐가 됐든 우리에게 유용한 정보가 프로토콜(규약)에 따라 저장되어 있고 우리는 그 정보를 얻어 오는 겁니다. 예를 들어 누가 행사에 오는지, 그 사람이 누군지 어디서 태어났는지, 뭐 그런것들이요. 다시 말해서 두번째 규칙은 내가 중요한 정보를 얻어 온다는 것입니다.
Third rule is that when I get back that information it's not just got somebody's height and weight and when they were born, it's got relationships. Data is relationships. Interestingly, data is relationships. This person was born in Berlin; Berlin is in Germany. And when it has relationships, whenever it expresses a relationship then the other thing that it's related to is given one of those names that starts HTTP. So, I can go ahead and look that thing up. So I look up a person -- I can look up then the city where they were born; then I can look up the region it's in, and the town it's in, and the population of it, and so on. So I can browse this stuff.
세번째 규칙은 우리가 그 정보를 얻어 올 때 그냥 단순히 그사람의 키나, 몸무게, 사는곳만 가지고 오는게 아니라 정보들 사이의 관계도 가지고 온다는거죠. 데이터는 "관계"입니다. 흥미롭게도 데이터는 "관계"입니다. 어떤 사람이 베를린에서 태어났다 칩시다. 베를린은 독일에 있죠. 그러면 이 두 정보는 관계가 있는 거죠. 그리고 관계를 표현할때면 언제든지, 관계가 있는 두 대상 사이를 HTTP로 시작하는 주소로 연결한다는 것이죠. 그러면 그 관계를 연결된 주소를 따라 추적할 수 있겠죠. 그런식으로 누군가를 찾아보고, 태어난 도시를 또 찾아보고, 어느 지역에 있는지 찾아보고, 그 지역 어느 동넨지 보고, 인구는 얼마나 되는지, 등등등. 이런 것들을 검색해볼수 있는거죠.
So that's it, really. That is linked data. I wrote an article entitled "Linked Data" a couple of years ago and soon after that, things started to happen. The idea of linked data is that we get lots and lots and lots of these boxes that Hans had, and we get lots and lots and lots of things sprouting. It's not just a whole lot of other plants. It's not just a root supplying a plant, but for each of those plants, whatever it is -- a presentation, an analysis, somebody's looking for patterns in the data -- they get to look at all the data and they get it connected together, and the really important thing about data is the more things you have to connect together, the more powerful it is.
사실은 이게 답니다. 정말로요. 이게 "Linked Data"입니다. 몇년 전 저는 "Linked Data"라는 제목의 글을 쓴 적이 있습니다. 그러자 곧바로 뭔가 일이 터지기 시작하더군요. Linked Data라는 것은, 마치 한스가 썼던 데이터가 그랬듯, 엄청 나게 만은 정보들이 서로 연결되고 거기에 따라 엄청 많은 새로운 의미가 싹틈을 뜻합니다. 싹튼다고 해서 그냥 풀같은 것이 아닙니다. 풀의 줄기를 지지하는 뿌리만 같은 것도 아닙니다. 모든 풀 속에서 사람들은 정보를 찾고 그 안에서 패턴을 찾아냅니다. PT일수도 있고, 문서일수도, 분석자료일 수도 있습니다. 사람들은 데이터 전체를 보고 그 많은 데이터들 않에서 의미있는 연결을 만들어 냅니다. 결국 정보를 다루면서 우리가 주목해야 할 것은 여러분이 연결을 많이 만들면 만들수록 더욱 파워풀해진다는 것입니다.
So, linked data. The meme went out there. And, pretty soon Chris Bizer at the Freie Universitat in Berlin who was one of the first people to put interesting things up, he noticed that Wikipedia -- you know Wikipedia, the online encyclopedia with lots and lots of interesting documents in it. Well, in those documents, there are little squares, little boxes. And in most information boxes, there's data. So he wrote a program to take the data, extract it from Wikipedia, and put it into a blob of linked data on the web, which he called dbpedia. Dbpedia is represented by the blue blob in the middle of this slide and if you actually go and look up Berlin, you'll find that there are other blobs of data which also have stuff about Berlin, and they're linked together. So if you pull the data from dbpedia about Berlin, you'll end up pulling up these other things as well. And the exciting thing is it's starting to grow. This is just the grassroots stuff again, OK?
이게 Linked Data입니다. 이런 일도 있었습니다. 베를린에 Freie대학에 있는 Chris Bizer라는 사람이 있습니다. 인터넷을 가지고 장난을 치기 시작한 최초의 사람들 중 하나죠. 그는 위키피디아를 주목했습니다. 여러분들이 알다시피 위키피디아는 흥미로운 문서들을 엄청 많이 담고 있는 온라인 백과사전입니다. 근데 자세히 들어보면 안에 작은 네모 상자들이 많은 걸 볼 수 있을 겁니다. 그 상자들 안엔 대개 한뭉치 데이터들이 들어있죠. Bizer는 위키피디아의 그 상자들로부터 데이터를 추출하는 프로그램을 짰습니다. 그리곤 그 데이터들을 다른 링크데이터 뭉치에 연결시켰죠. 그것을 그는 Dbpedia라 불렀습니다. Dbpedia는 이 슬라이드 중간에 파란 뭉치로 표현되었습니다. 거기 가서 베를린을 뒤져볼까요? 다시 여러개의 정보 뭉치가 떠오릅니다. 베를린과 관련된 다른 정보가 있다는 거죠. 다 연결되어 있습니다. 베를린을 찾았더니 베를린과 관련된 다른 정보들도 감자 덩쿨처럼 다 따라 나온다는 것이죠. 재미있는 것은 이 덩쿨이 자라기 시작했단 겁니다. 풀뿌리로 말입니다. 신기하지 않나요?
Let's think about data for a bit. Data comes in fact in lots and lots of different forms. Think of the diversity of the web. It's a really important thing that the web allows you to put all kinds of data up there. So it is with data. I could talk about all kinds of data. We could talk about government data, enterprise data is really important, there's scientific data, there's personal data, there's weather data, there's data about events, there's data about talks, and there's news and there's all kinds of stuff. I'm just going to mention a few of them so that you get the idea of the diversity of it, so that you also see how much unlocked potential.
데이터에 대해 조금만 더 생각해 봅시다. 데이터에는 종류가 많습니다. 웹의 다양성에 대해 생각해 보세요. 그림, 글, 차트, 표, 그래프 등등 웹은 그 모든 형태의 데이터들을 담고 있습니다. 데이터를 떼어놓곤 웹을 생각할 수 없습니다. 정부의 데이터, 기업의 데이터는 매우 중요합니다. 과학적 데이터도 있고 개인적 데이터도 있습니다. 기후 데이터도 있고 사건들에 대한 데이터도 있습니다. 이야기(Talk)에 대한 데이터도 있고, 뉴스도 있고, 데이터는 모든 형태를 망라합니다. 여기서는 그중 몇 가지만 다뤄보죠. 그럼으로써 여러분들도 데이터의 다양성에 대해 생각해보고 또한 여기에 열마나 큰 잠재력이 숨어 있는지를 볼 수 있을 겁니다.
Let's start with government data. Barack Obama said in a speech, that he -- American government data would be available on the Internet in accessible formats. And I hope that they will put it up as linked data. That's important. Why is it important? Not just for transparency, yeah transparency in government is important, but that data -- this is the data from all the government departments Think about how much of that data is about how life is lived in America. It's actual useful. It's got value. I can use it in my company. I could use it as a kid to do my homework. So we're talking about making the place, making the world run better by making this data available.
정부 데이터 부터 시작해 보겠습니다. 버락 오바마가 연설 중에 이야기했습니다. 인터넷을 통해 액세스 할 수 있도록 미국 정부의 데이터를 공개하겠다고 말입니다. 저는 그게 Link Data와 같은 모습이 되길 바랍니다. 이건 중요한 일입니다. 왜 중요할까요? 투명성 때문만은 아닙니다. 네, 정부의 투명성은 중요하지요. 하지만 여기에서 데이터란 정부의 모든 기관으로부터의 데이터입니다. 미국인이 어떤 삶을 사는지를 말해 주는 중요한 정보가 얼마나 많겠어요. 그것은 실제로 유용합니다. 가치가 있지요. 회사에서도 참고할 수 있습니다. 제 연구를 위한 심부름꾼으로 쓸 수도 있겠죠. 한마디로 어떻게 하면 데이터를 열어놓음으로서 세상을 좀 더 살기 좋게 만드느냐 하는 것이죠.
In fact if you're responsible -- if you know about some data in a government department, often you find that these people, they're very tempted to keep it -- Hans calls it database hugging. You hug your database, you don't want to let it go until you've made a beautiful website for it. Well, I'd like to suggest that rather -- yes, make a beautiful website, who am I to say don't make a beautiful website? Make a beautiful website, but first give us the unadulterated data, we want the data. We want unadulterated data. OK, we have to ask for raw data now. And I'm going to ask you to practice that, OK? Can you say "raw"?
하지만 현실은, 대부분 정부에서 근무하는 대부분의 공무원들은 대체로 정보를 공개하기보다는 가급적이면 안에다가 가둬 두고 싶어하는 경향이 있습니다. 한스는 그것을 데이터베이스 끌어안기(hugging)라고 부릅니다. 데이터를 끌어 안고는 내보내지를 않는 거죠. 어지간히 예쁜 웹사이트가 준비 될 때 까지는 말입니다. 제가 여기서 하고 싶은 말은.. 예쁜 웹사이트를 만드는 건 좋습니다. 예쁜 웹사이트 만드는 걸 가지고 누가 뭐라 하나요? 예쁜 웹사이트를 만드세요, 하지만 첫번째로 가공되지 않은 데이터를 공개하라는 것입니다. 우리는 그 데이터를 원합니다. 우리는 순수한 데이터를 원합니다. 네, 우리는 생짜(raw) 데이터를 요구해야 합니다. 한번 연습해보도록 하지요, 괜찮겠죠? "생짜(raw)" 이라고 이야기해보세요.
Audience: Raw.
"생짜(raw)"
Tim Berners-Lee: Can you say "data"?
"데이터"라고 해보실래요?
Audience: Data.
"데이터"
TBL: Can you say "now"?
"당장" 이라고 해보실래요?
Audience: Now!
"당장!"
TBL: Alright, "raw data now"!
좋습니다, "지금 당장 생짜 데이터를!"
Audience: Raw data now!
"지금 당장 생짜 데이터를!"
Practice that. It's important because you have no idea the number of excuses people come up with to hang onto their data and not give it to you, even though you've paid for it as a taxpayer. And it's not just America. It's all over the world. And it's not just governments, of course -- it's enterprises as well.
우리는 요구해야 합니다. 정부가 데이터를 공개하지 않고 안에다 가둬놓기 위해 대는 이유는 정말이지 엄청나게 많습니다. 여러분은 세금을 내고 있다는 점을 명심하세요. 미국만 그런것도 아니죠. 전세계가 그래요 그리고 정부만 그런것도 아니에요, 산업쪽도 마찬가지죠.
So I'm just going to mention a few other thoughts on data. Here we are at TED, and all the time we are very conscious of the huge challenges that human society has right now -- curing cancer, understanding the brain for Alzheimer's, understanding the economy to make it a little bit more stable, understanding how the world works. The people who are going to solve those -- the scientists -- they have half-formed ideas in their head, they try to communicate those over the web. But a lot of the state of knowledge of the human race at the moment is on databases, often sitting in their computers, and actually, currently not shared.
그래서 데이터에 대한 제 생각을 몇가지 더 얘기해 볼까 합니다. 여기 TED에서 우리는, 현재 인류가 당면한 수많은 도전과 과제에 대해 늘 의식합니다. 암을 정복하기 위해 암을 공부하고, 알츠하이머 극복을 위해 뇌를 연구합니다. 좀 더 안정적인 경제를 위해 경제를 이야기하기도 합니다. 세상이 어떻게 굴러가는지 이해하려 애쓴다는 거죠. 하지만 이런 문제를 해결하기 위해 애쓰는 많은 과학자들은 사실 아이디어의 반쪽밖에는 가지고 있지 않습니다. 그래서 웹을 통해 나머지 반을 다른 이들과 나누고 싶어 합니다. 하지만 인류가 현재 가지고 있는 대다수의 지식들은 아직까지 데이터베이스나 컴퓨터 안에 틀어박혀 효과적으로 공유가 안되고 있습니다.
In fact, I'll just go into one area -- if you're looking at Alzheimer's, for example, drug discovery -- there is a whole lot of linked data which is just coming out because scientists in that field realize this is a great way of getting out of those silos, because they had their genomics data in one database in one building, and they had their protein data in another. Now, they are sticking it onto -- linked data -- and now they can ask the sort of question, that you probably wouldn't ask, I wouldn't ask -- they would. What proteins are involved in signal transduction and also related to pyramidal neurons? Well, you take that mouthful and you put it into Google. Of course, there's no page on the web which has answered that question because nobody has asked that question before. You get 223,000 hits -- no results you can use. You ask the linked data -- which they've now put together -- 32 hits, each of which is a protein which has those properties and you can look at. The power of being able to ask those questions, as a scientist -- questions which actually bridge across different disciplines -- is really a complete sea change. It's very very important. Scientists are totally stymied at the moment -- the power of the data that other scientists have collected is locked up and we need to get it unlocked so we can tackle those huge problems.
하지만 이런 사례도 있습니다. 알츠하이머의 경우가 그런데, 최근들어 많은 연구 결과들과 데이터들이 연결데이터로 묶여 나오고 있습니다. 왜냐하면 이 분야의 많은 과학자들이 연구실에 데이터를 가둬 놓는 게 좋을 게 없다는걸 깨닫기 시작했기 때문입니다. 어떤 건물 어떤 컴퓨터 안에 있는 유전정보가 있고 또 다른 건물 다른 컴퓨터 안엔 단백질에 관한 데이터가 있어 서로 엮으니 낫다는 거죠. 정보들이 서로 링크로 엮이고 있습니다. 데이터가 링크되고 있습니다. 그래서 이제 예전이라면 던지지 못했을 새로운 질문을 던질 수 있게 됩니다. 저나 여러분이 던지지 못했던 그런 새로운 질문 말입니다. 어떤 단백질이 "신호 형질 변환"에 연루되어 있는지. 또 어떤 단백질이 "피라미드 뉴런"과 관련이 있는지 따위의 질문들 말입니다. 이런 질문들을 적어서 구글에 올려놓으면 해결이 될까요? 물론 그런 질문에 대답했던 웹페이지는 지금까지는 없었습니다. 왜냐하면 아무도 전에는 그런 질문을 한 사람이 없었으니까요. 여러분이 올린 그 질문의 조회수가 223,000회가 된다 칩시다. 그래도 쓸만한 대답은 나오지 않습니다. 하지만 Linked Data의 경우라면 얘기가 다릅니다. 32번의 조회만으로 여러분은 어떤 단백질이 어떤 형질을 가졌는지 알게 됩니다. 금새 확인이 됩니다. 분야와 학제를 가로질러 이런 질문을 할 수 있다는 것은 과학자들에게 있어서는 정말 엄청난 혜택입니다. 거대한 혁명이죠. 엄청나게 중요합니다. 과학자들은 지금 너무나도 난처한 상황에 있습니다. 다른 과학자들이 수집해놓은 데이터의 힘은 봉인되어 있습니다. 우리가 이 봉인을 풀어 냈을 때에야 비로소 우리는 당면한 큰 문제들을 해결할 수 있을 겁니다.
Now if I go on like this, you'll think that all the data comes from huge institutions and has nothing to do with you. But, that's not true. In fact, data is about our lives. You just -- you log on to your social networking site, your favorite one, you say, "This is my friend." Bing! Relationship. Data. You say, "This photograph, it's about -- it depicts this person. " Bing! That's data. Data, data, data. Every time you do things on the social networking site, the social networking site is taking data and using it -- re-purposing it -- and using it to make other people's lives more interesting on the site. But, when you go to another linked data site -- and let's say this is one about travel, and you say, "I want to send this photo to all the people in that group," you can't get over the walls. The Economist wrote an article about it, and lots of people have blogged about it -- tremendous frustration. The way to break down the silos is to get inter-operability between social networking sites. We need to do that with linked data.
제가 이렇게 얘기한다면, 그런 정보들이야 다 큰 조직에서 나오는 거고 여러분과는 별 상관이 없는 일이라 여기실지도 모르겠습니다. 하지만 그렇지 않습니다. 사실, 데이터는 우리의 삶입니다. 여러분이 소셜웹사이트에 로긴했다 쳐봅시다. 친구를 발견하고는 "내 친구"라고 코멘트를 남깁니다. 짠! 관계가 생겼네요. 데이터입니다. 여러분들은 이야기 합니다. '이 사진은 이 사람을 묘사한 것 이다.' 짠! 데이터가 생겼네요. 데이터, 데이터. 여러분이 소셜웹사이트에서 뭔가를 클릭하고 적을 때마다 그 소셜웹사이트는 여러분이 입력한 그 데이터를 받아서 여러가지 방식으로 연결합니다. 그렇게 해서 그 데이터가 그 사이트에 접속하는 다른 사람들 경험을 더 풍부하게 하는 거죠. 하지만, 여러분들이 다른 소셜 웹사이트에 가서 예를들어 여러분이 여행갔다온 얘기를 하고싶다고 쳐봅시다. 여행 사진을 여기저기 사이트에 흩어진 친구들에게 공유하고 싶겠지만 벽때문에 불가능합니다. "이코노미스트"에도 같은 기사가 난 적이 있습니다. 블로그 글도 많이 뜨더군요. 짜증난다고 말입니다. 이 벽을 넘는 방법은 소셜네트워크 사이트 상호간에 서로 데이터를 나눌 수 있도록 길을 트는 것입니다. Linked Data로 말입니다.
One last type of data I'll talk about, maybe it's the most exciting. Before I came down here, I looked it up on OpenStreetMap The OpenStreetMap's a map, but it's also a Wiki. Zoom in and that square thing is a theater -- which we're in right now -- The Terrace Theater. It didn't have a name on it. So I could go into edit mode, I could select the theater, I could add down at the bottom the name, and I could save it back. And now if you go back to the OpenStreetMap. org, and you find this place, you will find that The Terrace Theater has got a name. I did that. Me! I did that to the map. I just did that! I put that up on there. Hey, you know what? If I -- that street map is all about everybody doing their bit and it creates an incredible resource because everybody else does theirs. And that is what linked data is all about. It's about people doing their bit to produce a little bit, and it all connecting. That's how linked data works. You do your bit. Everybody else does theirs. You may not have lots of data which you have yourself to put on there but you know to demand it. And we've practiced that.
마지막 예를 한번 들어보겠습니다. 사실 이게 가장 흥미로워요. 오늘 제가 여기 올때 OpenStreetMap을 통해 지도를 좀 검색해 봤습니다. OpenStreetMap은 지도인 동시에 위키이기도 합니다. 확대하니까 네모난 건물이 보이네요. 지금 우리가 앉아있는 극장입니다. 원래 극장 이름이 "테라스 극장"인데, 화면엔 안뜨네요. 그래서 저는 편집모드로 들어가 극장을 선택했습니다. 밑에 이름을 입력하고는 저장했죠. 만일 여러분이 지금 OpenStreetMap.org에 들어간다면 "The Terrace Theater"라고 제가 입력한 이름이 뜨는 걸 보실 수 있습니다. 제가 입력한겁니다. 제가 그 지도에 이름을 붙였습니다. 제가 그랬습니다! 제가 거기에 이름을 붙였습니다. 놀라운건 바로 이런 겁니다. 그 지도에 나온 정보란 죄다 저같은 사람들이 하나 둘씩 입력해 만들었단 거죠. 이렇게 해서 쌓이는 정보의 보고는 정말 엄청납니다. 모두가 자기 역량 안에서 더할 수 있는 걸 더했기에 가능했죠. 이런 게 바로 Linked Data입니다. 사람들이 각자 자기 몫을 공유하는 거죠. 작은 것들이 쌓이면서 서서히 다 연결됩니다. 이것이 Linked Data가 동작하는 방식입니다. 저는 저대로 여러분은 여러분대로 각자 자기 몫만큼 기여하는거죠. 여러분이 가진 정보가 어디엔가 올려놓을만큼 많지 않을 수도 있습니다. 하지만 여전히 정보를 요구할 수는 있습니다. 우리는 이런 걸 충분히 해봤습니다.
So, linked data -- it's huge. I've only told you a very small number of things There are data in every aspect of our lives, every aspect of work and pleasure, and it's not just about the number of places where data comes, it's about connecting it together. And when you connect data together, you get power in a way that doesn't happen just with the web, with documents. You get this really huge power out of it. So, we're at the stage now where we have to do this -- the people who think it's a great idea. And all the people -- and I think there's a lot of people at TED who do things because -- even though there's not an immediate return on the investment because it will only really pay off when everybody else has done it -- they'll do it because they're the sort of person who just does things which would be good if everybody else did them. OK, so it's called linked data. I want you to make it. I want you to demand it. And I think it's an idea worth spreading.
정보를 엮는다는 것은 그래서 생각보다 엄청난 것입니다. 지금 제가 말씀 드린 내용은 일부에 지나지 않습니다. 우리의 삶 주위엔 어디에든 정보가 있습니다. 일할 때에도, 놀 때에도 정보가 있습니다. 정보가 발생하는 출처의 양이 많고 적고가 중요한게 아닙니다. 중요한 건 정보가 연결된다는 것이지요. 정보가 유의미하게 연결되면 그건 곧 "힘"이 됩니다. 문서 단위나 페이지 단위로 링크했던 기존의 웹과는 다른 방식으로 말입니다. 조각단위 정보가 연결될 때 우리가 얻는 힘은 막대합니다. 지금이 때입니다. 널려있는 모든 조각난 정보와 데이터를 연결하고 엮어낼 때입니다. 자기 몫의 정보를 공유하는 사람들이 있습니다. TED에도 많으리라 생각합니다. 즉각적인 보상이 없더라도 자기 몫의 기여를 해내는 사람들이 있습니다. 남들도 참여하지 않으면 내게 돌아오는 보상이 많지 않음에도 불구하고 그저 훗날 자기 같은 사람이 많아졌을 때 모두에게 돌아갈 이익을 위해 묵묵히 정보를 공유하는 사람들이 있습니다. 이런 사람들이 만들어내는 것이 Linked Data입니다. 여러분들도 하세요. 정보가 없으면 요청하세요. 저는 이 아이디어가 퍼질만한 가치가 있다고 믿습니다.
Thanks.
감사합니다.
(Applause)
(박수)