We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
우리는 우리 아이들의 손이 쉽게 닿는 곳에 (지식을) 제공하도록 최선을 다해야 합니다. 만약 우리가 그렇게 하지 않는다면, 그 댓가는 우리 아이들이 치루게 될 것입니다. 우리 아이들은 그들의 주위에 있는 모든 것들로부터 지식을 얻습니다.
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
그리고 지금 엘리트, 부모, 도서관 사서, 전문가 등, 등이 실제로 하고 있는 일련의 행동들은, 우리 주변에서 쉽게 얻을 수 있는 지식 또는 폭넓은 지식들을 다음 세대에 알려주기 위해 노력하는 것입니다. 저는 이 이야기를 돌에 새겨진 것들로 시작하고 마무리 할 것입니다. 하나는 보스턴 공공 도서관에 있는 것입니다. 이 도서관의 문에 새겨진 문구는 "모두에게 무료(Free to All)" 입니다. 이것은 감동적인 문구이기 때문에, 이 발표의 마지막에 다시 한번 더 되짚어보도록 하겠습니다. 저는 사서입니다. 그리고 제가 하고자 하는 일은 지식의 모든 저작물들을 그것을 읽고 싶어하는 가능한 많은 사람들에게 제공하는 것입니다. 그리고 테크놀로지를 이용한다는 아이디어는 아주 훌륭합니다. 저는 우리가 그리스보다 한 수 앞설 기회를 가지고 있다고 생각합니다. 그리스보다 한 수 앞서는 것은 쉽지 않습니다. 하지만 이집트인들은 부지런함으로 알렉산드리아 도서관을 건설할 수 있었습니다. 전 세계 모든 사람들이 가지고 있는 책들을 보관하겠다는 생각이었죠. 문제는, 여러분들이 알렉산드리아 도서관에 실제로 가야만 했다는 것입니다. 다르게 이야기한다면, 만약 여러분들이 그곳에 갔다면 엄청난 경험을 할 수 있었을 것입니다. 저는 우리가 그리스를 한 수 앞서 무언가를 성취할 수 있을 것이라 생각합니다. 그래서 저는 오늘 한가지 주제에 대해서만 이야기할 것입니다. 바로 모든 지식에 자유롭게 접근할 수 있는 방법이 우리 손 안에 있다는 것입니다. 그래서 제가 만약 성공한다면 우리는 모든 출판물들, 여러 사람들에게 배포되기 위해 나온 모든 것들을 그걸 읽어보고 싶어했던 전세계 모든 사람들이 이용할 수 있도록 하는 그런 원대한 꿈을 이루어냈다고 생각하게 될 것입니다.
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
물론, 어떻게 자본이 분배되어야 할 것인가에 대한 문제가 존재하고 이를 해결하기 위한 노력이 계속되어지고 있습니다. 하지만, 저는 충분한 자본과 수요가 있다고 생각합니다. 그렇기 때문에 실제로 이루어 낼 수 있습니다. 그래서 저는 이 특별한 목표에 도달하기 위한 기술적, 사회적인 방법을 살펴보고 현재 우리가 어느 단계에 있는지에 대해 이야기 하려고 합니다. 제가 하려는 방법은 아마존 닷컴 웹사이트와 비슷합니다. - 책, 음악, 비디오부터 미디어 종류들을 하나씩 하나씩, 해나가는 겁니다. 자, 어떻게 해야 할까요?
So if we start with books, you know, sort of where are we? Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
만약 책부터 시작한다면, 우리는 지금 어디에 있는걸까요? 가장 먼저, 엔지니어들처럼 문제의 범위를 살펴봐야겠죠. 얼마나 규모가 클까요? 만약 모든 출판물들을 온라인에 올려놓으려고 한다면, 그래서 누구나 이용할 수 있도록 하려면, 얼마나 크게 일을 벌여야 할까요? 우리는 확실히 모르지만, 세계에서 가장 큰 활자 도서관인 미국 국회도서관에는 2천 6백만권, 2천 6백만권의 책이 있습니다. 이곳은 세계에서 단연코 가장 큰 활자 도서관입니다. 그리고 한 권의 책은 대략 1메가 바이트 정도입니다. 그러므로, 만약 여러분이 국회도서관의 책들을 Microsoft Word에 가지고 있다면 모두 합쳐 2천 6백만 메가 바이트, 즉 26테라 바이트가 됩니다. 단위가 메가, 기가, 테라로 커지는데, 26테라 바이트란 말입니다. 26테라 바이트는 리눅스로 운영되어지는 이 정도 크기의 컴퓨터에 저장할 수 있고, 이것은 6만 달러의 비용이 듭니다. 집한채 가격으로, 이 지역에서는 차고 정도의 가격으로, 국회도서관에 있는 모든 단어들을 저장할 수 있는 것입니다. 굉장히 멋진 일이지요.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
그 다음에 제기될 수 있는 질문은 '그래서 우리가 무엇을 얻을 수 있는가?' 입니다. 그렇게 할 만한 가치가 있을까요? 이 자료들이 정말 온라인으로 제공되어야 할까요? 사람들이 처음으로 한 일은 북 리더를 만든 것입니다. 북 리더는 책의 내용을 찾아볼 수 있게 하고, 또 이것은 재미있습니다. 그리고 새롭고 색다른 방법으로 책을 다운로드 받고 훑어볼 수도 있습니다. 만약 노트북을 가지고 있다면, 원격으로 이용할 수 있습니다. 시작할 때는 책장을 넘기는 인터페이스와 같은 부분이 있어서 책과 무척 비슷해보이기도 하고요, 검색을 할 수 있고, 작은 탭을 만들 수도 있고, 귀엽기도 합니다. 노트북 상에서도 책과 매우 비슷한 형태로 보여집니다. 하지만 노트북에서 무언가를 읽는다는 것은, 글쎄요. 제가 노트북을 열 때는 항상 일하는 것처럼 느껴집니다. 이것이 제가 킨들을 아주 높이 평가하는 이유 중 하나입니다. 저는 킨들에서 읽을 때 일을 하고 있다고 느끼지 않습니다. 이 기술은 점점 더 구체화되어지고 있습니다만, 저는 사실 옛 기술들을 더 좋아합니다. 저는 종이에 인쇄된 책을 좋아합니다. 그래서 저는 우리의 기술을 이용해 책들을 디지털화 하여 인터넷에 올리고, 이를 다운로드 받아서 프린트하고 바인딩하여 다시 책으로 만들었으면 합니다.
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
이 작업이 얼마나 어려울 지에 대한 문제를 앞서 언급했었는데요, 이는 그리 어려운 작업이 아닌 것으로 밝혀졌습니다. 우리는 실제로 '북모바일'을 만드는 것에 착수했었습니다. '북모바일'은 소형 트럭의 크기이며, 위성 수신 안테나, 프린터, 바인더, 재단기가 있어서 아이들은 자신만이 책을 만들 수 있습니다. 다운로드 받고 프린트 하고 일반 책처럼 바인딩 하는데 3달러 정도가 듭니다. 그리고 꽤 근사한 책이 되어 나옵니다. 근사한 책을 그 책을 만드는 가격을 환산했을 때, 장당 1페니 정도의 가격으로 얻을 수 있는 것입니다.
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
이 테크놀로지는 결국 사람들의 손에 다시 책을 쥐어주는 기술인 것입니다. 현재 몇 개의 북모바일이 운영되고 있습니다. 이 사람은 월든호수에서 소로우의 작품을 책으로 만들고 있는 에릭 엘드레드씨입니다. 이 사진은 인근 서점과의 경쟁 때문에 공원 관리소에 의해 그가 쫓겨나기 직전에 찍은 것입니다. 인도에서도, 몇 개의 북모바일이 운영되고 있습니다. 이것은 이집트의 알렉산드리아 도서관이 개장하던날의 사진입니다. 알렉산드리아의 새 도서관인것이죠. 이 날 매우 많은 사람들이 참석했었습니다. 그리고 자신만의 책을 만들기 시작한 아이들과 이제껏 가져보지 못했던 첫번째 책을 들고 행복해 하는 아이가 있습니다. 테크놀로지를 이용해서 종이로 된 책을 만들겠다는 아이디어는 약간 구시대적으로 들릴 수 있지만, 그래도 저는 이것이 필요하다고 생각합니다. 실리콘벨리에서든, 유토피아에서든, 전 세계 어디에서든지 말입니다. 만약 우간다 시골 지역에서 이 테크놀로지를 이용할 수 있다면, 무언가를 이루어 낼 수 있을 것이라고 생각했었습니다. 그래서 우리는 이 작업을 실현시키기 위해 세계 은행에서 지원금을 받았습니다. 그리고 약 30일 동안 실리콘 벨리에서 몇몇 사람들을 구했습니다. 그들은 우간다로 가서, 차를 사고, 우간다 국립 도서관에 인터넷을 연결시키고, 우간다 사람들이 원하는 것을을 파악한 후에, 우간다 시골 지역에서 책들을 만드는 프로그램을 시작했습니다. 그리고 이것은 실제로, 기술적으로는 성공했습니다.
What we found out of this is we didn't have the right books. So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
하지만 우리는 적절한 책이 없다는 사실을 깨달았습니다. 책들은 도서관에 있었습니다. 디지털화 되어 있다면 사람들에게 제공할 수 있었겠지만, 그 책들을 어떻게 디지털화 해야 할지는 몰랐습니다. 모두들, 이 작업을 인도와 중국에서 하면 될 것이라고 생각했었습니다. 그래서 그렇게 해봤습니다. 이 이야기는 잠시 후에 다시 하겠습니다. 몇 가지 새로운 기술이 나왔는데요, 실제로 사용되기도 했던 그 기술은 꽤 흥미롭기까지 합니다. 하나는 Rube Goldberg Machine과 흡사하게 생긴 주문 인쇄 기계입니다. 현재 우리는 이 기계를 한 대 가지고 있습니다. 굉장히 멋지죠. 컨베이어 밸트로 되어 있고, 책을 만듭니다. 우리는 이것을 "에스프레소 북 머신"이라 부릅니다. 버튼 하나만 누르고 나면 약 10분 안에 책을 만들 수 있습니다.
Something else I'm quite excited about in this particular domain, beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
사람들이 원하는 책을 살 수 있는 작은 서점의 개념 이외에, 제가 특별히 이 분야에서 흥미를 느끼는 다른 한 가지는 책의 내용이 보여지는 이 작은 화면들입니다. 그리고 이 중에서 제가 가장 좋아하는 것은 이 100달러짜리 노트북입니다. 제가 여기서 어떠한 아이디어를 훔치려는건 아니지만, 우리는 이것을 이북리더(e-book reader)로 활용했습니다. 여기에 베타 버전인 기기가 있습니다. 이것은 실제로 매우 보기 좋은 이북 리더로 활용될 수 있습니다. 그리고 간단한 방법을 통해, 우리가 가진 책 한 권을 여기에 넣을 수 있습니다. 이것은 1인치당 200 도트로 이루어져 있습니다. 스캔된 책을 매우 보기 좋은 형태로 넣을 수 있다는 의미입니다. 1인치당 200도트는, 300도트 레이저 프린터와 거의 비슷한 것입니다. 충분히 뛰어난 결과물을 얻을 수 있는 것이죠. 여러분들은 실제로 아주 쉽게 스캔된 책들을 읽을 수 있습니다.
So the idea of electronic books is starting to come about. But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
전자책의 아이디어는 현재 실행단계에 있습니다. 하지만 어떻게 모든 책들을 스캐닝 할 수 있을까요? 그래서 우리는 인도에 책들을 보내서 스캔을 해보자고 생각했었습니다. 그 프로젝트는 국립과학재단의 지원을 받아 스캐너들을 보내고, 미국의 여러 도서관들로부터 책들을 보낼 계획이었습니다. 하지만 도서관에서는 책들을 보내려고 하지 않았습니다. 그래서 우리는 10만권의 책들을 구매해서 인도로 보냈습니다. 후에 우리는 도서관에서 책을 보내지 않으려고 한 이유를 알았습니다. 이번 일로 배운 교훈은, 자신이 소유한 책들을 스캔해야한다는 것이었습니다. 만약 여러분들이 정말 책에 관심이 많다면, 스캔을 더 잘하려고 할 것입니다. 소중한 책이라면 특히 더 그렇겠죠. 만약 그 책이 새 책이라면, 스캔하려고 그 책을 찢을 수도 있습니다. 왜냐하면 다른 책을 사면 되기 때문이죠. 이것은 질 높은 스캔을 하기 위해서는 감수해야하는 일입니다. 하지만 어느 방법이든 자신에게 편한 방법으로 스캔하면 될겁니다. 인도인들은 현재까지 개개인이 소장한 약 30만권의 책을 스캔했고 이 작업은 매우 잘 진행되고 있습니다. 중국인들은 100만권이 넘고, 이집트인들은 약 3만권 정도 했습니다.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
하지만 우리는, 이 일을 해야 한다면 도서관에서 하는 것이 좋을거라고 생각했습니다. 어떻게 이것을 진행하고, 어떻게 현실화해서 우리가 감당할 수 있는 비용에 맞출 수 있을까요? 우리는 장당 10센트로 가격을 잡았습니다. 만약 디지털화 하기 위한 복사, OCR (광학식문자판독기), 포장을 위한 기본 가격으로 다운로드, 프린트, 바인딩을 하는 전체 작업을 할 수가 있다면 우리는 무언가를 만들어낼 수 있을 것입니다. 그래서 우리는 장당 10센트에 맞출 수 있는 방법을 연구하기 시작했습니다. 우리는 자동으로 페이지를 넘기는 일을 하는 이러한 로봇을 이용해보았고, 그것들은 매우 잘 작동되었습니다. 만약 우리가 화성 탐사 로봇을 이용했다면, 여러분들은 스스로가 책장을 넘기는 편이 더 낫다고 생각했겠죠. 실제로 페이지를 넘기는 일은 매우 여러운 일로 드러났고, 분량도 충분하지 않았습니다. 어쨌든, 그래서 우리는 우리 스스로가 책스캐너를 만들기로 했습니다. 두 개의 고성능의 디지털 카메라와 흑백으로 된 책이라도 적절한 음영을 얻을 수 있도록 박물관용 전등을 이용했습니다. 그래서, 아주 훌륭하고 만족스러운 결과를 얻을 수 있습니다. 이것은 팩스가 아닙니다. 이것은 여러분들이 여러 도서관들을 살펴볼 수 있게 하는 훌륭한 일을 하자는 것입니다. 그리고 만약 대량으로 작업한다면, 장당 10센트만 들게끔 할 수도 있습니다. 이것은 토론토 대학교에서의 모습입니다. 그리고 이 일은 생계가 가능한 정도의 임금을 주는 일입니다. 사람들이 일을 즐기는 것처럼 보이죠. 네, 약간은 지루한 일입니다. 하지만 몇몇 사람들은 푹 빠져버리기도 합니다. (웃음) 특히 그것이 여러분이 흥미를 가지는 분야의 책이고, 여러분이 읽을 수 있는 언어로 쓰여진 책이라면, 장당 10센트를 받고서 상당히 좋은 성과를 내고 있었던 셈입니다. 10센트에 한 장이라면, 책들이 평균적으로 300장이라 했을 때, 한 권당 30달러입니다. 만약 국회 도서관에 있는 모든 책들에 대해 작업을 한다면, 2,600만권이니까, 약 7억 5천만 달러가 됩니다. 맞죠? 하지만 100만권의 책은 -- 개인적으로 꽤 괜찮은 출발이라고 생각하는데요 그것은 3,000만불의 비용이 듭니다. 큰 비용은 아니지요.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
우리는 지금까지 도서관에서 작업을 해올 수 있었습니다. 우리는 현재 3개국에 걸쳐 8개의 스캐닝 센터를 만들었고, 도서관들의 책들을 스캐닝하고 있습니다. 게티 미술관에서는 소장하고 있는 책들을 스캐닝 센터가 있는 UCLA로 옮겨서 저작권이 만료된 책들을 스캐닝하고 있습니다. 멋진 일이지요. 우리는 제도적 책임을 따르려고 하고 있습니다. 우리가 놓친 것은 10센트뿐입니다. 만약 10센트를 얻을 수 있다면, 나머지 모든 것은 자연스럽게 이루어질 것입니다. 우리는 지금까지 약 20만권의 책들을 스캔했습니다. 현재 우리는 매달 만 오천권의 책들을 스캐닝하고 있고, 여기에서 파생된 다른 2가지 일들 또한 준비하고 있습니다.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
전반적으로 모두 잘 진행되고 있습니다. 그리고 우리는 저작권이 만료된 책들이 절판된 시장으로 다시 나올 수 있도록 하고 있습니다. 저는 생각했습니다. 우리는 절판된 도서관 책들을 가지고 있고, 아마존닷컴은 출판 시장을 기반으로 하고 있습니다. 저는 제가 하는 일이 그 중간지점이 있다고 생각합니다. 기존에 그랬듯이, 출판 시스템과 도서관 시스템이 평행한 관계를 갖고 있는 것처럼 말입니다. 우리는 절판된 책들에 한해, 책을 빌려주는 프로그램을 시작했습니다. 빌린다는 것의 정확한 뜻이 저도 조금 헷갈리긴 하지만 어쨌듯 보스턴 공립 도서관에서 절판된 책들을 빌려주고 있습니다. 우즈 홀 해양과햑연구소와 기타 여러 도서관들이 이 프로그램에 참여하기 시작했고, 어디까지가 도서관이 해야할 일이고, 어디까지가 서점이 해야할 일인지 구분하려고 노력하고 있습니다. 이 일은 좀더 큰 규모로 하는 것이 가능합니다. 우리는 또한 마이크로필름을 만들어 온라인에 올리고 있습니다. 즉, 우리는 장당 10센트로, 한달에 만오천권의 책을 스캐닝하고 있고, 모두 합쳐 약 25만권의 책들을 온라인에 올려놓았으며 추가적인 다른 프로젝트들을 시작하는 단계에 이르렀습니다. 제가 말하고자 하는 것은, 책들이 우리 손 안에 있다는 것입니다. 이 모든 것들을 가지려는 생각은 그리 큰 일이 아닙니다. 네, 이것은 수 천만 달러가 들지만, 수 억은 아닙니다. 그리고 한 번의 노력으로 우리는 출판된 문학들을 온라인상에서 볼 수 있습니다. 여기서 비즈니스 모델에 대한 문제가 나오는데요, 어떻게 효율적으로 시장을 형성하고 사람들에게 제공할 수 있느냐의 대한 문제입니다. 우리의 기술적인 측면과 법률적인 테두리 안에서 절판되고 저작권이 만료된 책들에 한해서, 그것들을 모두 온라인에서 볼 수 있었으면 합니다.
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
그럼 이제 오디오에 대해 이야기 해봅시다. 얼마나 많은 오디오가 있을까요? 음, 우리가 아는 바로는, 약 2~3백만개의 발매된 디스크가 존재합니다. 70, 80년대에 나온 LP 음반도 있고, CD도 있습니다. 어쩌면 이건 우리가 찾아볼 수 있는 가장 큰 기록 자료일지도 모릅니다. 디스크 하나를 온라인에 올리는데에서는 약 10달러가 듭니다. 대량으로 할 경우에 말이죠. 하지만 저작권 문제가 꽤 골치아프다는 것을 알았습니다. 꽤 법률 소송이 많이 걸려있는 분야라서, 우리는 음악계에서 기존의 상업적인 시스템의 손이 닿지 않는 틈새를 찾았습니다. 그리고 이 자료들을 온라인에 배포해서 이용이 가능하도록 만들기 시작했습니다. 미국에서는 무언가를 기부할 때 돈이 들지 않습니다. 그렇죠? 만약 여러분이 자선단체나 공공단체에게 무언가를 주면, 잘했다는 칭찬을 듣거나 세금 감면을 받게 되지요. 하지만 온라인에서는 파산할 수가 있습니다. 창고에서 밴드 연습한 것을 비디오로 찍어 올렸는데, 너무 많은 사람들이 접속하면, 기타나 집을 잃어버릴 수 있습니다.
This doesn't make any sense. So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
말도 안 되는 이야기죠. 그래서 우리는 도서관에 있는 것들을 공유하고 싶은 모든 사람에게 평생 무료로 무제한의 저장공간과 대역폭을 제공했고 많은 사용자들을 받고 있습니다. 그 중 하나가 록큰롤러입니다. 그들은 공유하는 전통을 가지고 있습니다. 아무도 그것으로 돈을 벌지 않는다면 말이죠. 가령 상업적 음반 레코딩이 아닌 콘서트 실황, Greateful Dead로 부터 시작된 공연 실황 같은 거죠. 하루에 약 두 세 개의 밴드들이 새롭게 가입하고 그들로부터 허가되는 공연이 하루에 약 40-50개에 이릅니다. 우리는 Grateful Dead 의 모든 것을 비롯하여 약 4만개의 공연을 보유하고 있으며 사람들은 인터넷에서 이 자료들을 보고 들을 수 있습니다. 이렇게 오디오를 올리는 것은 가능하지만, 저작권 문제는 여전히 매우 곤란한 문제입니다. 우리는 현재 많은 앨범들을 가지고 있습니다. 수 십만개의 아이템을 가지고 있고, 그것은 계속 늘어나고 있습니다.
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
이번엔 영상입니다. 만약 영화관에서 상영되는 영화들을 생각한다면 그리 많지는 않습니다. 우리가 아는 바로는, 큰 규모의 극장 배급용으로 제작된 영화가 약 15만에서 20만개 가량 있습니다. 많은 숫자는 아니죠. 그 중 절반이 인도에서 만들어진 것입니다. 뭐 어쨌든, 할 만한 일이죠. 우리는 그 중에서 저작권이 만료 될 약 1000개를 찾아내어 디지털화하여 온라인에서 사용 가능하게 만들었습니다. 그러나 기록영화 같은, 아직도 빛을 보지 못한 수 많은 새로운 형태의 영화들과 또한 많은 정치 영화, 아마추어 영화 등 영원한 저장소가 필요한 다양한 종류의 영화들도 찾았습니다. 우리는 이것들을 이용할 수 있게 만들기 시작했고 매우 인기를 얻고 있습니다. 우리는 유트브 같은 것이 아니라 보다 장기적으로 사람들이 재사용하거나, 새로운 영화로 만들 수 있는 것들에 집중했고 이것은 매우 재미있는 일이었습니다.
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
TV는 그 규모가 매우 큽니다. 우리는 20개 채널을 24시간 녹화하는 것으로 시작했습니다. 엄청나게 큰 TiVo (디지털 비디오 리코더; 상표명) 같은 거죠. 지금까지 약 1 페타바이트 정도로. 전세계 TV - 러시아, 중국, 일본, 이라크, 알자지라, BBC, CNN, ABC, CBS, NBC.. 등을 24시간 녹화합니다. 그리고 대부분 비용 문제 등으로 이것들을 딱 일주일 치만 올립니다. 911 테러 이후 일주일 동안 세상 사람들이 무엇을 봤을까요? CNN은 팔레스테인 사람들이 거리에서 춤을 추고 있다고 했습니다. 사실일까요? 팔레스테인 TV를 보고 확인해봅시다. 과거에 일어난 일들을 인용하거나 그 일들과 비교할 수 없다면 어떻게 비판적인 사고를 할 수 있을까요? TV는 녹화되거나, 인용되어지기가 아주아주 힘이 듭니다. 아, 멋진 일을 하는 Jon Stewart(미국 영화배우, 코미디언)를 빼고는요. 어쨌든 그래서, TV가 우리 손 안에 있다고 말할 수 있겠습니다. 우리는 비디오는 시간당 15불, 셀룰로이드 필름은 시간당 약 100-150달러 가량의 아주 저렴한 비용으로 정보를 수집할 수 있었고 온라인 상에서도 이용가능하게 되었습니다. 그리고 현재, 우리는 이러한 자료를 아주 많이 가지게 되었습니다. 대략 10만개 정도 올라가 있습니다. 책, 음악, 영상, 소프트웨어를 합쳐 5만개 가량만 사용가능합니다. 대부분 법적인 문제와 복제 방지를 제거하는 문제들 때문이지요. 어느 정도 검토를 마치기는 했지만 아직 처리할 문제가 워싱턴에 있습니다.
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
자, 우리는 월드 와이드 웹으로도 꽤 유명합니다. 우리는 1996년부터 웹을 저장해오고 있습니다. 우리는 매 두달 마다 모든 웹싸이트의 모든 페이지를 그 상태로 저장합니다. 이것은 사실 알렉사 인터넷(Alexa Internet:회사명)이 그들의 자료를 인터넷 저장소에 기증하면서 시작되었습니다. 그리고 그것은 지난 11년 동안 성장해 왔고 매우 훌륭한 자료입니다. 우리는 또한 오래된 웹싸이트의 그 당시 모습을 볼 수 있는 "웨이 백 머신(Way back Machine)"을 만들었습니다. 가서 검색하실 수 있는데요, 이것은 구글닷컴으로서 우리가 가진 여러 가지 버전들을 보여주고 있습니다. 알파 버전일 때는 이렇게 보였고, 그리고 이것은 구글이 스탠포드에 있을 때의 모습입니다. 자 어쨌든 기본적으로 여러분은 무엇이 어디로부터 오는지 아셨습니다. 대부분의 사람들은 이것으로부터 그들의 예전 것들을 보고싶어 합니다. 아마도 화재로 잘 알려진 고대 알렉산드리아로부터 배워야 할 점이 한가지 있다면 원본만 보관하지 말라는 것입니다. 그래서 우리는 이 모든 것들의 사본을 만들기 시작했고 알렉산드리아 도서관에 되돌려 놓았습니다. 이 사진은 알렉산드리아 도서관에 있는 인터넷 저장소의 모습입니다. 그리고 또 다른 사본은 암스테르담 보관소에 있습니다. 우리는 이것을 샌프란시스코의 산 앤드레아스 단층, 암스테르담의 홍수권, 그리고 중동에도 보관해야 합니다. 어쨌든 우리는 여러가지 보호장치를 마련하고 있습니다. 저는 우리가 이것들을 몇 군데 더 보관한다면 안전할 것이라고 생각합니다.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
이것에 대한 정치적이고 사회적인 질문이 있습니다. 우리가 디지털화 시키는 이 모든 것들은 공용화 될까요? 사유화 될까요? 이러한 비전을 보고 몇 개의 큰 회사들이 대규모의 디지털화를 진행중이지만 공용 도메인을 점유하고 있습니다. 질문은, 이것이 우리가 진정으로 살고 싶은 세상인가요? 이러한 일들에, 일반기업과 비교해서 공공기관이 할 수 있는 역할은 무엇일까요? 어떻게 하면 미래에도 도서관과 출판업계가 공존하는 세상을 만들 수 있을까요? 우리가 자라면서 기본적으로 누려왔던 것처럼 말입니다. 모든 지식에 대한 자유로운 접근. 저는 이것을 인류의 가장 위대한 성과 중 하나라고 생각합니다. 달에 착륙한 인류나 구텐베르크 성서, 또는 알렉산드리아 도서관처럼 이것은 수 천년 동안 기억되어 지는 업적이 될 수 있습니다. 처음에 말씀드렸던 것 처럼, 카네기 도서관 문에 새겨진 말로 이야기를 마치겠습니다. 이 나라의 위대한 자본가 중 한 사람인 카네기는 그의 유산 위에 이렇게 새겼습니다. "모든 이에게 무료" 대단히 감사합니다.