We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
Chúng ta cần nỗ lực hết sức có thể vì thế hệ con em của mình. Nếu không làm như vậy, chúng ta sẽ phải trả giá cho cả một thế hệ. Chúng sẽ học từ bất kể thứ gì có xung quanh chúng.
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
Và chúng ta, những bậc cha mẹ, những thủ thư, chuyên gia ưu tú hàng tá những điều chúng ta làm, thật ra, là để phục vụ tốt nhất cho nhu cầu của chính chúng ta, nhiều nhất có thể. Tôi sẽ mở đầu và kết thúc buổi nói chuyện bằng một vài điều đã được khắc trên đá. Đầu tiên là những dòng chữ trong Thư viện Công cộng Boston. Khắc trên cửa là dòng chữ "Dành cho tất cả mọi người" Nó giống một tuyên bố truyền cảm hứng, và tôi sẽ quay lại vấn đề này sau. Tôi là một thủ thư, tôi muốn mang kiến thức đến cho thật nhiều người có nhu cầu. Và sử dụng công nghệ là một ý hay Tôi nghĩ là ta có cơ hội tạo ra một bước tiến vượt hơn người Hy Lạp. Không dễ để thực hiện điều đó. Nhưng với sự cần cù, người Ai Cập đã xây nên Thư viện Alexandria -- ý tưởng về một bản sao của mọi cuốn sách của tất cả các dân tộc trên thế giới. Vấn đề là bạn nhất thiết phải đến được Alexandria để đọc sách. Mặt khác, nếu bạn làm được thì những điều tuyệt vời sẽ xảy ra. Tôi nghĩ là ta có thể vượt người Hy Lạp. Và hôm nay tôi sẽ tập trung vào một điểm duy nhất: toàn cầu hóa kiến thức là việc nằm trong tầm tay chúng ta. Nếu thành công thì bạn nên nghĩ đến việc ta có thể đạt triển vọng tập hợp những thứ đã từng được xuất bản, từng được phân phối,
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
có thể đến được với bất cứ ai trên thế giới. Vâng, có nhiều vần đề liên quan đến việc tiền bạc nên được phân phối như thế nào và vấn đề này vẫn đang cần tính toán lại. Nhưng tôi nghĩ, có nhiều tiền, nhiều yêu cầu cấp thiết nên chúng ta có thể thật sự làm được. Nhưng tôi sẽ xem xét về mặt kĩ thuật, xã hội và ở nơi mà chúng ta là một khối thống nhất, đang cố gắng làm nên một điều gì đó thật đặc biệt. Và cách tôi thử thực hiện việc này là làm theo trang web Amazon.com, sách, nhạc, video và theo từng bước -- media theo media,
So if we start with books, you know, sort of where are we?
chúng ta sẽ thực hiện việc này như thế nào?
Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
Nếu chúng ta bắt đầu với những cuốn sách, chúng ta đang ở đâu? Đầu tiên, nếu là một kĩ sư thì bạn phải giải quyết vấn đề. Nó lớn cỡ nào? Nếu bạn muốn chuyển các tác phẩm đã ấn hành thành dạng online để ai cũng có thể tiếp cận được, thì vấn đề lớn đến cỡ nào? Chúng ta không thật sự biết, nhưng thư viện sách in lớn nhất thế giới là Thư viện Quốc hội. Ở đó có 26 triệu cuốn sách đấy. Nó là thư viện sách in lớn nhất trên thế giới. Và một cuốn sách, nếu bạn có một cuốn sách khoảng 1 megabyte bạn biết đấy, nếu bạn giữ nó trong Microsoft Word. 1 megabyte, 26 triệu megabyte là 26 terabyte thứ tự là mega-, giga-, tera-. 26terabyte. 26 terabyte nằm trong máy tính không phải là con số nhỏ, trên đĩa quay Linux, và tốn khoảng 60.000 đô. Vậy chi phí cho một ngôi nhà -- hoặc một ga-ra gần đây-- bạn có thể quay tất cả các từ trong Thư viện Quốc hội. Không phải đơn giản đâu.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
Vậy thì câu hỏi là, bạn được gì? Bạn biết đấy, có đáng làm vậy không? Bạn có muốn nó thành dạng online không? Điều đầu tiên mọi người hay làm là tạo ra những công cụ đọc sách cho phép tìm kiếm bên trong cuốn sách, và điều đó rất hay. Bạn có thể tải về và xem xét chúng theo những cách khác biệt. Và bạn có thể tiếp cận được chúng dù ở xa, nếu bạn có laptop. Sẽ có những giao diện kiểu lật trang trông như những cuốn sách thật, bạn có thể tìm kiếm, làm vài tab nhỏ nó y như một cuốn sách -- trên laptop. Nhưng tôi không biết, việc đọc trên laptop -- mỗi khi bật máy lên, như là làm việc vậy. Tôi nghĩ đó là một lý do khiến Kindle trở nên thật tuyệt. Tôi thấy thoải mái khi đọc Kindle. Nó làm mọi thứ trở nên đặc biệt hơn. Nhưng phải nói là có nhiều công nghệ cũ mà tôi cũng rất thích. Tôi thích sách giấy. Ta sẽ phát triển và sử dụng công nghệ để phát triển và số hóa nhiều thứ, đưa chúng lên mạng, tải về, in ra, đóng lại
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
và ta lại có những cuốn sách. Và việc này khó đến độ nào? Và sự thật là nó không quá khó. Chúng tôi đã bắt tay làm thư viện lưu động. Một thư viện lưu động cỡ xe tải cùng một đĩa vệ tinh, máy in, đồ đóng sách, kéo cắt trẻ có thể làm cuốn sách của riêng mình Tốn cỡ 3 đô để tải, in, đóng một cuốn sách thường. Và khi thành phẩm, chúng trông rất tuyệt. Bạn có thể có những cuốn sách trông rất tuyệt
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
với giá vài xu mỗi trang, cái giá của thành phẩm. Ý tưởng của - công nghệ này có thể đưa sách đến tay mọi người lần nữa. Có nhiều thư viện lưu động đang hoạt động. Đây là Eric Eldred, làm sách ở Walden Pond các tác phẩm của Thoreau Đây là ngay trước khi anh ấy bị đuổi đi bởi Parks Services, bởi cạnh tranh với nhà sách ở đó. Ở Ấn Độ, họ có một vài nhà sách lưu động hoạt động. Và đây là ngày mở cửa ở Thư viện Alexandria, Thư viện Alexandria mới, ở Ai Cập. Có khá đông người. Và trẻ bắt đầu sáng tạo những cuốn sách của riêng mình, và một đứa trẻ đang vui sướng với cuốn sách đầu tiên của mình. Ý tưởng sử dụng công nghệ này để cho ra loại sách giấy thông thường, nghe có phần lỗi thời, nhưng tôi nghĩ nó vẫn có giá trị. Và ở Thung lũng Silicon, giống như việc không tưởng, như thế giới, chúng tôi nghĩ, nếu ta có thể áp dụng kĩ thuật này ở Uganda, chúng ta có thể làm được điều gì đó. Chúng ta có quỹ từ Ngân hàng Thế giới để thử nghiệm. Trong 30 ngày, có thể lấy vài mẩu chuyện từ Thung lũng Silicon, mang đến Uganda, mua một chiếc xe, thiết lập kết nối internet đầu tiên tại Thư viện Quốc gia Uganda, tìm hiểu điều họ muốn, và tạo ra chương trình làm sách cho vùng nông thôn Uganda.
What we found out of this is we didn't have the right books.
Và nó -- về mặt kĩ thuật, có thể thực hiện được.
So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
Chúng tôi phát hiện ra là mình đã không có những cuốn sách đúng. Vậy sách ở thư viện. Ta có thể đưa đến người dùng bằng việc số hóa nhưng chúng ta không biết cách làm thế nào để số hóa chúng. Mọi người nghĩ câu trả lời là gửi mọi thứ đến Ấn Độ và Trung Quốc. Chúng tôi đã thử làm vậy, tôi sẽ nói qua đôi chút về nó. Có vài công nghệ tiên tiến hơn để thực hiện cũng khá thú vị. Một trong số đó là máy in theo yêu cầu, trông như một cỗ máy Rube Goldberg. Ta đã có nó rồi. Nó thật sự rất tuyệt. Nó là một băng chuyền, và nó có thể làm ra một cuốn sách. Và nó là "Espresso Book Machine."
Something else I'm quite excited about in this particular domain,
và trong vòng 10 phút, bạn có thể nhấn nút và làm ra một cuốn sách.
beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
Điều nữa khiến tôi hứng thú với lĩnh vực đặc biệt này trên cả những thứ như kiốt nơi bạn có thể mua những cuốn sách theo yêu cầu là một vài các màn hình nhỏ sẽ xuất hiện. Và một trong những cái ưa thích của tôi là chiếc laptop 100 $. Tôi không có ý định khoe khoang công lao gì ở đây, nhưng chúng tôi đã dùng một trong những thứ này để biến thành một công cụ đọc sách điện tử. Và đây là một trong những bản beta -- nó là một công cụ đọc sách điện tử trông cũng khá. Và chúng ta có một giá để để đặt sách lên đó, và có cỡ 200 chấm mỗi inch nghĩa là bạn có thể đưa những cuốn sách đã scan lên và điều này trông rất tuyệt. 200 chấm mỗi inch, cũng xấp xỉ 300 chấm của máy in laser. Chúng ta có định dạng tốt.
So the idea of electronic books is starting to come about.
Bạn có thể lấy và đọc những cuốn sách scan khá dễ dàng.
But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
Vậy nên ý tưởng về những cuốn sách điện tử đang dần thành hiện thực. Nhưng bạn thực hiện các công đoạn scan ra sao? Chúng tôi nghĩ sẽ thử những sách được gửi sang Ấn Độ. Và có một dự án, được gây quỹ bởi Tổ chức Khoa học Quốc gia -- đã gửi một loạt các máy scan, và những thư viện ở Mĩ thì gửi sách. Ồ, họ không làm vậy. Họ không muốn gửi sách. Chúng tôi đã mua 100.000 sách và gửi đến Ấn Độ. Chúng tôi đi tìm lý do bạn không muốn gửi sách đến Ấn Độ. Bài học mà chúng tôi rút ra được là hãy scan sách riêng của bạn. Nếu bạn thực sự quan tâm tới cuốn sách nào thì bạn sẽ scan nó tốt hơn, đặc biệt nếu đó là những sách có giá trị. Nếu là sách mới bạn có thể phá hỏng chúng vì bạn có thể mua một cuốn khác, đó không phải là ý tưởng hay nếu muốn scan chất lượng cao. Nhưng hãy làm điều bạn thích. Nhưng người Ấn Độ đã scan rất nhiều cuốn sách của riêng họ -- bây giờ là khoảng 300.000 -- rất tốt. Người Trung Quốc làm hơn 1 triệu, và người Ai Cập làm khoảng 30.000.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
Nhưng chúng tôi nghĩ nếu phải làm việc này thì hãy làm trong thư viện. Chúng ta làm nó như thế nào, làm sao để hạ giá thành để mọi người có thể mua được? Chúng tôi lấy giá 10 xu mỗi trang Nếu cơ bản, đó là giá của việc sao chụp, số hóa, OCR, đóng thành quyển, chuyển thành dạng có thể tải về, in ra và đóng lại -- tất cả các công đoạn -- thì chúng ta có thể làm được. Nếu chúng tôi bắt đầu làm sao để hạ giá xuống 10 xu? Chúng tôi thử những robot tự động, và chúng hoạt động khá tốt -- như những công cụ lật trang tự động. Nếu chúng ta có Mrs Rovers thì bạn có thể lật trang. Nhưng rất khó để lật trang, với số lượng lớn. Tuy nhiên -- chúng tôi đã tạo ra một máy scan sách riêng với những camara 2 số, chất lượng cao, chuyên nghiệp, kiểm soát ánh sáng bảo tàng, thậm chí nếu đó là sách đen trắng, bạn có thể đọc và lấy ngữ điệu chính xác. Vậy về cơ bản, bạn đang làm một việc tốt đẹp, đáng trân trọng. Đây không phải là một bản fax -- ý tưởng là làm một công việc tốt đẹp khi bạn đang lướt qua những thư viện này. Và chúng ta sẽ đạt giá 10 xu mỗi trang nếu làm với số lượng lớn. Đó là điều đang diễn ra tại Đại học Toronto. Và thật ra, đó là công việc để kiếm sống. Mọi người có vẻ thích nó. Vâng, có chút chán, nhưng vài người giống như bị cuốn theo nó. (Tiếng cười) Đặc biệt, nếu nó là loại sách mà bạn thích trong ngôn ngữ mà bạn có thể đọc. Chúng tôi đã cố gắng, để đạt giá thành ở mức 10xu mỗi trang. 10 xu/trang, trung bình 300 trang /sách, vậy mỗi cuốn sách sẽ là 30 đô. Thư viện Quốc hội, nếu bạn làm cả một mạng lưới -- 26 triệu cuốn sách -- là vào khoảng 750 triệu đô đúng không? Nhưng tôi nghĩ, 1 triệu cuốn sách sẽ là một khởi đầu khá tốt, và nó sẽ tốn 30 triệu đô. Đó không phải là một chi phí quá lớn.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
Và điều chúng ta có thể làm là vào trong thư viện. Chúng tôi có 8 trong số các trung tâm scan ở 3 quốc gia, nhiều thư viện đang chờ những cuốn sách của họ được scan. The Getty đang chuyển sách của họ tới UCLA nơi có những trung tâm scan, và scan sách không bản quyền. Và chúng ta phải chịu trách nhiệm cho các trung tâm. Thứ mà chúng ta đang thiếu là 10 xu. Nếu chúng ta có 10 xu, những thứ còn lại sẽ trở nên suông sẻ. Chúng tôi đã scan được khoảng 200.000 cuốn. Chúng tôi đang scan khoảng 15.000 cuốn sách một tháng, và nó đang bắt đầu tăng tốc.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
Vậy là về tổng thể, mọi thứ đều rất tốt. Và chúng tôi đang vượt ra khỏi phạm vi không bản quyền mà chuyển sang phạm vi không còn xuất bản. Tôi nghĩ về việc -- chúng ta cứ như đi từ không có bản quyền, thư viện và Amazon.com đang bước ra từ thế giới in. Và tôi nghĩ chúng ta sẽ gặp nhau ở đâu đó, và những thứ truyền thống mà bạn biết là một hệ thống xuất bản và hệ thống thư viện làm việc song song. Chúng tôi đang thực hiện chương trình làm sách không còn xuất bản, nhưng cho mượn chúng. Tôi cũng không chắc cho mượn chính xác nghĩa là gì. Cho mượn sách không còn xuất bản từ Thư viện Công Cộng Boston, Viện Hải dương học Woods Hole và một vài thư viện khác những nơi đang tham gia chương trình này, để thử xem trong mô hình này đâu là giới hạn của thư viện và đến đâu thì nhà sách có thể tiếp nối. Vậy về tổng thể, thay đổi trên diện rộng là điều khả thi. Chúng ta sẽ trở lại dạng microfilm và chuyển thành dạng online. Chúng ta có thể ra giá 10 xu mỗi trang và 15.000 sách mỗi tháng và chúng ta đã có khoảng 250.000 cuốn sách online, tính cả các dự án khác cũng đang bắt đầu. Vậy điều tôi muốn chắc chắn là, sách nằm trong tầm với của chúng ta. Ý tưởng làm được những việc lớn lao không phải là bất khả thi. Vâng, nó tiêu tốn 10 triệu, con số nhỏ của hàng triệu, nhưng về cơ bản, chúng tôi đã có một loạt các tài liệu in online. Rồi đến vấn đề thương mại về việc làm thế nào để quảng bá một cách hiệu quả và đưa nó đến tay mọi người. Nhưng việc này cũng không quá khó, cả về mặt công nghệ và pháp luật, chí ít là đối với sách đã ngừng xuất bản và không còn bản quyền,
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
chúng tôi đề nghị, để có được mạng lưới online. Bây giờ hãy nói về phần audio. Có khoảng bao nhiêu? Theo chúng tôi nhận định, có khoảng 2 đến 3 triệu đĩa đã được phát hành -- 78s, bản thu dài và đĩa CD -- hay chí ít đó là kho lưu trữ lớn nhất các tài nguyên đã từng phát hành mà chúng tôi có thể thu thập được. Tốn khoảng 10 đô để mua một đĩa và chuyển nó thành dạng online, nếu bạn làm với số lượng lớn. Nhưng chúng tôi phát hiện ra là vấn đề thật sự khá hóc búa. Đây là một lĩnh vực gây nhiều tranh cãi, chúng tôi thấy rằng có nhiều mặt mạnh trong thế giới âm nhạc không được khai thác tốt bởi hệ thống phát hành thương mại truyền thống. Và chúng tôi đã bắt đầu thay đổi nó bằng cách vận hành và cung cấp kệ hàng trên mạng. Ở Hoa Kỳ, nếu cho đi thứ gì đó sẽ không mất gì đúng không nào? Nếu bạn làm từ thiện hay quyên góp cho cộng đồng, bạn sẽ nhận sự cảm kích và cả thuế quyên góp nữa-- ngoại trừ trên mạng bạn có thể mất tất cả. Nếu đưa lên video về garage band của bạn, số lượt truy cập bắt đầu quá tải,
This doesn't make any sense.
thì bạn có thể mất cây guitar và căn nhà.
So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
Điều này không có lý chút nào. Nên chúng tôi cung cấp kho lưu trữ và băng thông không giới hạn, mãi mãi và miễn phí, cho bất cứ ai có bất cứ thứ gì để chia sẻ trong thư viện. Có rất nhiều người tham gia. Trong đó có những người theo rock'n'roll Những người này có truyền thống chia sẻ, miễn là không ai thu lợi bằng tiền. Bạn có thể -- các bản thu âm concert, không phải các bản thu thương mại, nhưng các bản thu âm concert được bắt đầu bởi Grateful Dead. Chúng tôi có khoảng 2,3 ban nhạc đăng ký mỗi ngày. Họ cho phép, và chúng tôi có cỡ 40-50 concert một ngày. Chúng tôi có khoảng 40.000 concert của Grateful Dead, trên mạng, từ đó mọi người có thể thấy và nghe nó. Phần audio có thể được giải quyết, nhưng bản quyền lại là phần khá hóc búa. Chúng tôi đã có rất nhiều bộ sưu tập --
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
vài trăm nghìn hạng mục -- và nó vẫn đang phát triển theo thời gian. Phim ảnh: nếu bạn nghĩ đến bản điện ảnh, thì không có nhiều dạng như vậy đâu. Chúng tôi có thể nói rằng, có khoảng từ 150.000 tới 200.000 bộ phim đã được phát hành trên diện rộng. Nhưng đó là không nhiều. Nhưng phân nửa trong đó là phim Ấn Độ. Tuy nhiên, nó cũng chấp nhận được, nhưng chúng ta chỉ mới tìm thấy vài thứ -- không có bản quyền. Chúng tôi đã số hóa và làm chúng khả dụng. Nhưng chúng tôi phát hiện nhiều phim khác không được thấy ngày chúng được công nhận. Chúng tôi cũng thấy rằng, rất nhiều phim chính trị, phim nghiệp dư, tất cả các thể loại đều cần một ngôi nhà, một ngôi nhà vĩnh viễn. Vậy nên chúng tôi đã làm chúng khả dụng và chúng trở nên rất phổ biến. Chúng tôi không phải YouTube. Chúng tôi hướng đến những thứ dài hạn và những thứ mọi người có thể sử dụng lại và làm lại thành phim mới,
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
đó là một điều rất tuyệt vời. Chương trình truyền hình có vẻ lớn hơn. Chúng tôi đã ghi lại 20 kênh truyền hình 24 tiếng 1 ngày. Nó giống như một cái TiVo box lớn nhất mà bạn từng thấy. Nó khoảng một petabyte, truyền hình toàn cầu -- Nga, Trung Quốc, Nhật Bản, Iraq, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 tiếng một ngày. Chúng tôi chỉ thực hiện 1 tuần, vì lý do chi phí là chính, đại loại như vụ 9/11/2001. Trong một tuần, thế giới thấy được gì? CNN đưa tin rằng người Palestine đang nhảy múa trên phố. Có thật sự vậy không? Hãy xem truyền hình Palestine và tìm hiểu. Làm thế nào để có tư duy phân tích mà không cần trích dẫn và khả năng so sánh những gì đã xảy ra trong quá khứ? Và truyền hình thì không được thu và trích dẫn, ngoại trừ bởi Jon Stewart, người đã làm một công việc khó tin. Dù sao đi nữa, truyền hình nằm trong tầm tay chúng ta. Vậy thì 15 đô mỗi tiếng video, và khoảng 100 đô mỗi tiếng phim nhựa, ta có thể sử dụng tài nguyên online với giá không hề đắt đỏ và đưa chúng lên mạng. Và bây giờ chúng tôi có rất nhiều tài nguyên. Chúng tôi có khoảng 100.000 mẫu ở đó Sách, nhạc, video, phần mềm. Chỉ có khoảng 50.000 tựa đề. Vấn đề chủ yếu là vấn đề pháp luật và xâm phạm bảo vệ sao chép. Nhưng chúng tôi đã xem xét vài vấn đề, nhưng vẫn có vài vấn đề ở Washington.
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
Chúng tôi được biết đến như World Wide Web. Chúng tôi đã có World Wide Web từ năm 1996. Chúng tôi chụp lại mỗi website và tất cả các trang trên đó, mỗi 2 tháng. Và thật sự thì nó được dẫn dắt bởi Alexa Internet, dịch vụ đã đưa bộ sưu tập này cho Internet Archive. Nó đã phát triển trong vòng 11 năm trở lại đây, và nó thực sự là một tài nguyên to lớn. Và chúng tôi đã tạo ra Wayback Machine giúp bạn có thể quay lại và xem những website cũ. Nếu bạn muốn tìm thứ gì đó -- thì đây là Google.com, một phiên bản khác của nó mà chúng tôi có, đây là nó khi còn là bản alpha, và đây là nó khi còn ở Stanford. Dù sao đi nữa, về cơ bản, bạn cũng đã có ý niệm về nơi mọi thứ bắt đầu. Đa phần, mọi người muốn thấy những bản cũ trông thế nào. Nếu như có một điều chúng tôi muốn thấy ở Thư viện Alexandria phiên bản 1, đã bị cháy, là đừng chỉ có một bản copy. Vậy nên chúng tôi đã bắt đầu -- chúng tôi đã làm một bản copy khác và chúng tôi đã tập hợp lại trong Thư viện Alexandria. Đây là hình ảnh của Internet Archive tại Thư viện Alexandria. Và chúng tôi đang có một bản copy khác đang xây dựng ở Amsterdam. Chúng ta nên đặt nó trong San Andreas Fault Line ở San Francisco, vùng lũ ở Amsterdam và vùng Trung Đông. Đúng vậy, dù sao đi nữa... chúng tôi đang chọn giải pháp an toàn. Nếu đặt nó ở một vài nơi, tôi nghĩ có thể thu được kết quả tốt.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
Có một câu hỏi chính trị xã hội có liên quan vấn đề này. Liệu những thứ mà ta đã số hóa sẽ là của chung hay mang tính cá nhân? Có vài công ty lớn đã thấy triển vọng này, họ đang thực hiện số hóa trên diện rộng, nhưng họ lại khóa miền công khai. Câu hỏi đặt ra là, đó có phải thế giới ta muốn? Vai trò của cộng đồng và cá nhân tiếp theo là gì? Làm thế nào để có thế giới nơi mà chúng ta có cả thư viện và xuất bản trong tương lai để chúng ta có thể hưởng lợi sau này? Tiếp cận kiến thức trên phạm vi toàn cầu -- Đó là một trong những thành tựu vĩ đại nhất của nhân loại như khi con người trên mặt trăng, cuốn Thánh kinh Gutenburg, Thư viện Alexandria. Nó có thể là thứ gì đó khiến ta ghi nhớ hàng nghìn năm, vì đã đạt được. Như đã nói khi nãy tôi sẽ kết thúc với điều được khắc trên cửa của Thư viện Carnegie. Carnegie - một trong những nhà tư bản vĩ đại nhất của đất nước này đã khắc trên di sản của mình "Dành cho Mọi người." Xin cảm ơn.