We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
Koniecznie musimy dać naszym dzieciom dostęp do najlepszego, co mamy. Jeśli tego nie zrobimy, przyszłe pokolenie będzie takim, na jakie sobie zasłużyliśmy. Przyszłe pokolenie będzie uczyło się z tego, co znajdzie wokół siebie.
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
I my, jako obecna elita intelektualna, rodzice, bibliotekarze, profesjonaliści, cokolwiek robimy, to znaczna część naszych działań skupia się na próbie umożliwienia dostępu do tego, co najlepsze wszystkim dookoła nas lub tak szeroko, jak tylko się da. Chcę rozpocząć i zakończyć ten wykład kilkoma słowami, które wyryte są w kamieniu. Zacznę tym, co wyryte zostało na Bostońskiej Bibliotece Publicznej. Wyryte nad drzwiami są słowa: "Dostępne dla wszystkich" Jest to inspirujące twierdzenie i powrócę jeszcze do niego na końcu. Jestem bibliotekarzem, więc staram się udostępnić wiedzę ze wszystkich utworów każdemu, kto tylko zechce je czytać. Używanie technologii to dla nas idealny pomysł. Myślę, że mamy okazję prześcignąć Greków. Nie jest łatwo ich prześcignąć. Dzięki pracowitości Egipcjan, zdołali oni wybudować Bibliotekę Aleksandryjską -- z jej ideą skopiowania każdej istniejącej książki całej ówczesnej ludzkości. Problemem było jednak to, że trzeba było udać się do Aleksandrii, aby z niej skorzystać. Z drugiej strony, jeśli ktoś już tam dotarł, to działy się cuda. Myślę, że możemy prześcignąć Greków i osiągnąć coś znaczącego. Spróbuję więc przedstawić dzisiaj tylko jedno twierdzenie: możemy zapewnić powszechny dostęp do całej wiedzy ludzkości. Jeśli mi się uda was przekonać, to wyjdziecie stąd przekonani, że: "tak, jesteśmy w stanie zrealizować tę wielką wizję, że wszystko, co było kiedykolwiek opublikowane, wszystko, co kiedykolwiek miało być rozpowszechniane, będzie dostępne dla każdego, kto tylko zechce mieć do tego dostęp".
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
Tak, pojawia się kwestia sposobu podziału pieniędzy, nad tym jeszcze pracujemy. Ale uważam, że jest mnóstwo pieniędzy i ogromny popyt, więc faktycznie możemy to osiągnąć. Skupię się jednak na kwestiach technologicznych i społecznych oraz powiem, jak nam idzie realizacja tej właśnie wizji. Sposób w jaki to zrobię, jest zainspirowany budową strony Amazon.com -- książki, muzyka, wideo - po kolei od jednego środka przekazu do drugiego, po prostu powiem, jak nam z tym idzie.
So if we start with books, you know, sort of where are we? Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
Zacznijmy od książek. Więc gdzie mniej więcej jesteśmy? Najpierw trzeba po inżyniersku zbadać zakres tematu. Ile jest do zrobienia? Jeżeli chcielibyście umieścić wszystkie opublikowane prace w sieci w taki sposób, aby każdy miał do nich dostęp, jak wielki byłby z tym problem? W zasadzie tego nie wiemy. Największa biblioteka druków na świecie, to Biblioteka Kongresu Stanow Zjednoczonych - 26 milionów tomów. Jak do tej pory jest to największa biblioteka druków na świecie. Zaś książka ma rozmiar około jednego megabajta, jeśli zapisać ją w edytorze tekstu Microsoft Word. Przyjmując megabajt, 26 milionów megabajtów to 26 terabajtów, kolejne rzędy wielkości: mega, giga, tera, 26 terabajtów. 26 terabajtów mieści się w komputerze, mniej więcej takich rozmiarów, na linuksowych twardzych dyskach, który kosztuje około 60 000 dolarów. Płącąc tyle co za dom albo tyle co garaż w tej okolicy, można mieć system zawierający całą Bibliotekę Kongresu. Całkiem nieźle.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
Pojawia się pytanie: co z tego za pożytek? Czy warto probówać to osiągnąć? Czy właściwie chcemy to mieć w sieci? Pierwszą rzeczą, którą się z tym robi są czytniki książek, które pozwalają na przeszukiwanie ich treści książek i to jest całkiem fajne. Można takie czytniki pobrać z internetu i używać je na różne sposoby. I można mieć do tego wszystkiego zdalny dostęp, jeśli używa się laptopa. Zaczynają pojawiać się interfejsy imitujące przewracanie stron, które nieco przypominają papierowe książki, da się wyszukiwać, tworzyć zakładki - to jest całkiem sprytne i ciągle bardzo przypomina książkę, chociaż jest na laptopie. No ale nie wiem, czytanie na laptopie, jak siedzę przy laptopie, to czuję się jak w pracy. I właśnie dlatego czytnik Amazon Kindle jest taki świetny. Nie czuję się, jakbym był w pracy, gdy czytam na Kinde. Pojawia się więc specjalizacja. Muszę jednak przyznać, że istnieją również starsze technologie, które lubię. Lubię papierowe książki. Sądzę, że możemy używać naszej technologii by dygitalizować zbiory, umieszczać je w sieci, a później pobierać, drukować i oprawiać - znów uzyskując papierowe książki.
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
Pomyśleliśmy sobie - czy to będzie trudne? I okazuje się, że nie jest to zbyt trudne. A nawet stworzyliśmy książkowóz. Jest to furgonetka z anteną satelitarną, drukarką, i sprzętem do oprawiania, gdzie dzieci robią własne książki. Koszt pobrania, druku i oprawy starej dobrej książki wynosi około 3 dolarów. Wyglądają one całkiem dobrze. Naprawdę można zrobić świetnie wyglądające książki za około trzy grosze za stronę, czyli po kosztach materiałów.
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
Więc taka technologia może faktycznie sprawić, że ludzie dostaną więcej papierowych książek. Również inne książkowozy są obecnie w użyciu. To Eryk Eldred, który drukuje nad Walden Pond prace Thoreau. Chwilę po tym leśnicy wyrzucili go z parku narodowego za konkurowanie z miejscową księgarnią. W Indiach też mają parę książkowozów. A to jest dzień otwarcia Biblioteki Aleksandryjskiej, Nowej Biblioteki Aleksandryjskiej w Egipcie. Uczestniczyło w nim dość dużo ludzi. A to dzieciaki zaczynające robić swoje własne książki i szczęśliwy chłopiec ze swoją pierwszą w życiu książką. A więc pomysł użycia tej technologii do tworzenia papierowych książek jest, moim zdaniem, trochę retro, ale uważam, że nadal się sprawdza. Pomysł pochodzi z Doliny Krzemowej, która jest takim nieco utopijnym miejscem, więc stwierdziliśmy, że dopiero jeśli uda nam się to wdrożyć na wsi w Ugandzie, to znaczy, że to jest przydatne. Udało nam się otrzymać dotacje z Banku Światowego na takie testy. I okazało się, że w ciągu 30 dni da się wziąć kilka osób z Doliny Krzemowej, wysłać je do Ugandy, kupić samochód, założyć pierwsze połączenie internetowe w Bibliotece Narodowej Ugandy, zrozumieć jakie są lokalne potrzeby i uruchomić program wytwarzania książek na ugandyjskiej wsi. I to naprawdę technologicznie działa.
What we found out of this is we didn't have the right books. So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
Okazało się natomiast, że nie mamy odpowiednich książek. Książki były w bibliotece. Mogliśmy je udostępnić, gdyby były w formie cyfrowej, ale nie wiedzieliśmy, jak je przetworzyć do tej formy. Myśleliśmy, że rozwiązaniem jest wysłanie książek do Indii i Chin. Wypróbowaliśmy to i za chwilę o tym opowiem. Są również nowsze technologie dostarczania, już wdrożone, które są bardzo interesujące, jak na przykład maszyna drukująca na żądanie, przypominająca Maszynę Rube Goldberga. Mamy jedną z nich, jest naprawdę świetna. To pas transmisyjny, który wytwarza książki. Nazywa się to "Ekspres do książek" i w ciągu około 10 minut od naciśnięcia guzika wytwarza on książkę.
Something else I'm quite excited about in this particular domain, beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
Innym pomysłem, z którym wiążę nadzieje w tej właśnie dziedzinie, wychodzącym poza automaty, w których można dostać książki na żądanie, jest pojawienie się tych nowych małych ekranów. Jednym z moich ulubionych jest laptop w cenie 100 dolarów. Nie mam tutaj zamiaru kraść niczyich pomysłów, ale my zaczęliśmy je wykorzystywać jako czytniki e-booków. Więc to jest jeden z nich, który jak się okazuje, całkiem nieźle się sprawdza jako czytnik e-booków. Wrzuciliśmy na niego jedną z naszych książek i okazało się, że rozdzielczość 200 pikseli na cal sprawia, że zeskanowane książki wyglądają na nim naprawdę dobrze. 200 pikseli na cal z grubsza odpowiada laserowej drukarkce o rozdzielczości 300 dpi. Wygląda to dość dobrze. Faktycznie da się na tym czytać skanowane książki.
So the idea of electronic books is starting to come about. But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
Idea książek elektronicznych zaczyzna więc nabierać kształtów. Ale jak zorganizować skanowanie? Spróbowaliśmy więc przetestować system z wysłaniem książek do Indii. To był projekt ufundowany przez Narodową Fundację Nauki: wysłali trochę skanerów, a amerykańskie biblioteki miały wysłać książki. Ale tego nie zrobiły - biblioteki nie chciały wysyłać swoich książek. Kupiliśmy więc 100 000 książek i wysłaliśmy je do Indii. I wtedy zrozumieliśmy, dlaczego nie wysyła się książek do Indii. Morał, który z tego płynie: sam skanuj swoje książki. Jeśli naprawdę ci na nich zależy, zrobisz to o wiele lepiej, zwłaszcza jeśli są to cenne książki. Jeśli to są nowe książki to można je po prostu zmasakrować, bo zawsze łatwo można kupić nową kopię, więc to nie jest problem przy robieniu wysokiej jakości skanów. Ale trzeba robić rzeczy z sercem. W Indiach zeskanowano wiele z ich własnych książek - do tej pory około 300 000 - świetnie sobie radzą. Chińczyczy zeskanowali ponad milion, Egipcjanie około 30 000.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
Pomyśleliśmy - w porządku, jeśli musimy to robić, skanujmy w bibliotece. Jak to zrobić, a przy tym jak ograniczyć koszty, aby nas było na to stać? Ustaliliśmy granicę kosztów na 10 centów za stronę. Gdybyśmy za tę kwotę dali radę skserować, zeskanować, rozpoznać litery, zrobić e-booka, udostępnić go w sieci, do drukowania i oprawiania - czyli zrobić wszystko, to moglibyśmy ogłosić sukces. Więc zaczęliśmy kombinować - jak się zmieścić w 10 centach? Przetestowaliśmy roboty, działały całkiem nieźle - takie automaty do przewracania stron. Mamy roboty na Marsie, więc czemu nie robota do przewracania stron. Okazało się jednak, że trudno jest przewracać strony i nie da się tego szybko robić. Więc stanęło na tym, że zrobiliśmy nasz własny skaner do książek. Z dwoma wysokiej klasy profesjonalnymi aparatami cyfrowymi i przy kontrolowanym oświetleniu muzealnym, nawet czarno białe książki można zeskanować w odpowiednim odcieniu. Jest to więc piękna i porządna robota. To nie jest jak faksowanie, trzeba uzyskiwać piękny rezultat przy każdym kolejnym dziele z wszystkich tych bibliotek. Mieścimy się w 10 centach za stronę, jeśli skanujemy w dużych ilościach. Tak to wygląda na Uniwersytecie w Toronto. Okazuje się, że można za taką pracę porządnie płacić, a ludzie to kochają. Tak, jest to nieco nużące, ale niektórzy znajdują w tym swój Zen. (Śmiech) Szczególnie jeśli są to ciekawe książki, na których komuś zależy, w językach, które rozumie. Naprawdę zrobiliśmy kawał dobrej roboty, mieszcząc się w limicie 10 centów. Więc: 10 centów za stronę, przeciętna książka ma 300 stron, czyli 30 dolarów za książkę. Biblioteka Kongresu, jeśli przerobić ją w całości, to 26 milionów książek, czyli wyjdzie około 750 milionów dolarów, prawda? Ale milion książek, a myślę że byłby to całkiem niezły początek, kosztowałby 30 milionów dolarów. To nie jest aż tak dużo.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
A nam udaje się współpraca z bibliotekami. Obecne mamy 8 ośrodków skanowania w 3 krajach, a biblioteki chcą skanować swoje zbiory. Ośrodek Getty'ego przenosi książki do uniwersytetu UCLA, gdzie mamy jedno z naszych centrów skanowania i skanuje swoje książki wolne od praw autorskich, co jest wspaniałe. Zaczynamy więc być poważaną instytucją, a jedyne czego nam brakuje, to tych 10 centów. Jeśli zdołamy je pozyskać, cała reszta idzie gładko. Zeskanowaliśmy około 200 000 książek. Teraz skanujemy około 15 000 książek miesięcznie i szykuje się podwojenie tych wyników.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
W sumie wszystko idzie bardzo dobrze. Zaczynamy wykraczać poza książki wolne od praw autorskich i brać się za książki o wyczerpanym nakładzie. My idziemy od strony bibliotecznych książek wolnych od praw autorskich, a Amazon.com - od strony książek w druku i myślę, że spotkamy się gdzieś w pół drogi i osiągniemy klasyczny balans, czyli działające równolegle: system wydawniczy i system bibliotek. Zaczynamy więc skanowanie prac o wyczerpanym nakładzie, ale wypożyczamy je. Nie wiem dokładnie, na czym to "wypożyczanie" polega. Wypożyczamy prace o wyczerpanym nakładzie z Bostońskiej Biblioteki Publicznej, z Instytutu Oceanograficznego w Woods Hole i z kilku innych bibliotek, które zaczynają brać udział w tym programie, aby wypróbować ten model i zbadać gdzie kończy się biblioteka a zaczyna księgarnia. A więc, podsumowując, da się to robić na większą skalę. Rozważamy również skanowanie mikrofilmów i umieszczanie w sieci. Przy cenie 10 centów za stronę, robimy 15 000 książek miesięcznie i mamy już około 250 000 książek w sieci, wliczając też wszystkie inne projekty. Chciałem zatem dowieść, że książki są w naszym zasięgu. Zeskanowanie ich wszystkich, to nie jest aż taki problem. Tak, kosztuje to dziesiątki milionów, może setki milionów, ale za jednym zamachem mamy całą hstorię drukowanej literatury w sieci. Pojawia się zagadnienie modelu biznesowego, dotyczące tego jak efektywnie wprowadzać to na rynek i dostarczać ludziom. Da się jednak zrealizować, zarówno pod względem technologicznym jak i prawnym, publikację w sieci zupełnie wszystkich książek wolnych od praw autorskich i o wyczerpanym nakładzie.
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
A teraz spójrzmy na nagrania audio, wyjaśnię teraz tę kwestię. Ile tego jest? Według naszej wiedzy, opublikowano dwa lub trzy miliony płyt: płyt o 78 obrotach na min, długogrających i kompaktowych, a przynajmniej tyle mają największe archiwa takich publikacji, jakie udało nam się znaleźć. Za około 10 dolarów za sztukę, można wziąć płytę i umieścić ją w sieci, jeśli robi się to hurtowo. Zauważyliśmy jednak, że zagadnienia prawne są dość drażliwe. Jest to obszar częstych procesów sądowych, znaleźliśmy więc nisze w świecie muzyki, którym klasyczny komercyjny system wydawniczy nie służy najlepiej. I zaczęliśmy udostępniać takie materiały poprzez oferowanie miejsca na wirtualnych półkach. Rozdawanie nic nie kosztuje w Stanach Zjednoczonych. Prawda? Jeśli oddasz coś na cele charytatywne lub dla dobra publicznego, to cię pochwalą i dadzą ulgę podatkową, ale gdy dasz w sieci - koszty cię zrujnują. Jeśli wstawisz w sieci nagranie swojego zespołu i jest ono często oglądane, możesz stracić swoje gitary albo i dom.
This doesn't make any sense. So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
To nie ma sensu. Oferujemy więc nieograniczone miejsce na dysku i nieograniczony transfer, za darmo, na zawsze każdemu, kto udostępni utwory, które nadają się do biblioteki. Zgłosiło się wielu chętnych. Jedni z nich to rokendrolowcy. Rokendrolowcy mają tradycję dzielenia się, o ile nikt na tym nie zarabia. Na przykład nagraniami z koncertów, które nie są komercyjne, co zapoczątkowała grupa Grateful Dead. Codziennie dwa lub trzy zespoły zgłaszają się do nas. Udostępniają nam swoje materiały, codziennie dostajemy około 40 - 50 koncertów. Około 40 000 koncertów, w tym wszystko co Grateful Dead kiedykolwiek zagrali, udostępniamy w sieci, gdzie ludzie mogą oglądać i słuchać tych materiałów. A więc da sie umieszczać nagrania w sieci, ale kwestie prawne są dość drażliwe. Mamy obecnie wiele zbiorów, kilkaset tysięcy eksponatów - i ta kolekcja cały czas rośnie.
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
Filmy - jeśli chodzi o produkcje kinowe, to nie ma ich aż tak wiele. Zgodnie z naszą wiedzą, istnieje od 150 000 do 200 000 filmów, które przeznaczone były do dystrybucji kinowej na wielką skalę. To nie jest aż tak wiele. Połowa z nich to filmy indyjskie. W każdym razie da się to zrobić, ale znaleźliśmy tylko około tysiąca filmów wolnych od praw autorskich. Zapisaliśmy je więc w wersji cyfrowej i udostępniliśmy je. Jest jednak wiele innych rodzajów filmów, które w zasadzie nie ujrzały jeszcze światła dziennego - filmy archiwalne. Znaleźliśmy również wiele filmów politycznych, wiele amatorskich, rozmaite rzeczy, które potrzebują domu na stałe. Zaczęliśmy ten dom oferować i stało się to bardzo popularne. Nie jesteśmy czymś w rodzaju You Tube, zajmujemy się filammi mniej ulotnymi oraz takimi, które mogą być powtórnie użyte i przerobione na nowe filmy, co jest świetną zabawą.
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
Telewizja to znacznie większe wyzwanie. Zaczęliśmy nagrywanie 20 kanałów telewizyjnych, 24 godziny na dobę. To największa nagrywarka, jaką w życiu widzieliście. Na razie mamy około petabajta nagrań światowej telewizji: rosyjskiej, chińskiej, japońskiej, irakijskiej, Al Jazeera, BBC, CNN, ABC, CBS, NBC - 24 godziny na dobę. Publikujemy nagrania tylko z jednego tygodnia, głównie ze względu na koszty, chodzi o tydzień ataku na WTC. Od 11.09.2001 przez jeden tydzień: co świat wtedy widział? CNN podawało, że Palestyńczycz tańczyli na ulicach. Naprawdę? Popatrzmy na telewizję palestyńską i się dowiemy. Jak możemy myśleć krytycznie, jeśli nie jesteśmy w stanie przywołać lub porównywać przeszłych wydarzeń? A telewizja jest przerażająco słabo rejestrowana i trudna do cytowania, z wyjątkiem Jona Stewarta, który robi kawał dobrej roboty. W każdym razie sądzę, że telewizja jest w naszym zasięgu. 15 dolarów za godzinę z wideo oraz 100 do 150 dolarów za godzinę z taśmy filmowej. Możemy tanio umieścić te materiały z sieci i tanio je tam utrzymać. Teraz mamy mnóstwo tych materiałów, udostępniamy około 100 000 utworów. Książki, muzyka, nagrania wideo, oprogramowanie - jest tego tylko 50 000 tytułów. Najczęstsze są problemy prawne i związane z przełamywaniem zabezpieczeń. Udało się nam jednak pokonać niektóre z nich, wciąż mamy jednak poważne problemy w Waszyngtonie.
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
Jesteśmy najbardziej znani jako Word Wide Web. Od 1996 roku archiwizujemy World Wide Web. Robimy zrzut każdej strony internetowej co dwa miesiące. Faktycznie, proces ten zapoczątkowała firma Alexa Internet, która podarowała ten zbiór do naszego archiwum internetowego. Od 11 lat ten zbiór rozrasta się i stanowi wspaniały zasób wiedzy. Zrobiliśmy "Way Back Machine", dzięki której można zobaczyć stare strony internetowe tak, jak wyglądły kiedyś. Jeśli wpiszesz to do wyszukiwrki, np. Google.com pojawią się różne wersje, które posiadamy, tak właśnie wyglądł w wydaniu Alpha, a tak wyglądał w Stanford. W każdym razie, możecie zobaczyć, skąd się co wzięło. Najczęściej ludzie chcą oglądać własne stare strony. Nauka płynąca z historii starożytnej Biblioteki Aleksandryjskiej, która jest chyba najbardziej znana z tego, że spłonęła, to aby zawsze mieć więcej niż jedną kopię. Zrobiliśmy już dodatkowe kopie wszystkiego co mamy i umieściliśmy je właśne w Bibliotece Aleksandryjskiej. To jest zdjęcie archiiwum internetowego w Bibliotece Aleksandryjskiej. Również w Amsterdamie rozbudowujemy kolejną kopię. Będziemy więc mieć kopie: na linii Uskoku San Andreas w San Francisco, na obszarach zalewowych w Amsterdamie i na Środkowym Wschodzie. A więc nie stawiamy wszystkiego na jedną kartę. Jeśli uda nam się umieścić kopie jeszcze w kilku miejscach, to będzie nieźle.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
Pojawia się pytanie natury politycznej i społecznej. Czy zbiory zapisane w technice cyfrowej, będą własnością publiczną czy prywatną? Istnieją duże firmy, które wybrały podobną drogę, i które przeprowadzają dygitalizację na szeroką skalę, ale one ograniczają domenę publiczną. Powstaje pytanie, czy naprawdę chcemy żyć w takim świecie? Jaka ma być w przyszłości rola własności publicznej a jaka - prywatnej? Jak sprawić, by w świecie przyszłości istniały zarówno biblioteki jak i wydawnictwa, czym mogliśmy się cieszyć w czasach naszej młodości? A więc powszechny dostęp do wiedzy - myślę, że może on się stać jednym z największych osiągnieć ludzkości, jak pierwszy człowiek na Księżycu, Biblia Gutenberga czy Biblioteka Aleksandryjska. Może to być coś, z czego zasłyniemy przez następne tysiąclecia. I tak, jak już powiedziałem wcześniej, zakończę zdaniem, wyrytym w kamieniu nad drzwiami Biblioteki Carnegie'go - Carnegie - jeden z wielkich kapitalistów tego kraju - wyrył nad drzwiami swej spuścizny "Dostępne dla ludu." Dziękuję Państwu bardzo.