We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
We moeten het beste wat we te bieden hebben voor onze kinderen bereikbaar maken. Doen we dat niet, dan krijgen we de generatie die we verdienen. Ze leren van alles wat ze om zich heen zien.
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
En wij, de elite, ouders, bibliothecarissen, professionals, wat dan ook, veel van onze activiteiten zijn erop gericht het beste wat we te bieden hebben binnen bereik van de mensen om ons heen te brengen, of zoveel mogelijk. Ik begin en eindig deze lezing met een paar dingen die in steen staan gekerft. Eentje staat op de openbare bibliotheek van Boston. Boven de deur staat gegraveerd: "Vrij toegankelijk." Dat is een inspirerende opmerking, en ik kom er aan het eind op terug. Ik ben bibliothecaris, en ik probeer alle opgeschreven kennis bij zoveel mogelijk mensen te brengen die het willen lezen. Het idee om techniek te gebruiken is voor ons perfect. Volgens mij kunnen we de Grieken voorbij streven. Dat is niet gemakkelijk. Maar dankzij de vlijt van de Egyptenaren konden ze de Bibliotheek van Alexandrië bouwen -- het idee van een kopie van elk boek, van alle volkeren ter wereld. Het probleem was dat je daadwerkelijk naar Alexandrië moest gaan om er te komen. Maar als je dat deed dan gebeurden er wel geweldige dingen. We kunnen de Grieken voorbij streven en iets bereiken. En ik zal proberen vandaag maar één punt te betogen: dat universele toegang tot alle kennis binnen ons bereik ligt. Als me dat lukt dan zullen jullie straks weggaan en denken: ja, we kunnen echt die grootse visie bereiken dat we alles wat ooit gepubliceerd is, alles wat ooit gedistribueerd moest worden, beschikbaar is voor iedereen die er toegang toe wil hebben.
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
Ja, er zijn nog problemen met het distribueren van geld en daar wordt nog over nagedacht. Maar ik zeg dan dat er genoeg geld is, en er is meer dan genoeg vraag, dus dat is haalbaar. Ik zal het hebben over de technologische, sociale en waar we, zeg maar, nu staan, op weg naar die specifieke visie. Ik doe dat op de manier zoals de Amazon.com website -- de boeken, muziek, video en stappen, media-type bij media-type, gewoon er langs, zo van: oké, hoe pakken we dit aan?
So if we start with books, you know, sort of where are we? Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
Als we dan met boeken beginnen, waar staan we dan? Als ingenieur moet je eerst het probleem verkennen. Hoe groot is het? Als je alle wat gepubliceerd is online wilt zetten zodat iedereen er toegang tot heeft, hoe omvangrijk is dat probleem dan? Dat weten we niet echt, maar de grootste bibliotheek ter wereld is het Library of Congress -- 26 miljoen delen, 26 miljoen delen. Met afstand de grootste bibliotheek voor gedrukt werk in de wereld. En een boek, als je dat hebt, is ongeveer een megabyte, als je het in Microsoft Word zou hebben. Dus een megabyte, 26 miljoen megabyte is 26 terabyte, het gaat van mega, giga, tera, 26 terabyte. 26 terabyte past in een computer die ongeveer zo groot is, op Linux harde schijven, en het kost ongeveer 60.000 dollar. Dus voor de prijs van een huis -- of een garage hier -- kun je alle woorden van het Library of Congress hebben draaien. Dat is wel gaaf.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
De vraag is dan: wat krijg je? Weet je wel, is het het waard om zover te komen? Wil je wel dat het online staat? Het eerste wat mensen doen is dat ze boek-lezers maken waardoor je in boeken kunt zoeken, en dat is wel grappig. Je kunt ze downloaden en erin rondkijken, op nieuwe manieren. Je kunt er van afstand bij komen, als je een laptop hebt. Er komen nu een paar van die blad-omsla-apparaten die erg op boeken lijken, op een bepaalde manier, en je kunt ermee zoeken, tabs maken, en het is wel grappig -- nog steeds erg boek-achtig -- op je laptop. Maar ik weet niet, dingen lezen op een laptop -- telkens als ik mijn laptop pak voelt het als werken. Daarom is mijn Kindle zo geweldig. Het voelt niet als werken als ik een Kindle lees; het wordt iets specifieker. Ik moet zeggen dat er oudere technologieën zijn waar ik van hou. Ik hou van het tastbare boek. Ik denk dat we met onze technologie dingen kunnen digitaliseren -- op internet zetten en downloaden, afdrukken en binden, en dan heb je weer boeken.
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
En we zeiden: hoe moeilijk is dit? En het blijkt niet zo moeilijk te zijn. We maakten daadwerkelijk een boekmobiel. Een boekmobiel -- ter grootte van een busje met een satellietschotel, een printer, binder en snijder, en kinderen maken hun eigen boeken. Het kost rond de drie dollar om een ouderwets boek te downloaden, te printen en te binden. En het resultaat ziet er eigenlijk wel mooi uit. Je kunt daadwerkelijk echt mooie boeken maken voor een cent per pagina, de materiaalkosten om dit te doen.
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
Het principe van deze technologie kan ertoe leiden dat boeken weer in mensenhanden terecht komen. Er zijn nog andere boekmobielen. Dit is Eric Eldred die boeken maakt bij Walden Pond, de werken van Thoreau. Dit is vlak voordat hij er werd uitgegooid door de parkwachten vanwege het concurreren met de plaatselijke boekwinkel. In India rijden er ook een aantal boekmobielen rond. Dit is de opening van de Bibliotheek van Alexandrië, de nieuwe Bibliotheek van Alexandrië in Egypte. Er was veel toeloop. Kinderen maakten hun eigen boeken, en een blij kind met zijn allereerste boek. Dus het principe van het gebruik van deze technologie zodat ik uiteindelijk papier overhoud, klinkt een beetje ouderwets, maar heeft wel bestaansrecht volgens mij. Omdat ik uit Silicon Valley kom, uit een soort utopia, uit zo'n soort wereld, dachten we, als we deze technolgie toepassen in landelijk Oeganda, daar zit dan wel iets in. We kregen daadwerkelijk subsidie van de wereldbank om het uit te proberen. In 30 dagen tijd pikten we een aantal mensen uit Silcon Valley, zetten ze op het vliegtuig naar Oeganda, kochten een auto, regelden de eerste internetverbinding in de Nationale Bibliotheek van Oeganda, vonden uit wat ze wilden, en startten een programma om boeken te maken in landelijk Oeganda. Vanuit technologisch oogpunt werkte het.
What we found out of this is we didn't have the right books. So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
We ontdekten dat we niet de goede boeken hadden. De boeken waren in de bibliotheek. We konden ze bij de mensen krijgen als ze digitaal waren, maar we wisten niet hoe we ze moeten digitaliseren. Iedereen dacht dat de oplossing was ze naar India en China te sturen. Dus probeerden we dat, en daar kom ik zo op terug. Er zijn nieuwere technologieën voor bezorging die gebeurd zijn en die ook spannend zijn. Eentje is een 'print-on-demand' machine die eruit ziet als een idiote uitvinding. We hebben er nu eentje. Die is ontzettend gaaf. Het is allemaal lopende band en het maakt een boek. Hij heet de "Espresso Boekmachine," je drukt op een knop en binnen 10 minuten heb je een boek.
Something else I'm quite excited about in this particular domain, beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
Wat dat betreft is er nog iets wat ik erg spannend vind, los van die kiosk-achtige dingen waar je op aanvraag een boek kunt krijgen, en dat is van die kleine schermpjes die je nu hebt. Eén van mijn favorieten is de laptop van 100 dollar. Ik wil niemand de wind uit de zeilen nemen, maar we hebben er zo eentje als een e-reader gebruikt. Hier heb je een testmodel en je kunt -- het blijkt een prachtig uitgevoerde e-reader te zijn. We hebben een trucje gebruikt om onze boeken er op te vertonen, en het blijkt dat je met 200 dots per inch gescande boeken er op kunt zetten en dat het er heel goed uit ziet. 200 dots per inch is equivalent aan een 300-dots print van een laserprinter. Het ziet er goed voor ons uit. Je kunt gescande boeken gemakkelijk lezen.
So the idea of electronic books is starting to come about. But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
Het idee van elektronische boeken begint vorm te krijgen. Maar hoe voer je al die scans uit? We dachten dus: laten we die boeken eens naar India sturen. Er was een project -- gesubsidieerd door de National Science Foundation, die stuurde een aantal scanners, en de bibliotheken in de VS moesten boeken opsturen. Dat deden ze niet -- ze wilden hun boeken niet opsturen. Dus kochten we 100.000 boeken en stuurden ze naar India. Toen ontdekten we waarom je beter geen boeken naar India kunt sturen. Wat we ervan hebben geleerd is: scan je eigen boeken. Als je echt om boeken geeft scan je ze zelf beter, met name als het boeken van waarde zijn. Met nieuwe boeken kun je gewoon ruw omgaan want je koopt zo een nieuwe, dat maakt niet zoveel uit voor wat betreft hoogkwalitatief scannen. Doe alleen dingen waar je van houdt. De Indiërs hebben veel van hun eigen boeken gescand -- to nu toe ongeveer 300.000 -- dat gaat prima. De Chinezen scanden meer dan een miljoen en de Egyptenaren ongeveer 30.000.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
We dachten, goed, als we dit moeten doen dan doen we het in de bibliotheek. Hoe gaan we dit aanpakken, zodat het voor ons betaalbaar blijft? We zijn uitgegaan van 10 cent per pagina. Als dat de prijs is van kopiëren, digitaliseren, OCR, verpakken, zorgen dat je het kunt downloaden, afdrukken en inbinden, de hele rimram, dan hebben we iets bereikt. Dus gingen we nadenken hoe we tot 10 cent zouden kunnen komen. We probeerden robots uit, dat ging aardig goed -- een soort van bladzijde-omslaanders. Als we Mars-karretjes kunnen maken, dan kunnen we ook bladzijden omslaan. Maar bladzijden omslaan blijkt erg lastig te zijn, en de aantallen blijven laag. Hoe dan ook -- uiteindelijk maakten we zelf een boekenscanner. En met twee hoge resolutie digitale camera's, gecontroleerde museumbelichting -- zelfs bij een zwart-wit boek blijft de juiste kleurschakering belangrijk. Feitelijk doe je een mooie, respectvolle klus. Dit is geen fax, dit is -- het gaat erom dat je prachtig werk aflevert terwijl je door de bibliotheken heen gaat. We hebben 10 cent per bladzijde bereikt, als we met grote aantallen werken. Zo ziet het er uit in de universiteit van Toronto. Feitelijk komt het neer op betaling in natura. Mensen vinden het heerlijk. Jazeker, het is een beetje saai, maar sommigen vinden het wel Zen. (Gelach) Met name als het interessante boeken zijn waar je om geeft in talen die je kunt lezen. We hebben een knap staaltje werk verricht om tot die 10 cent per bladzijde te komen. 10 cent per pagina, 300 pagina's per gemiddeld boek, 30 dollar per boek. De Library of Congress, als je het hele ding zou doen -- 26 miljoen boeken -- ongeveer 750 miljoen dollar, nietwaar? Maar een miljoen boeken -- dat vind ik wel een aardig begin, en dat kost 30 miljoen dollar. Dat is geen rib uit je lijf.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
We hebben toegang gekregen tot bibliotheken. We hebben nu acht scanning-centra in drie landen, en bibliotheken zijn er vóór om hun boeken te laten scannen. Het Getty museum hier verhuist zijn boeken naar de universiteit van Los Angeles, waar we een scanning-centrum hebben, en waar we hun rechtenvrije boeken scannen, en dat is geweldig. We krijgen nu institutionele verantwoordelijkheid. Wat we nog missen is de 10 cent. Als we tot 10 cent komen dan volgt de rest vanzelf. We hebben ongeveer 200.000 boeken gescand. Op dit moment scannen we er 15.000 per maand, en we zijn bezig die snelheid te verdubbelen.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
Al met al gaat het dus erg goed. We beginnen nu, naast de rechtenvrije boeken, aan de uitverkochte boeken. Dus wij verlaten nu het rechtenvrije bibliotheek-spul, en Amazon.com zit in de boeken die nu in druk zijn, en ik denk dat we elkaar halverwege ontmoeten om een welbekende constructie te maken, en dat is een uitgeverij en een bibliotheek die parallel opereren. We beginnen dus met uitverkochte werken, maar die lenen we. Wat lenen precies betekent weet ik niet. Hoe dan ook, we lenen uitverkochte werken van de openbare bibliotheek van Boston, de Woods Hole Oceanographic Institute en een paar andere bibliotheken die meedoen aan dit programma, om uit te vinden waar de bibliotheek eindigt en waar de boekhandel het over neemt. Al met al is dit op grote schaal mogelijk. We gaan microfilm ook online zetten. We kunnen dus 10 cent per pagina doen, we doen 15.000 boeken per maand en we hebben 250.000 boeken online, als je alle projecten meetelt die erbij betrokken zijn. Mijn betoog is: boeken zijn binnen handbereik. Om alles in één keer aan te pakken is niet zo'n grote uitdaging. Ja, het kost tientallen miljoenen, een paar honderd miljoen, maar in één grote klap hebben we de volledige geschiedenis van de boekdrukkunst online. Er zijn uitdagingen voor wat betreft het business model, over hoe je dit op de markt zet en aan de man brengt. Maar technologisch en juridisch gezien zijn we in staat, in ieder geval voor de uitverkochte en rechtenvrije boeken, is onze stelling, om het hele geval online te krijgen.
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
Laten we het over audio hebben. Hoeveel is daar van? Voor zover we weten zijn er ongeveer twee tot drie miljoen disks gepubliceerd -- dus 78-toeren platen, elpees en CD's -- dat is tenminste het grootste archief van gepubliceerd materiaal die we hebben kunnen aanwijzen. Het kost ongeveer 10 dollar per stuk om een disk online te zetten als je dit in grote aantallen wilt doen. Maar de rechten-problemen blijken erg stekelig te zijn. Dit gebied is juridisch zwaar dichtgetimmerd, dus we ontdekten plekken in de muziekwereld die niet goed ondersteund worden door het welbekende commerciële systeem van uitgeven. We zijn begonnen met deze beschikbaar te stellen door ze webruimte op het internet te geven. In de VS is iets weggeven gratis. Toch? Als je voor het goede doel geeft, of iets weggeeft, dan krijg je een schouderklopje en een belastingvoordeel -- behalve op het internet, daar kun je er aan failliet gaan. Als je een filmpje van je band op internet publiceert en het trekt veel bekijks, dan kun je je gitaren kwijt raken, of je huis.
This doesn't make any sense. So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
Dat slaat nergens op. Daarom hebben we gratis onbeperkte opslag en bandbreedte aangeboden voor iedereen die iets wil delen dat in een bibliotheek behoort. Er zijn veel afnemers voor. Zoals de rock-'n-rollers. De rock-'n-rollers kennen een traditie van delen, zolang er maar niemand aan verdient. Je kon -- Concertopnames, dus niet de commerciële opnames, maar concertopnames, daar begonnen de Grateful Dead mee. Zo'n twee à drie bands per dag registreren zich. Ze geven toestemming, en we krijgen 40 à 50 concerten per dag. We hebben ca. 40.000 concerten, alles van de Grateful Dead, op internet zodat mensen het kunnen zien en horen. We kunnen dus audio publiceren, maar de rechtenkwesties blijven netelig. We hebben nu veel verzamelingen -- en paar hondderdduizend items -- en het groeit.
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
Bewegende beelden: als je denkt aan bioscoopfilms, daar zijn er niet zo veel van. Voor zover we weten zijn er ongeveer 150 tot 200.000 films ooit gemaakt die bedoeld zijn voor grootschalige distributie aan bioscopen. Da's niet zo veel. Maar de helft komt uit India. Het is hoe dan ook mogelijk, maar we vonden er maar duizen van die -- die rechtenvrij waren. Dus digitaliseerden we die en stelden ze beschikbaar. Maar we ontdekten dat er veel andere soorten films zijn die nog nooit zijn vertoond -- archiefmateriaal. We ontdekten ook politieke films, amateurfilms, allerlei zaken die een thuis nodig hebben, een permanent onderkomen. Dus stelden we die beschikbaar en het is erg populair geworden. We zijn nog geen YouTube; we richten ons meer op langetermijn-dingen en op dingen die mensen kunnen hergebruiken voor nieuwe films, en dat was gewoon ontzettend leuk.
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
Televisie is een stuk omvangrijker. We zijn begonnen met het opnemen van 20 kanalen, 24 uur per dag. Het is de grootste harddiskrecorder die je ooit hebt gezien. Het is totnogtoe ongeveer een pedobyte aan wereldwijde TV -- Russisch, Chinees, Japans, Irakees, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 uur per dag. We tonen maar één week, voornamelijk uit kostenoverweging, van 9/11, dus vanaf 11-9-2001: wat zag de wereld in die week? CNN zei dat de Palestijnen in de straten dansten. Was dat zo? Laten we de Palestijnse TV er eens op nazien. Hoe kunnen we kritisch nadenken zonder dat we het verleden kunnen aanhalen en ermee kunnen vergelijken? Televisie wordt nauwelijks bekritiseerd of aangehaald, behalve door Jon Stewart die dat fantastisch doet. Hoe het ook zij, televisie is binnen handbereik, zou ik zeggen. Dus met 15 dollar per uur video en ongeveer 100 tot 150 dollar per uur celluloid, zijn we in staat om materiaal erg goedkoop online te zetten en op het internet te krijgen. Op dit moment hebben we veel van zulk materiaal. We hebben hier zo'n 100.000 delen. Dus boeken, muziek, video, software -- daar zijn maar 50.000 titels van. De problemen zijn vooral juridisch van aard en het verbreken van kopieerbeschermingen. Maar we hebben er een paar opgelost, maar we hebben nog echt problemen in Washington.
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
We zijn het bekendst als het wereldwijde web. We archiveren het wereldwijde web sinds 1996. We slaan elke twee maanden alle websites op. Eigenlijk heeft Alexa Internet daar pionierswerk voor verricht, die de collectie aan het internetarchief schenkt. De laatste elf jaar groeit het gestaag, en het is een geweldige bron. We hebben een "Way Back Machine" gemaakt waarmee je websites kunt bekijken zoals ze er ooit uitzagen. Als je iets opzoekt, dit is Google.com, de verschillende versies die we ervan hebben, zo zag het eruit toen het een alfa-release was en zo zag het er uit in Stanford. Hoe dan ook, zo heb je een idee waar dingen vandaan komen. Vaak willen mensen oude dingen zien. Als we iets willen leren van de bibliotheek van Alexandrië, versie 1, vooral bekend omdat hij in brand vloog, is: hou het niet bij één kopie. Dus zijn we -- We hebben van dit alles nog een kopie gemaakt die we daadwerkelijk hebben teruggeplaatst in de bibliotheek van Alexandrië. Dit is een foto van het internetarchief in de bibliotheek van Alexandrië. We zijn nu bezig met een andere kopie in Amsterdam. We zouden het in de San Andreasbreuk in San Francisco moeten stoppen, in het met overstroming bedreigde gebied in Amsterdam en in het Midden Oosten, we spreiden dus onze risico's. Als we 't in nog meer plaatsen stoppen, dan ziet het er goed uit.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
Hier zit een politieke en een sociale kwestie aan vast. Als we digitaal gaan, is het materiaal dan openbaar of privé? Er zijn grote bedrijven die dit doen, die grootschalig digitaliseren, maar ze bieden het niet openbaar aan. De vraag is: willen we in zo'n wereld leven? Wat is de positie van het openbare versus dat wat privé is in deze ontwikkeling? Hoe organiseren we een wereld waarin we zowel bibliotheken als uitgeverijen hebben in de toekomst, net zoals we er vroeger voordeel van hadden? Dus vrije toegang tot alle kennis -- dat zou één van de grootste prestaties van de mensheid kunnen zijn, zoals de man op de maan of de Gutenberg bijbel of de bibliotheek van Alexandrië. We zouden er millenia lang de geschiedenis mee in gaan, dat we dat hebben bereikt. Zoals ik al zei, ik eindig met iets dat in steen is gekerft boven de deur van Carnegie Library -- Carnegie -- één van de grote kapitalisten van dit land -- daar staat zijn nalatenschap: "Vrij voor de Mensheid." Hartelijk dank.