We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
Nous devons absolument mettre à la portée de nos enfants tout ce que nous avons de meilleur à offrir. Si nous ne le faisons pas, nous aurons la nouvelle génération que nous méritons. Ils apprendront de ce qui les entoure, quoi que cela soit.
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
Et nous, intellectuels, parents, bibliothécaires, professionnels, en tout genre, une partie de notre activité consiste, en fait, à mettre le meilleur de ce que nous avons à offrir à portée de ceux qui nous entourent, ou du plus grand nombre. Je commencerai et finirai cette présentation avec quelques pensées gravées dans le marbre. La première figure au fronton de la bibliothèque publique de Boston. Gravé au dessus de ses portes, on peut lire : "Libre à tous" C'est vraiment une déclaration pleine d'inspiration, mais j'y reviendrai. Je suis bibliothécaire, et ce que j'essaie de faire est d'apporter tous les savoirs à tous ceux désireux de les lire. Et l'idée d'utiliser la technologie pour y arriver est parfaite. Je pense que nous avons l'opportunité de surpasser les Grecs. Ce n'est pas simple de dépasser les Grecs. Car avec le zèle des Égyptiens ils ont pu construire la Bibliothèque d'Alexandrie, dans l'idée de conserver un exemplaire de tous les livres du monde. Le problème était qu'il fallait aller jusqu'à Alexandrie pour l'avoir. Mais, en revanche, une fois là bas, de grandes choses se produisaient. Mais je pense que nous pouvons surpasser les Grecs et accomplir quelque chose de grand. Et je vais essayer de débattre un seul point aujourd'hui: l'accès universel à tous les savoirs est à notre portée. Donc si ma démonstration est bonne, vous devriez arriver à la conclusion, que oui, nous pourrions vraiment accomplir ce rêve de voir tout ce qui a pu être publié, tout ce qui a été un jour destiné à être distribué, devenir disponible à n'importe qui dans le monde désireux d'y accéder.
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
Oui, il y a débat sur comment l'argent doit être redistribué et on cherche toujours la meilleure solution. Mais, je pars du principe qu'il y a beaucoup d'argent et beaucoup de demande, donc on y arrivera. Je vais donc m'intéresser aux aspects technologiques et sociaux et à notre situation actuelle, à tous, par rapport à cette vision. Je vais vous présenter ceci à la manière du site Amazon.com -- Livres, musique, vidéo, média par média, et dans chaque cas, disons-nous : " ok, là on est comment?"
So if we start with books, you know, sort of where are we? Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
Si on commence avec les livres, vous savez à peu près où on en est? Tout d'abord, adoptons le point de vue d'un ingénieur, mesurons le problème. Quel ordre de grandeur? Pour mettre en ligne l'intégralité des travaux publiés, de manière à le rendre accessible à tous, qu'est ce que cela représente? Difficile à dire, mais si on prend pour exemple la plus grande bibliothèque au monde, la Bibliothèque du Congrès -- cela représente 26 millions de volumes, 26 millions de volumes. Il s'agit, de très loin, de la plus grande bibliothèque au monde. Un livre représente environ un mégabyte, dans un format texte sous Microsoft Word. Un megabyte. Donc, 26 millions megabytes représentent à 26 téraoctets, dans l'ordre méga, giga, tera, 26 téraoctets. 26 téraoctets rentrent dans un ordinateur de cette taille à peu près, avec des disques tournant sous Linux, ça coûte environ 60 000 dollars. Donc pour le prix d'une maison -- dans les environs plutôt un garage -- vous pouvez avoir tous les textes de la Bibliothèque du Congrès. C'est plutôt sympa.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
La question suivante est : qu'est ce qu'on fait de tout ça? Vous savez, est-ce que ça vaut la peine d'essayer? Est-ce que vous le voulez vraiment en ligne ? Une des premières choses que les gens font est feuilleter les livres ce qui vous permet de chercher au cœur des livres, et ceci est amusant. Et vous pouvez les télécharger et y jeter un coup d'œil de manière différente. Et vous pouvez le faire à distance, si vous avez un ordinateur portable. Il commence à y avoir cette sorte d'interface de feuilletage des pages qui ressemble beaucoup a un livre, d'une certaine manière, et vous pouvez chercher, y faire des marques pages, c'est sympa -- très style "livres" -- sur votre ordinateur. Mais, je ne sais pas, lire des choses sur un ordinateur portable -- chaque fois que je sors mon portable, ca ressemble toujours à du travail. Voilà une raison pour laquelle le Kindle est tellement bien. Je n'ai pas l'impression de travailler quand je lis sur un Kindle ; ça commence à être un peu plus spécifique. Mais il faut dire qu’il existe des technologies plus anciennes que je préfère. J'aime les livres en chair et en os. Et je pense qu'on peut utiliser nos technologies pour numériser -- les mettre en ligne et ensuite télécharger, imprimer et les relier et revenir sur des livres à nouveau.
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
Et nous pourrions dire, est-ce difficile? Et il s'avère ce n'est pas si difficile que ca. Nous avons étudié la piste du bibliobus. Et un bibliobus -- les dimensions d'une camionnette avec antenne parabolique, imprimante, reliure et coupure, et les enfants fabriquent leurs propres bouquins. Télécharger, imprimer et relier un livre ordinaire coûte à peu près trois dollars. Et c'est très joli à voir. On peu vraiment fabriquer de très jolis bouquins pour à peu près un centime la page, c'est environ le coût du matériel.
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
De sorte que l'idée de cette technologie pourra se terminer par remettre des livres dans les mains des gens. Il existe d'autres bibliobus de ce type. Ici vous avez Eric Eldred qui fait des livres à Walden Pond, les travaux de Thoreau. C'était juste avant qu'il se fasse renvoyer par les gardiens du Parc pour concurrence avec les librairies du coin. En Inde, ils on deux autres bibliobus qui patrouillent. Et ceci et le jour de l'inauguration de la bibliothèque d'Alexandrie, la nouvelle bibliothèque d'Alexandrie, en Égypte. Il y avait pas mal de monde. Et les enfants qui commencent à faire leurs propres livres. et un enfant heureux avec le premier livre qu’il n’a jamais possédé. Voila, l'idée de pouvoir utiliser cette technologie pour en arriver à du papier que je peux manier ça fait un peu rétro, mais je pense toujours que ça tient debout. Comme si ça venait de la Silicon Valley, une sorte d'utopie, et -- une espèce de, vous savez, de monde, nous avons pensé que si nous pouvions faire marcher cette technologie dans la campagne en Ouganda, on pourrait en faire quelque chose. De sorte que nous avons obtenu des fonds de la Banque Mondiale pour essayer. Et nous avons vu qu'on pouvait prendre deux gars de la Silicon Valley, les envoyer en Ouganda, acheter une voiture, mettre en place la première connexion internet à la bibliothèque nationale d'Ouganda, trouver ce qu'ils voulaient, et mettre en place un programme pour faire des livres en Ouganda. Et, vous savez, technologiquement, ça marche.
What we found out of this is we didn't have the right books. So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
Ce que nous en avons tiré, c'est que nous n'avions pas les bons livres. Les livres étaient dans la bibliothèque. Nous aurions pu les amener vers les gens si ils avaient été numérisés, mais nous ne savions pas comment les numériser. Tous le monde pensait qu'il fallait les envoyer en Inde ou en Chine. Nous avons essayé, et j'y reviendrai plus tard. De nouvelles technologies existent pour l'obtenir qui sont assez sympa aussi. C’ est une imprimante à la demande qui ressemble à une machine Rube Goldberg. Nous en avons une maintenant. C'est vraiment super. c'est une espèce de tapis roulant et ca fait des livres. Ca s'appelle l'"Espresso Book Machine" on appuie sur un bouton et ça vous fait un livre en 10 minutes.
Something else I'm quite excited about in this particular domain, beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
Autre chose d'assez excitant dans ce domaine, au delà de ces sortes de kiosques où vous avez des livres à la demande, ce sont ces petits écrans qui sont en train de sortir. un de mes préférés c'est ce portable à 100 dollars. Et je n'ai pas l'intention de faire éclater la foudre ici, mais nous avons utilisé un de ces objets comme lecteur d’e-book. Voici une des unités test et vous pouvez -- ça s'avère être un très beau lecteur de e-book. Nous y avons fait une petite bricole pour y mettre un de nos livres, et il s'est révélé que 200 dpi signifie que vous pouvez y mettre des bouquins scannés que l'on voit très bien. A 200 dpi, c'est l'équivalent d'une imprimante laser 300 dpi. Ce n'est pas mal du tout. Vous pouvez y lire des livres scannés très facilement.
So the idea of electronic books is starting to come about. But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
L'idée d'un livre électronique est en train de faire son trou. Mais comment faire toutes ces copies scannées? Nous avons pensé, okay, essayons avec l'envoi des livres en Indes. Et il y avait un projet avec -- financé par la National Science Foundation, a envoyé une série de scanner, et les bibliothèques américaines étaient supposées envoyer des livres. Elles ne l'ont pas fait -- elles ne voulaient pas envoyer leurs livres. De sorte que nous avons acheté 100.000 livres et nous les avons envoyés en Inde. Et nous avons appris pourquoi il ne faut pas envoyer de livres en Inde. La leçon que nous en avons tiré est, scanne tes propres livres. Si tu tiens vraiment aux livres, tu peux les scanner beaucoup mieux, spécialement si ces livres ont de la valeur. Si ce sont de nouveaux livres vous pouvez juste, vous savez, les charcuter parce que vous pouvez juste en acheter un autre, ce n'est pas un gros problème en termes de haute qualité de numérisation. Mais fait les choses que tu aimes faire. Les indiens ont scanné plein de leurs livres -- à peu près 300.000 -- en le faisant tres bien. Les Chinois en on fait plus d'un million et les Égyptiens à peu près 30.000.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
Mais nous avons envoyé -- pensé, d’accord, si nous avons besoin de le faire, faisons le sur place dans une bibliothèque. Et comment le faire, et comment le faire de manière économique, à un cout que nous pouvons nous permettre? Nous avons fixé uns objectif de coût de 10 cents par page. Si ceci représente le coût d'une photocopieuse pour numériser, reconnaître les caractères, tout rassembler, faire en sorte que l'on puisse télécharger, imprimer et relier, le tout inclus, on aura réussi quelque chose. Nous avons commencé à penser, comment arriver à ces 10 cents? On a essayé ces sortes de robots, et ça marchait assez bien -- ces sortes de tourne-page automatique. Si on peut envoyer un Rover sur Mars, vous pensez qu'on est capable de tourner des pages. Mais tourner des pages s'est révélé assez difficile, et ca n'est pas encore terminé. De toute manière -- on a fini par faire notre propre scanner. Et avec deux appareils photo numériques professionnels de haute qualité, éclairage de musée -- de sorte que même si le livre et noir et blanc, vous pouvez avoir le bon contraste. On finit par faire un beau et respectueux travail. Ce n'est pas un fax, l'idée est de faire un bon travail puisque vous parcourrez ces bibliothèques. Et nous devons être capables de maintenir 10 cents par page si nous voulons les rassembler en volume. Voila à quoi ça ressemble à l'Université de Toronto. Et en fin de compte ca paye un salaire honorable. Les gens semblent aimer ca. Oui, c'est assez ennuyant, mais certains trouve ça Zen. (Rire) Spécialement si c'est des livres intéressants desquels vous vous souciez dans des langues que vous comprenez, On a été capable de faire un bon travail en maintenant les 10 cents par page. De sorte que 10 cents par pages, 300 pages dans un livre moyen, 30 dollars un livre. La Bibliothèque du Congres, si vous la faisiez toute entière -- 26 million de livres -- cela représente 750 million de dollars, correct? Mais un million de livres -- ce serait un bon début, cela coûterait 30 millions de dollars. L'addition n'est pas si chère.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
Et ce qu'on a été capable de faire, c'est rentrer dans les bibliothèques. Nous avons maintenant huit centres de scanning dans trois pays, et les bibliothèques sont prêtes pour avoir leurs livres scannés La Getty est en train de déplacer ses livres à la UCLA, où nous avons un de ces centres de scanning, et scanner leurs livres sans droits d'auteurs, c'est fabuleux. Nous commençons à avoir la responsabilité institutionnelle. Ce qui nous manque c'est les 10 cents. Si nous obtenons les 10 cents, tout le reste en découle. Nous avons scanné à peu prés 200.000 livres. Nous scannons maintenant à peu près 15.000 livres par mois. et nous sommes presque en mesure de doubler ce chiffre.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
Donc, tout marche très bien. Et nous nous apprêtons à passer des livres avec droits d'auteurs expirés aux livres qui ne sont plus publiés. Donc je pense -- nous allons vers les livres sans droits d'auteurs, et Amazon.com vient du monde des livres en cours d'impression, et je pense qu'on se rencontrera quelque part à mi-chemin et avoir quelque chose de classique, représenté par un système d'édition et une bibliothèque qui travaillent en parallèle. Et nous commençons un programme pour travailler sur les hors publication, mais en forme de prêt. Je ne suis pas bien sûr de ce qu'un prêt represente. Mais un système de prêt de livres hors publication existe à la bibliothèque publique de Boston, le Woods Hole Oceanographic Institute et quelques autres bibliothèques commencent à participer à ce programme, pour voir comment marche le modèle : où s'arrête la bibliothèque et où la librairie commence. Tout considéré, on peut le faire à grande échelle. On reviendra aussi sur les microfilms et leur mise en ligne. Donc, on peut faire les 10 cents la page, on avance à 15.000 livres par mois et on a à peu près 250.000 livres en ligne, En comptant tous les projets qui commencent à s’ajouter. Ce que je voulais soutenir est que, les livres sont à notre portée. L’idée de prendre tout le reste des medias n’est pas un gros problème. Oui, ça coûte des dizaines de millions, même plus, des centaines de millions, mais en une seule fois nous avons toute l’histoire de la littérature imprimée en ligne. Ensuite il ya des problèmes sur les modèles de business sur comment les commercialiser et les rendre disponible au public. Mais c’est a notre portée technologiquement et légalement, Au moins pour les hors publication et hors droit d’auteur, nous proposons, d’être capable de mettre tout ça en ligne.
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
Passons maintenant à l’audio, et je vais parcourir ce sujet aussi. Quelle quantité? Au mieux qu’on puisse évaluer, il y a à peu près deux ou trois millions de disques publié – 78 tours, disques et CD -- ça représente la plus grand archive de matériel publié Auquel nous faisons face. Ca coûte à peu près 10 dollars pour prendre un disque Et le mettre en ligne si vous le faite sur des grands volumes. Mais nous savons que le problème des droits d’auteurs est plutôt compliqué. C’est un sujet très problématique, Nous avons remarqué qu’il ya des niches dans le monde musical Qui ne sont pas bien desservies par le système classique de commercialisation. On a donc commencé par rendre cette musique disponible en offrant un espace sur les étagères du net. Aux États Unis ça ne coûte rien d’offrir. Correct? Si vous offrez comme donation ou au public, Vous prenez une tape dans le dos et une réduction d’impôts -- Excepté sur le net, où vous pouvez faire faillite. Si vous mettez une vidéo de votre groupe qui joue dans votre garage et que ça commence à devenir populaire, vous pouvez perdre votre guitare ou votre maison.
This doesn't make any sense. So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
Ca n’a aucun sens. Nous avons donc offert espace illimité, bande passante illimitée, pour toujours, gratuitement, à tous ceux qui ont quelque chose à partager qui pourrait appartenir à une bibliothèque. Et nous avons eu plein de preneurs. Parmi eux les rock'n rollers. Les rock 'n rollers ont une tradition de partage, tant que personne n'en tire profit. Vous pourriez -- Enregistrements de concert, ce ne sont pas les enregistrements commerciaux, mais l'enregistrement des concerts, en commencant par les Grateful Dead. Et nous avons deux ou trois groupes qui ont signé. Ils donnent la permission, et nous avons à peu près 40 à 50 concerts par jour. On a à peu près 40.000 concerts, tout ce que Grateful Dead ait jamais fait, sur le net, pour que les gens puissent voir et écouter tout ce matériel. Donc, on peut mettre en ligne l'audio, mais le problème des droits d'auteurs est vraiment épineux. Nous avons beaucoup de collections maintenant -- 200.000 articles -- et ca s'agrandit dans le temps.
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
Images en mouvement: si vous pensez au sorties cinéma, il n'y en a pas beaucoup. Au mieux, il y a 150.000 à 200.000 films qui sont vraiment conçus pour une distribution cinéma à grande échelle. Ce n'est pas tant que ça. Mais la moitié sont indiens. De toute façon, c'est faisable, mais nous avons trouvé uniquement un millier de ces films -- hors droits d'auteur. Nous les avons donc numérisés et rendus disponible. Mais nous avons découvert qu'il existe toute une autre série de films qui n'ont jamais vu la lumière -- les films d'archives. Nous avons trouvé aussi beaucoup de films politiques, des films amateurs, toutes sortes de choses qui rentrent dans les besoins d'une famille. Nous avons donc commencé à les rendre disponibiles et c'est devenu très populaire. On n'est pas vraiment comme YouTube; on est orienté vers du plus long terme également vers des sujets que les gens peuvent réutiliser et transformer en nouveaux films, ce qui s'est révélé tres amusant.
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
La Télévision s'agrandit. On a commencé à enregistrer 20 chaines télé 24 heures par jour. C'est la plus grande TiVo que vous ayez jamais vu. Ca représente à peu près un pedooctet, pour l'instant, de télés du monde entier -- russe, chinoise, japonaise, iraquienne, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 heures par jour. Nous avons mis en ligne une seule semaine, essentiellement pour des raisons économiques, et c'est celle du 11 septembre, une espèce de "depuis le 11/09/2001": pendant une semaine, qu'est ce qu'a vu le monde entier? CNN disait que les Palestiniens dansaient dans les rues. Vraiment? Regardons la télé palestinienne et vérifions. Comment peut-on critiquer sans être en mesure de citer ? et être en mesure de comparer se qu'y s'est passé ? Et la télé est malheureusement non enregistrée et ne peut être citée, sauf par Jon Stewart, qui fait un merveilleux travail. En tout cas, la télé est, d'après moi, à notre portée. 15 dollars par heure de vidéo et 100 à 150 dollars par heure de pellicule cinéma, nous pouvons prendre toutes sortes de matériels sans trop de frais et mettre le tout en ligne. Et nous avons, maintenant, beaucoup de ce matériel. Nous avons à peu près 100.000 pièces. Donc livres, musique, vidéo, logiciel -- il y en a 50.000 seulement. Les problèmes principaux sont des problèmes légaux lié a la protection des copies. Mais nous avons travaillé sur ces sujets, mais nous avons encore de gros problèmes à Washington.
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
On est mieux connu comme le World Wide Web. Nous avons archivé le World Wide Web à partir de 1996. Nous prenons une instantanée de chaque site web et de toutes leurs pages, tous les deux mois. En réalité, Alexa Internet a commencé, et fait don de cette collection aux archives internet. Et ca a grandi depuis ces 11 dernières années et c'est une ressource extraordinaire. Et nous avons fait une "Machine à remonter dans le temps" qui vous permet d'aller voir les vieux sites comme ils étaient autrefois. Si vous y allez et cherchez quelque chose, par exemple Google.com, les différentes versions que nous avons, voila à quoi ça ressemblait en version Alpha et voila à quoi ça ressemblait à Stanford. En tous cas, vous vous faites une idée d'où viennent toutes sortes de choses. Généralement les gens ne veulent pas voir leurs vieux trucs là-dessus. S'il y a une chose que nous voulons apprendre de la bibliothèque d'Alexandrie version numéro un, qui est probablement essentiellement célèbre pour avoir brûlé, c' est : ne garde pas qu'une seule copie. Nous avons donc commencé par -- nous avons donc fait une autre copie de tout ca et nous l'avons remise dans la bibliothèque d'Alexandrie. Donc voici une photo des archives internet à la bibliothèque d'Alexandrie. Et nous avons aussi une autre copie qui se construit à Amsterdam. Nous devrions donc en mettre une dans la faille de Saint André à San Francisco, dans la zone d'inondation à Amsterdam et au Moyen Orient. En tout cas... nous équilibrons les paris. Si nous les mettons également dans deux autres emplacements, je pense qu'on aura tout arrangé.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
Il ya une question politique et sociale à ce sujet. Si nous numérisons, tout ce matériel sera-t-il public ou privé? De grosse compagnies on eu cette vision, elles sont en train de faire de la numérisation sur large échelle, mais elles sont fermées au domaine public. La question est : est-ce vraiment le monde dans lequel nous souhaitons vivre? Quel est le rôle du public par rapport au privé pendant que l'affaire avance? Comment peut-on avoir un monde où nous avons les deux, bibliothèques et éditions dans le futur, essentiellement ce dont nous avons bénéficié en grandissant? L'accès universel à toute la connaissance -- Je pense que ça pourrait être une des plus grandes réussites de l'humanité, comme l'homme sur la lune ou la bible de Gutenberg ou la bibliothèque d'Alexandrie. On pourra se souvenir de nous pour cela pendant des millénaires pour avoir réussi. Et comme je l'ai dit auparavant, je voudrais terminer par ce qui est gravé au dessus de la porte de la bibliothèque Carnegie -- Carnegie -- un des plus grands capitalistes de ce pays -- gravé sur son héritage: "Libre a tous." Merci beaucoup.