We really need to put the best we have to offer within reach of our children. If we don't do that, we're going to get the generation we deserve. They're going to learn from whatever it is they have around them.
Precisamos de pôr o que temos de melhor ao alcance das nossas crianças. Se não o fizermos, a próxima geração será aquela que merecemos Vão aprender com aquilo que tiverem à sua volta
And we, as now the elite, parents, librarians, professionals, whatever it is, a bunch of our activities are, in fact, in trying to get the best we have to offer within reach of those around us, or as broadly as we can. I'm going to start and end this talk with a couple things that are carved in stone. One is what's on the Boston Public Library. Carved above their door is, "Free to All." It's kind of an inspiring statement, and I'll go back at the end of this. I'm a librarian, and what I'm trying to do is bring all of the works of knowledge to as many people as want to read it. And the idea of using technology is perfect for us. I think we have the opportunity to one-up the Greeks. It's not easy to one-up the Greeks. But with the industriousness of the Egyptians, they were able to build the Library of Alexandria -- the idea of a copy of every book of all the peoples of the world. The problem was you actually had to go to Alexandria to go to it. On the other hand, if you did, then great things happened. I think we can one-up the Greeks and achieve something. And I'm going to try to argue only one point today: that universal access to all knowledge is within our grasp. So if I'm successful, then you'll actually come away thinking, yeah, we could actually achieve the great vision of everything ever published, everything that was ever meant for distribution, available to anybody in the world that's ever wanted to have access to it.
E nós, enquanto elite atual, pais, bibliotecários, profissionais, o que for, grande parte da nossa atividade é pôr tudo o que temos de melhor ao alcance dos que nos rodeiam, o mais amplamente que pudermos,. Vou começar e terminar esta palestra com um par de coisas gravadas em pedra. Uma é o que existe na Biblioteca Pública de Boston. Gravado no lintel: "Entrada Livre para Todos". É uma afirmação inspiradora, no final voltarei a isto. Sou bibliotecário e estou a tentar levar todas as obras de conhecimento ao maior número de pessoas que as desejem ler. A ideia de usar a tecnologia. para nós, é perfeita. Acho que temos a oportunidade de ultrapassar os gregos. Não é fácil ultrapassar os gregos. Mas com o espírito empreendedor dos egipcíos, eles construíram a Biblioteca de Alexandria, a ideia de copiar todos os livros de todas as pessoas do mundo. O problema era que tinha que tínhamos de ir a Alexandria para a visitar. Por outro lado, se lá fôssemos, era uma coisa grandiosa. Penso que podemos superar os gregos e atingir qualquer coisa. E vou tentar defender hoje apenas um ponto: que o acesso universal a todo o saber está ao nosso alcance. Assim, se for bem-sucedido, vocês sairão daqui a pensar: "Sim, podemos concretizar a grande visão "de que tudo o que tenha sido publicado, "tudo o que tenha sido pensado para ser distribuído, "esteja ao dispor de todos os que desejem ter-lhe acesso".
Yes, there's issues about how money should be distributed, and that's still being refigured out. But I'd say there's plenty of money, and there's plenty of demand, so we can actually achieve that. But I'm going to go over the technological, social and sort of where are we as a whole, trying to get to that particular vision. And the way I'm going to try to do this is do it like the Amazon.com website, the books, music, video and just go step -- media type by media type, just go and say, all right, how're we doing on this?
Há problemas quanto à forma como o dinheiro deve ser distribuído e isso ainda tem que ser revisto. Mas eu afirmo que há dinheiro suficiente, e há procura suficiente, por isso, podemos lá chegar. Mas eu vou falar dos aspetos tecnológicos e sociais e da nossa situação atual, como um todo. em relação a esta visão. Vou tentar fazê-lo como o website Amazon.com: os livros, a música, os vídeos, cada tipo de "media", um por um. e dizer: "Então, que tal estamos?"
So if we start with books, you know, sort of where are we? Well, first you have to, as an engineer, scope the problem. How big is it? If you wanted to put all of the published works online so that anybody could have it available, well, how big a problem is it? Well, we don't really know, but the largest print library in the world is the Library of Congress. It's 26 million volumes, 26 million volumes. It is, by far and away, the largest print library in the world. And a book, if you had a book, is about a megabyte, so -- you know, if you had it in Microsoft Word. So a megabyte, 26 million megabytes is 26 terabytes -- it goes mega-, giga-, tera-. 26 terabytes. 26 terabytes fits in a computer system that's about this big, on spinning Linux drives, and it costs about 60,000 dollars. So for the cost of a house -- or around here, a garage -- you can put, you can have spinning all of the words in the Library of Congress. That's pretty neat.
Assim, se começarmos pelos livros, onde estamos? Primeiro, como um engenheiro, o âmbito do problema. Qual a sua dimensão? Se quisermos colocar na Internet todos os trabalhos publicados para os tornar acessíveis a todos. qual a dimensão deste problema? Não sabemos bem, mas a maior biblioteca do mundo é a Biblioteca do Congresso dos EUA — são 26 milhões de volumes. É de longe a maior biblioteca de textos impressos no mundo. Um livro representa cerca de um megabyte, em formato de texto no Microsoft Word. Assim, 26 milhões de megabytes ou seja, 26 terabytes, — mega, giga, tera — 26 terabytes. 26 terabytes cabem num computador Linux deste tamanho, com discos rígidos e custa mais ou menos 60 000 dólares Assim, pelo custo de uma casa — nos subúrbios, de uma garagem — podemos pôr em discos rígidos todos os textos da Biblioteca do Congresso. É muito simples.
Then the question is, what do you get? You know, is it worth trying to get there? Do you actually want it online? Some of the first things that people do is they make book readers that allow you to search inside the books, and that's kind of fun. And you can download these things, and look around them in new and different ways. And you can get at them remotely, if you happen to have a laptop. There's starting to be some of these sort of page turn-y interfaces that look a whole lot like books in certain ways, and you can search them, make little tabs, and it's kind of cute -- still very book-like -- on your laptop. But I don't know, reading things on a laptop -- whenever I pull up my laptop, it always feels like work. I think that's one of the reasons why the Kindle is so great. I don't have to feel like I'm at work to read a Kindle. It's starting to be a little bit more specified. But I have to say that there's older technologies that I tend to like. I like the physical book. And I think we can go and use our technology to go and digitize things, put them on the Net, and then download, print them and bind them, and end up with books again.
Então a pergunta é: O que é que obtemos? Valerá a pena tentar fazer isso? Queremos isso na Internet? Uma das primeiras coisas que as pessoas fazem é marcadores de livros o que lhes permite pesquisar nos livros e isso é divertido. Podemos descarregá-los e dar uma olhadela de um modo novo e diferente. Podemos aceder-lhes à distância, se tivermos um portátil. Já estão a aparecer interfaces eletrónicos de virar as páginas que, de certa maneira, se assemelham a livros, podemos fazer pesquisas, criar separadores, é simpático — muito semelhante a um livro — no portátil. Mas não sei... ler coisas num portátil... Sempre que puxo do meu portátil parece-me ser trabalho. É uma das razões por que penso que o Kindle é muito bom. Não fico com a impressão de trabalhar quando leio num Kindle, torna-se um pouco mais específico. Mas devo dizer que prefiro algumas tecnologias mais antigas. Eu gosto do livro físico. E penso que podemos usar a tecnologia para digitalizar as coisas colocá-las na rede e depois descarregar, imprimir e encadernar e voltar a ter livros.
And we sort of said, well, how hard is this? And it turns out to not be very hard. We actually went off to make a bookmobile. And a bookmobile -- the size of a van with a satellite dish, a printer, binder and cutter, and kids make their own books. It costs about three dollars to download, print and bind a normal, old book. And they actually come out kind of nice looking. You can actually get really good-looking books for on the order of one penny per page, sort of the parts cost for doing this.
E pensámos: "Será muito difícil?" Verifica-se que não é muito difícil. Começámos a fazer um "livromóvel". Um "livromóvel" — do tamanho de uma carrinha, com antena impressora e encadernadora e os miúdos fazem os seus livros. Custa cerca de 3 dólares descarregar, imprimir e encadernar um livro normal. No final, eles ficam com bom aspeto. Podemos obter livros com muito bom aspeto com um custo da ordem de 10 cêntimos por página, o preço dos componentes.
So the idea of -- this technology actually may end up putting books back in people's hands again. There are some other bookmobiles running around. This is Eric Eldred making books at Walden Pond -- Thoreau's works. This is just before he got kicked out by the Parks Services, for competing with the bookstore there. In India, they've got another couple bookmobiles running around. And this is the opening day at the Library of Alexandria, the new Library of Alexandria, in Egypt. It was quite popularly attended. And kids starting to make their own books, and a happy kid with the first book that he's ever owned. So the idea of being able to use this technology to end up with paper where I can handle sort of sounds a little retro, but I think it still has its place. And being from the Silicon Valley, sort of utopian sort of world, we thought, if we can make this technology work in rural Uganda, we might have something. So we actually got some funding from the World Bank to try it out. And we found in about 30 days we could go and take a couple folks from Silicon Valley, fly them to Uganda, buy a car, set up the first Internet connection at the National Library of Uganda, figure out what they wanted, and get a program going making books in rural Uganda. And it actually -- so technologically, it works.
Assim, a ideia desta tecnologia poderá acabar por pôr os livros de novo nas mãos das pessoas. Já há alguns "livrosmóveis" por aí. Este é Eric Eldred a fazer livros em Walden Pond, obras de Thoreau. Isto foi imediatamente antes de ser despedido da Parks Services por competir com a livraria deles. Na Índia há mais uns quantos "livrosmóveis" a circular. Aqui é no dia da inauguração da Biblioteca de Alexandria, da nova Biblioteca de Alexandria, no Egito. Foi muito visitado. As crianças começam a fazer os seus livros. Este é um miúdo contente com o primeiro livro que teve. A ideia de poder usar esta tecnologia para voltar ao papel, que posso manejar, parece um pouco retrógrada, mas penso que ainda tem o seu lugar. Como se viesse de Silicon Valley, mais ou menos uma utopia, e — mais ou menos — do mundo, Se fosse possível pôr em prática esta tecnologia no Uganda rural, teríamos algo de valor. Assim, obtivemos fundos do Banco Mundial para experimentar. E descobrimos, em cerca de 30 dias, que podíamos obter gente de Silicon Valley, enviá-las para o Uganda, comprar um carro, e fazer a primeira ligação da Internet na Biblioteca Nacional do Uganda, saber o que desejavam, e pôr em movimento um programa para produção de livros no Uganda rural. E, de facto, funciona tecnologicamente.
What we found out of this is we didn't have the right books. So the books were in the library. We could get it to people, if they're digitized, but we didn't know how to quite get them digitized. Everybody thought the answer is, send things to India and China. And so we've tried that, and I'll go over that in a moment. There are some newer technologies for delivering that have happened that are actually quite exciting as well. One is a print-on-demand machine that looks like a Rube Goldberg machine. We have one of these things now. It's completely cool. It's all conveyor belt, and it makes a book. And it's called the "Espresso Book Machine," and in about 10 minutes, you can press a button and make a book.
Mas descobrimos que não tínhamos os livros certos. Os livros estavam na biblioteca. Podíamos levá-los se fossem digitalizados, mas não sabíamos como os digitalizar. Todos pensavam que seria preciso enviá-los para a Índia ou para a China. Tentámos isso — já volto a falar nisso. Há novas tecnologias para permitir que isto aconteça. que também são muito agradáveis. Uma é uma impressora a pedido que parece a máquina de Rube Goldberg. Temos uma dessas agora. É muito boa. É como uma linha de montagem com tapete rolante que faz um livro. Chama-se a "Máquina Expresso de Livros." Carregamos num botão e, em cerca de 10 minutos, faz um livro.
Something else I'm quite excited about in this particular domain, beyond these sort of kiosk-y things where you can get books on demand, is some of these new little screens that are coming out. And one of my favorites in this is the $100 laptop. And I don't mean to steal any thunder here, but we've gone and used one of these things to be an e-book reader. So here's one of the beta units and you can -- it actually turns out to be a really good-looking e-book reader. And we have a quick hack that we did to try to put one of our books on it, and it turns out that 200 dots per inch means that you can put scanned books on them that look really good. At 200 dots per inch, it's kind of the equivalent of a 300 dot print laser printer. We're in good enough shape. You actually can go and read scanned books quite easily.
Outra coisa que me entusiasma nesta área em particular, para além duma espécie de quiosques onde se podem obter livros a pedido, são alguns dos pequenos "tablets" que estão a aparecer. Um dos meus favoritos é o "tablet" dos 100 dólares. Não tenho a intenção de levantar polémicas aqui, mas usámos uma destas coisas para leitor de e-books. Esta é uma das unidades beta e veio a ser um leitor de e-book muito bem parecido. Usámos um truque rápido para colocarmos nele um dos nossos livros e descobrimos que 200 pontos por polegada significa que podemos colocar aqui livros digitalizados que ficam nítidos. A 200 pontos por polegada, é o equivalente a impressão laser a 300 pontos. Não é nada mal. Podemos ler livros digitalizados muito facilmente.
So the idea of electronic books is starting to come about. But how do you go about doing all this scanning? So we thought, okay, well, let's try out this send books to India thing. And there was a project with, funded by the National Science Foundation -- sent a bunch of scanners, and the American libraries were supposed to send books. Well, they didn't. They didn't want to send their books. So we bought 100,000 books and sent them to India. And then we learned why you don't want to send books to India. The lesson we learned out of this is, scan your own books. If you really care about books, you're going to scan them better, especially if they're valuable books. If they're new books and you can just, you know, butcher them, because you could just buy another one, that's not such a big deal in terms of doing high-quality scanning. But do things that you love. But the Indians have been scanning a lot of their own books -- about 300,000 now -- doing very well. The Chinese did over a million, and the Egyptians are about 30,000.
Assim, começou a surgir a ideia dos livros eletrónicos. Mas como fazer toda essa digitalização? Pensámos tentar o envio de livros para a Índia. Então apareceu um projeto financiado pela Fundação Nacional de Ciência, que enviou uma série de digitalizadores. As bibliotecas americanas ficaram de enviar livros mas não o fizeram — não quiseram enviar os livros. Assim, comprámos 100 000 livros para enviar para a Índia. Depois percebemos porque não queriam enviar livros para a Índia. A lição que aprendemos foi digitalizarmos os nossos livros. Se temos carinho por livros, iremos digitalizá-los melhor, especialmente se forem livros de valor. Se forem livros novos podemos despedaçá-los porque podemos comprar mais um. Não se compara, em termos de fazer uma digitalização de alta qualidade. Mas devemos fazer uma coisa de que gostemos. Mas os indianos têm digitalizado muitos dos seus livros — já vão nuns 300 000 agora — e fazem-no muito bem. Os chineses mais de um milhão e os egípcios cerca de 30 000.
But we sent -- thought, OK, if we're going to need to do this, let's do it in-library. How do we go and do this, and how do we get it down so that it's a cost point that we could afford? And we sort of picked the price point of 10 cents a page. If it's basically the cost of xeroxing to basically digitize, OCR, package it up, make it so that you could download, print and bind it -- the whole shebang -- we would have achieved something. So we started out trying to figure out. How do we get to 10 cents? And we tried these robot things, and they worked pretty well -- sort of these auto-page-turning things. If we can have Mars Rovers, you'd think you could turn pages. But it actually turns out to be pretty hard to turn pages, and the volume isn't there. So anyway -- so we ended up making our own book scanner, and with two digital, high-grade, professional digital cameras, controlled museum lighting, so even if it's a black and white book, you can go and get the proper intonation. So you basically do a beautiful, respectful job. This is not a fax, this is -- the idea is to do a beautiful job as you're going through these libraries. And we've been able to achieve 10 cents a page if we run things in volume. This is what it looks like at the University of Toronto. And actually, it turns out to, you know, pay a living wage. People seem to love it. Yes, it's a little boring, but some people kind of get into the Zen of it. (Laughter) And especially if it's kind of interesting books that you care about, in languages that you can read. We actually have been able to do a pretty good job of this, at getting 10 cents a page. So 10 cents a page, 300 pages in your average book, 30 dollars a book. The Library of Congress, if you did the whole darn thing -- 26 million books -- is about 750 million dollars, right? But a million books, I think, actually would be a pretty good start, and that would cost 30 million dollars. That's not that big a bill.
Mas, se necessitarmos de fazer isto façamo-lo na biblioteca. Como fazê-lo, e como fazê-lo a baixo custo de modo a ter um preço que possamos pagar? Calculámos o custo da página em cerca de 10 cêntimos Se custasse o mesmo que uma fotocópia, — a digitalização ótica e a embalagem — descarregar, imprimir e encadernar — o conjunto completo — tínhamos conseguido uma coisa boa. Começámos a tentar ver como chegar aos 10 cêntimos? Experimentámos estes robôs e funcionavam bem uma coisa que vira as páginas automaticamente. Se podemos ter veículos em Marte, pensamos que podemos virar páginas. Mas é muito difícil virar páginas e o volume é baixo. Assim, acabámos por fazer o nosso digitalizador de livros. com duas câmaras digitais de alta qualidade profissional, iluminação de museu — mesmo que seja um livro a preto e branco, podemos obter a tonalidade adequada. Fundamentalmente faz um trabalho bonito e correto. Isto não é um fax — a ideia é fazer um trabalho maravilhoso, à medida que atravessamos estas bibliotecas. Conseguimos chegar aos 10 cêntimos por página, se executado em quantidade. Este é o aspeto na Universidade de Toronto. E no final, revelou-se que resulta num salário razoável para viver. As pessoas parecem gostar disto. É um pouco monótono, mas há pessoas que entram no Zen com isto. (Risos) Especialmente se for um livro interessante, pelo qual temos carinho, em línguas em que os possamos ler. Fizemos um bom trabalho para obter os 10 cêntimos por página, Assim, 10 cêntimos por página, 300 páginas, em média, por livro, são 30 dólares por livro. Se fizermos toda a Biblioteca do Congresso — 26 milhões de livros — é cerca de 750 milhões de dólares, correto? Mas penso que um milhão de livros seria um bom início, e isso custaria 30 milhões de dólares, não é uma grande fatura.
And what we've been able to do is get into libraries. We've now got eight of these scanning centers in three countries, and libraries are up for having their books scanned. The Getty here is moving their books to the UCLA, which is where we have one these scanning centers, and scanning their out-of-copyright books, which is fabulous. So we're starting to get the institutional responsibility. The thing we're missing is the 10 cents. If we can get the 10 cents, all the rest of it flows. We've scanned about 200,000 books. Now we're scanning about 15,000 books a month, and it's starting to gear up another factor of two from there.
Temos conseguido entrar nas bibliotecas. Já há oito destes centros de digitalização em três países, e as bibliotecas estão disponíveis para a digitalização dos seus livros. A Getty está a mudar os seus livros para a UCLA, que é um dos locais onde temos um destes centros de digitalização, e digitalizamos os livros deles, livres de direitos de autor, o que é fabuloso. Estamos a adquirir responsabilidade institucional. O que nos falta são os 10 cêntimos. Se pudermos obter os 10 cêntimos o resto avança por si próprio. Já digitalizámos cerca de 200 000 livros. Estamos a digitalizar cerca de 15 000 livros por mês, e vamos começar a fazer o dobro a partir daí.
So all in all, that's going very well. And we're starting to move out of the just out-of-copyright into the out-of-print world. So I think of -- we're kind of going from the out-of-copyright, library stuff, and Amazon.com is coming from the in-print world. And I think we'll meet in the middle some place, and have the classic thing that you have, which is a publishing system and a library system working in parallel. And so we're starting up a program to do out-of-print works, but loaning them. Exactly what loaning means, I'm not quite sure. But anyway, loaning out-of-print works from the Boston Public Library, the Woods Hole Oceanographic Institute and a few other libraries that are starting to participate in this program, to try out this model of where does a library stop and where does the bookstore take over. So all in all, it's possible to do this in large scale. We're also going back over microfilm and getting that online. So, we can do 10 cents a page, we're going 15,000 books a month and we've got about 250,000 books online, counting all the other projects that are starting to add in. So what I wanted to argue is, books are within our grasp. The idea of taking on the whole ball of wax is not that big a deal. Yes, it costs tens of millions, low hundreds of millions, but one time shot and we've got basically the history of printed literature online. And then, there's business model issues about how to try to effectively market it and get it to people. But it is within our grasp, technologically and law-wise, at least for the out of print and out of copyright, we suggest, to be able to get the whole darn thing online.
Em suma, está a ir muito bem. Começamos a mover-nos, para lá das obras livres de direitos de autor, para o mundo das obras que já não estão a ser impressas. Estamos como que a partir dos livros de domínio público e a Amazon.com está a vir do mundo das edições impressas. Acho que nos iremos encontrar algures no meio e chegar ao sistema clássico, um sistema de publicação e um sistema de biblioteca em paralelo. Estamos a começar um programa para fazer obras fora de impressão mas emprestamo-las. — não sei bem se empréstimo é o termo exato — mas emprestamos obras fora da impressão da Biblioteca Pública de Boston, do Instituto Oceanográfico de Woods Hole e de umas quantas outras bibliotecas que começam a participar neste programa, para experimentar este modelo de onde acaba uma biblioteca e onde começa a livraria. Tendo tudo em conta, é possível fazê-lo em grande escala. Estamos também a voltar ao microfilme e colocá-lo na Internet. Podemos fazer 10 cêntimos por página, 15 000 livros por mês e temos na Internet cerca de 250 000 livros. contando com todos os outros projetos que estão a começar a adicioná-los. Quero dizer, os livros estão ao nosso alcance. A ideia de ter tudo não é um grande problema. Sim, custa dezenas de milhões, poucas centenas de milhões, mas basta uma ação concertada e ficamos com a História da literatura impressa guardada na Internet. Depois vêm os problemas dos modelos de negócio. Como comercializá-los e fazer com que as pessoas lhes cheguem. Mas encontram-se ao nosso alcance, em termos tecnológicos e jurídicos, pelo menos para obras fora de impressão e livre de direitos de autor. A nossa proposta é conseguirmos pôr na Internet a totalidade das obras.
Now let's go for audio, and I'm going to go through these. So how much is there? Well, as best we can tell, there are about two to three million disks having been published -- so 78s, long-playing records and CDs -- or at least that's the largest archives of published materials we've been able to sort of point at. It costs about 10 dollars a piece to go and take a disk and put it online, if you're doing things in volume. But we've found that the rights issues are really quite thorny. This is a fairly heavily litigated area, so we've found that there are niches in the music world that aren't served terribly well by the classic commercial publishing system. And we've been starting to make these available by going and offering shelf space on the Net. In the United States, it doesn't cost you to give something away. Right? If you give something to a charity or to the public, you get a pat on the back and a tax donation -- except on the Net, where you can go broke. If you put up a video of your garage band, and it starts getting heavily accessed, you can lose your guitars or your house.
Agora passemos ao áudio. Quantas obras áudio é que há? Tanto quanto sabemos, há cerca de 2 a 3 milhões de discos que foram publicados — sejam 78 rotações, LP e CDs — pelo menos, são os maiores arquivos de materiais publicados que conseguimos descobrir até agora. Custa cerca de 10 dólares, pegar num disco e colocá-lo na Internet, se for feito em quantidade. Mas descobrimos que as questões dos direitos são extremamente complexas. É uma área fortemente litigiosa. Descobrimos que há nichos no mundo da música que não são bem servidos pelo sistema clássico de publicação comercial E começámos a tornar isto disponível oferecendo espaço de prateleira na rede. Nos EUA não custa dar uma coisa. Certo? Se eu der alguma coisa para beneficência... ou ao público recebo uma palmadinha nas costas e uma redução de imposto exceto na rede, onde podemos ir à falência. Se colocarmos um vídeo da banda de garagem e ele começar a ser visto intensamente, podemos perder a guitarra ou a casa.
This doesn't make any sense. So we've offered unlimited storage, unlimited bandwidth, forever, for free, to anybody that has something to share that belongs in a library. And we've been getting a lot of takers. One is the rock 'n' rollers. The rock 'n' rollers had a tradition of sharing, as long as nobody made any money. You could -- concert recordings, it's not the commercial recordings, but concert recordings, started by the Grateful Dead. And we get about two or three bands a day signing up. They give permission, and we get about 40 or 50 concerts a day. We have about 40,000 concerts, everything the Grateful Dead ever did, up on the Net, so that people can see it and listen to this material. So audio is possible to put up, but the rights issues are really pretty thorny. We've got a lot of collections now -- a couple hundred thousand items -- and it's growing over time.
Isso não faz qualquer sentido. Assim, oferecemos armazenamento ilimitado e banda ilimitada, para sempre, de borla, a qualquer entidade que tenha algo a partilhar que deva estar numa biblioteca. Temos tido muita gente a aderir. Uns são os "rock 'n rollers". Os "rock 'n rollers" têm uma tradição de partilha, desde que ninguém ganhe dinheiro com isso — são as gravações ao vivo, não as gravações comerciais — a começar pelos Grateful Dead. Temos duas ou três bandas por dia, a inscreverem-se. Elas dão autorização e nós obtemos 40 a 50 concertos por dia. Temos na rede cerca de 40 000 concertos, tudo o que os Grateful Dead fizeram, de modo a que as pessoas possam ver e ouvir estes materiais. É possível pôr o áudio, mas os direitos são uma coisa muito complexa. Já temos muitas coleções — cerca de cem mil artigos e está a aumentar.
Moving images: if you think of theatrical releases, there are not that many of them. As best we can tell, there are about 150,000 to 200,000 movies ever that are really meant for a large-scale theatrical distribution. It's just not that many. But half of those were Indian. But anyway, it's doable, but we've only found about a thousand of these things that -- to be out of copyright. So we've digitized those and made those available. But we've found that there's lots of other types of movies that haven't really seen the light of day -- archival films. We've found, also, a lot of political films, a lot of amateur films, all sorts of things that are basically needing a home, a permanent home. So we've been starting to make these available and it's grown to be very popular. We're not quite a YouTube. We tended towards longer-term things and also things that people can reuse and make into new movies, which has just been great fun.
Imagens em movimento. Se pensarmos em filmes para cinema, não há muitos. Tanto quanto sabemos, há cerca de 150 000 a 200 000 filmes que foram feitos para distribuição em grande escala. Não são muitos. Mas metade deles são indianos. De qualquer modo, é possível fazer, mas só encontrámos um milhar destas obras livres de direitos de autor. Já digitalizámos e disponibilizámos essas obras. Descobrimos que há muitos outros tipos de filmes que não viram a luz do dia — filmes de arquivo. Descobrimos também filmes políticos, muitos filmes amadores, todo o tipo de coisas que necessitam de uma casa, uma casa permanente. Começamos a disponibilizá-los e tornaram-se muito populares. Não somos um YouTube, tendemos para coisas de longo prazo e coisas que as pessoas possam reutilizar e fazer em novos filmes, o que tem sido muito divertido.
Television comes quite a bit larger. We started recording 20 channels of television 24 hours a day. It's sort of the biggest TiVo box you've ever seen. It's about a petabyte, so far, of worldwide television -- Russian, Chinese, Japanese, Iraqi, Al Jazeera, BBC, CNN, ABC, CBS, NBC -- 24 hours a day. We only put one week up, which is mostly for cost reasons, which is the 9/11, sort of from 9/11/2001. For one week, what did the world see? CNN was saying that Palestinians were dancing in the streets. Were they? Let's look at the Palestinian television and find out. How can we have critical thinking without being able to quote and being able to compare what happened in the past? And television is dreadfully unrecorded and unquotable, except by Jon Stewart, who does a fabulous job. So anyway, television is, I would suggest, within our grasp. So 15 dollars per video hour, and also about 100 dollars to 150 dollars per celluloid hour, we're able to go and get materials online very inexpensively and have them up on the Net. And we've got, now, a lot of these materials. So we've got about 100,000 pieces up there. So books, music, video, software. There's only 50,000 titles of it. Mostly the issues there are legal issues and breaking copy protections. But we've worked through some of those, but we've still got real problems in Washington.
A televisão é muito maior. Começámos a gravar 20 canais de televisão 24 horas por dia. É a maior TiVo box que já se viu. Até agora, tem cerca de um petabyte de televisão de todo o mundo — russa, chinesa, japonesa, iraquiana, Al Jazeera, BBC, CNN, ABC, CBS, NBC — 24 horas por dia. Só colocámos uma semana principalmente por razões de custo. Foi a semana do 11 de Setembro Tipo: "11 de Setembro de 2001: uma semana. O que é que o mundo viu?" A CNN disse que os palestinos estavam a dançar nas ruas. Estariam? Dançaram? Vejamos a televisão palestina para o verificar. Como é que podemos ter pensamento crítico se não pudermos citar e não pudermos comparar o que sucedeu no passado? A televisão tem imensas falhas de gravação e é impossível de ser citada, à exceção de o Jon Stewart que faz um trabalho fabuloso. De qualquer modo, a televisão está ao nosso alcance. Por 15 dólares por hora de vídeo e uns 100 a 150 dólares por hora de filme, podemos obter e colocar materiais na Internet a baixo custo e tê-los na rede. E agora temos muitos destes materiais. Temos cerca de 100 000 peças. Assim, livros, música, vídeo, software — só há só 50 000 títulos deste. A maior parte dos problemas são problemas jurídicos e quebra de esquemas de proteção anti-cópia. Estamos a trabalhar nalguns destes,
Well, we're best known as the World Wide Web. We've been archiving the World Wide Web since 1996. We take a snapshot of every website and all of the pages on it, every two months. And actually, it's really been pioneered by Alexa Internet, which donates this collection to the Internet Archive. And it's been growing along for the last 11 years, and it's a fantastic resource. And we've made a Wayback Machine that you can then go and see old websites kind of the way they were. If you go and search on something -- this is Google.com, the different versions of it that we have, this is what it looks like when it was an alpha release, and this is what it looked like at Stanford. So anyway, you've got basically an idea of where things came from. Mostly, people want to see their old stuff out of this. If there's one thing that we want to learn from the Library of Alexandria version one, which is probably best known for burning, is, don't just have one copy. So we've started to -- we've made another copy of all of this and we actually put it back in the Library of Alexandria. So this is a picture of the Internet Archive at the Library of Alexandria. And we now have also another copy building up in Amsterdam. So, we should put it in the San Andreas Fault Line in San Francisco, flood zone in Amsterdam and in the Middle East. Right, so anyway ... so we're hedging our bets here. If we go and put it in a couple more places, I think we'll be in good shape.
mas ainda temos problemas reais em Washington. Somos mais conhecidos como a World Wide Web. Arquivamos a World Wide Web desde 1996. Tiramos uma imagem de cada website e de todas as suas páginas, de dois em dois meses. Quem começou isto foi Alexa Internet, que doou esta coleção ao Internet Archive. Foi crescendo ao longo dos últimos 11 anos e é um recurso fantástico. Concebemos uma "máquina de retrocesso" a que podemos aceder para visitar sites antigos no estando em que estavam. Se lá forem pesquisar, isto é a Google.com com as diferentes versões que temos. Este é o seu aspeto numa versão Alpha e este o seu aspeto em Stanford. Ou seja, temos uma ideia base de como as coisas apareceram. A maior parte das pessoas quer as suas obras antigas fora disto. Se há uma coisa que queremos aprender com a Biblioteca de Alexandria versão um, que é mais bem conhecida por ter sido queimada, é não mantermos só uma cópia. Fizemos outra cópia de tudo isto e devolvemo-la à Biblioteca de Alexandria. Esta é a imagem do arquivo da Internet na Biblioteca de Alexandria E agora está a ser feita outra cópia em Amesterdão Devíamos colocá-la na Falha de Santo André em São Francisco, (Risos) na zona de inundação em Amesterdão e no Médio Oriente. (Risos) Estamos a repartir as nossas apostas aqui. Se as colocarmos em locais adicionais, penso que estaremos bem.
There's a political and social question out of this. Is all of this, as we go digital, is it going to be public or private? There's some large companies that have seen this vision, that are doing large-scale digitization, but they're locking up the public domain. The question is, is that the world that we really want to live in? What's the role of the public versus the private as things go forward? How do we go and have a world where we both have libraries and publishing in the future, just as we basically benefited as we were growing up? So universal access to all knowledge -- I think it can be one of the greatest achievements of humankind, like the man on the moon, or the Gutenberg Bible, or the Library of Alexandria. It could be something that we're remembered for, for millennia, for having achieved. And as I said before, I'll end with something that's carved above the door of the Carnegie Library. Carnegie -- one of the great capitalists of this country -- carved above his legacy, "Free to the People." Thank you very much.
Há uma questão política e social disto. À medida que vamos para o digital, isto irá para o público ou para o privado? Há grandes companhias que tiveram esta visão. Estão a digitalizar em grande escala, mas estão a bloquear o domínio público. A questão é: é esse o mundo em que desejamos viver? Qual o papel de público versus privado à media que as coisas evoluem? Que fazer para termos um mundo onde haja bibliotecas e também edições no futuro, tal como aquelas de que beneficiámos quando estávamos a crescer? Portanto, acesso universal a todo o conhecimento. Penso que poderá ser um dos grandes feitos da humanidade, tal como o homem na Lua, a Biblia de Gutenberg ou a Biblioteca de Alexandria. Poderá ser uma coisa pela qual seremos lembrados durante milénios, por termos realizado. Tal como disse antes, vou terminar com uma coisa que está gravada por baixo da porta da Biblioteca Carnegie. Carnegie — um dos grandes capitalistas deste país — gravou sobre a sua herança: "Entrada Livre para o Povo."