So, I lead a team at Google that works on machine intelligence; in other words, the engineering discipline of making computers and devices able to do some of the things that brains do. And this makes us interested in real brains and neuroscience as well, and especially interested in the things that our brains do that are still far superior to the performance of computers.
Coordeno uma equipe no Google que lida com I.A.; em outras palavras, a engenharia de fazer computadores e aparelhos capazes de criar coisas que o cérebro faz. E isso faz com que nos interessemos por cérebros reais e também por neurociência, e nos interessamos, principalmente, por coisas que nosso cérebro faz que ainda são muito superiores à performance dos computadores.
Historically, one of those areas has been perception, the process by which things out there in the world -- sounds and images -- can turn into concepts in the mind. This is essential for our own brains, and it's also pretty useful on a computer. The machine perception algorithms, for example, that our team makes, are what enable your pictures on Google Photos to become searchable, based on what's in them. The flip side of perception is creativity: turning a concept into something out there into the world. So over the past year, our work on machine perception has also unexpectedly connected with the world of machine creativity and machine art.
Historicamente, uma das áreas tem sido percepção, o processo pelo qual as coisas abstratas, sons e imagens, podem se tornar conceitos na mente. Isso é essencial para o nosso cérebro e também muito útil em um computador. Os algorítimos de percepção artificial, criados por nós, por exemplo, são o que permitem que suas fotos do Google Fotos sejam pesquisáveis, baseando-se no que há nelas. O oposto da percepção é a criatividade: transformar um conceito em algo lá fora, para o mundo. Então, ao longo do ano passado, nosso trabalho de percepção artificial também se uniu, inesperadamente, ao mundo da criatividade artificial e da arte digital.
I think Michelangelo had a penetrating insight into to this dual relationship between perception and creativity. This is a famous quote of his: "Every block of stone has a statue inside of it, and the job of the sculptor is to discover it." So I think that what Michelangelo was getting at is that we create by perceiving, and that perception itself is an act of imagination and is the stuff of creativity.
Acho que Michelangelo teve um insight profundo a respeito da relação entre percepção e criatividade. Esta é uma famosa citação dele: "Cada bloco de pedra tem uma escultura interna, e o trabalho do escultor é descobri-la." Então, penso que Michelangelo estava querendo dizer que nós criamos, através da percepção, e que a percepção por si é um ato de imaginação e é a tal da criatividade.
The organ that does all the thinking and perceiving and imagining, of course, is the brain. And I'd like to begin with a brief bit of history about what we know about brains. Because unlike, say, the heart or the intestines, you really can't say very much about a brain by just looking at it, at least with the naked eye. The early anatomists who looked at brains gave the superficial structures of this thing all kinds of fanciful names, like hippocampus, meaning "little shrimp." But of course that sort of thing doesn't tell us very much about what's actually going on inside.
O órgão que cria todo pensamento, percepção e imaginação, é certamente, o cérebro. E eu quero começar com um pouquinho de história sobre o que sabemos sobre cérebros. Porque, diferente do coração e dos intestinos, você não consegue falar muito sobre o cérebro só olhando pra ele, pelo menos a olho nu. Os primeiros anatomistas que observaram cérebros deram às estruturas superficiais todo tipo de nomes fantásticos, como hipocampo, significando "camarãozinho". Mas claro que esse tipo de coisa não nos diz muito sobre o que acontece lá dentro.
The first person who, I think, really developed some kind of insight into what was going on in the brain was the great Spanish neuroanatomist, Santiago Ramón y Cajal, in the 19th century, who used microscopy and special stains that could selectively fill in or render in very high contrast the individual cells in the brain, in order to start to understand their morphologies. And these are the kinds of drawings that he made of neurons in the 19th century.
A primeira pessoa que eu acho, que, de fato, desenvolveu algum insight sobre o que acontecia no cérebro foi o grande neuroanatomista espanhol, Santiago Ramón y Cajal, no século 19, usando microscópio e reagentes especiais, que puderam, seletivamente, preencher ou converter em contraste muito elevado, as células individuais do cérebro, para conseguir entender a morfologia delas. E estes são os tipos de desenhos que ele fez dos neurônios no século 19. Este é de um cérebro de pássaro.
This is from a bird brain. And you see this incredible variety of different sorts of cells, even the cellular theory itself was quite new at this point. And these structures, these cells that have these arborizations, these branches that can go very, very long distances -- this was very novel at the time. They're reminiscent, of course, of wires. That might have been obvious to some people in the 19th century; the revolutions of wiring and electricity were just getting underway. But in many ways, these microanatomical drawings of Ramón y Cajal's, like this one, they're still in some ways unsurpassed.
E vemos esta incrível variedade de diferentes tipos de células, até mesmo a própria teoria celular era recente nessa época. E estas estruturas, estas células que têm essas ramificações, que podem percorrer distâncias muito longas, tudo era novidade na época. Elas são reminiscência de fios, claro. Isso pode ter sido óbvio para algumas pessoas no século 19; as revoluções de telefonia e eletricidade estavam apenas começando. Mas de muitas maneiras, esses desenhos microanatômicos do Ramón y Cajal, como este, ainda são, em alguns pontos, insuperáveis.
We're still more than a century later, trying to finish the job that Ramón y Cajal started. These are raw data from our collaborators at the Max Planck Institute of Neuroscience. And what our collaborators have done is to image little pieces of brain tissue. The entire sample here is about one cubic millimeter in size, and I'm showing you a very, very small piece of it here. That bar on the left is about one micron. The structures you see are mitochondria that are the size of bacteria. And these are consecutive slices through this very, very tiny block of tissue. Just for comparison's sake, the diameter of an average strand of hair is about 100 microns. So we're looking at something much, much smaller than a single strand of hair.
Ainda, depois de um século, estamos tentando concluir aquilo que Ramón y Cajal começou. Estes são dados brutos de nossos colaboradores no Instituto de Neurociência Max Planck. E nossos colaboradores estão representando partículas de tecido cerebral. Esta amostra tem aproximadamente um milímetro cúbico, e estou mostrando uma parte minúscula dela aqui. Aquela barra da esquerda tem em torno de um mícron. As estruturas que veem são mitocôndrias, que são do tamanho de uma bactéria. E estas são fatias consecutivas através deste minúsculo bloco de tecido. Apenas para efeito de comparação, o diâmetro de um fio médio de cabelo é de aproximadamente 100 microns. Então, estamos olhando para algo bem menor do que um simples fio de cabelo.
And from these kinds of serial electron microscopy slices, one can start to make reconstructions in 3D of neurons that look like these. So these are sort of in the same style as Ramón y Cajal. Only a few neurons lit up, because otherwise we wouldn't be able to see anything here. It would be so crowded, so full of structure, of wiring all connecting one neuron to another.
E a partir desses tipos de partículas microscópicas de elétrons de série, podemos começar a reconstruir neurônios em 3D, como estes. Estes são do mesmo estilo do Ramón y Cajal. Poucos neurônios destacaram-se, pois, caso contrário, não conseguiríamos ver nada aqui. Estaria lotado, muito cheio de estruturas, de neurônios comunicando-se entre si.
So Ramón y Cajal was a little bit ahead of his time, and progress on understanding the brain proceeded slowly over the next few decades. But we knew that neurons used electricity, and by World War II, our technology was advanced enough to start doing real electrical experiments on live neurons to better understand how they worked. This was the very same time when computers were being invented, very much based on the idea of modeling the brain -- of "intelligent machinery," as Alan Turing called it, one of the fathers of computer science.
Ramón y Cajal estava um pouco à frente de seu tempo, e o progresso do entendimento do cérebro seguiu lentamente através das décadas seguintes. Mas sabíamos que os neurônios usavam eletricidade e, na Segunda Guerra Mundial, a tecnologia avançou o suficiente para iniciar experimentos elétricos reais em neurônios vivos para entender melhor seu funcionamento. Isso ocorreu na mesma época da invenção dos computadores, muito baseado na ideia da modelagem cerebral, da "maquinaria inteligente", como foi chamada por Alan Turing, um dos pais da ciência da computação.
Warren McCulloch and Walter Pitts looked at Ramón y Cajal's drawing of visual cortex, which I'm showing here. This is the cortex that processes imagery that comes from the eye. And for them, this looked like a circuit diagram. So there are a lot of details in McCulloch and Pitts's circuit diagram that are not quite right. But this basic idea that visual cortex works like a series of computational elements that pass information one to the next in a cascade, is essentially correct.
Warren McCulloch e Walter Pitts observaram o desenho do córtex visual, de Ramón y Cajal, que estou mostrando aqui. Este é o córtex que processa as imagens captadas pelo olho. E, para eles, isto parecia um diagrama de circuito. Então há muitos detalhes no diagrama de McCulloch and Pitts que não estão muito certos, mas esta ideia básica de que o córtex visual trabalha como uma série de elementos computacionais que passam a informação, um para o outro, em cascata, está essencialmente correta.
Let's talk for a moment about what a model for processing visual information would need to do. The basic task of perception is to take an image like this one and say, "That's a bird," which is a very simple thing for us to do with our brains. But you should all understand that for a computer, this was pretty much impossible just a few years ago. The classical computing paradigm is not one in which this task is easy to do.
Vamos falar um pouco sobre o que um modelo para processar informações visuais precisaria fazer. A tarefa básica de percepção é levar uma imagem como esta e dizer: "É um pássaro", algo muito simples de se fazer com nosso cérebro. Mas vocês têm que entender que, para um computador, isso era praticamente impossível há alguns anos. O paradigma computacional clássico não é uma tarefa simples de ser realizada.
So what's going on between the pixels, between the image of the bird and the word "bird," is essentially a set of neurons connected to each other in a neural network, as I'm diagramming here. This neural network could be biological, inside our visual cortices, or, nowadays, we start to have the capability to model such neural networks on the computer. And I'll show you what that actually looks like.
O que está acontecendo entre os pixels, entre a imagem do pássaro e a palavra "pássaro", é sobretudo um grupo de neurônios conectados uns aos outros, em uma rede neural, conforme mostro aqui. Essa conexão neural poderia ser biológica, em nosso córtex visual, ou, atualmente, começamos a ter a capacidade de modelar tais conexões neurais no computador. Eu mostrarei com o que elas realmente se parecem.
So the pixels you can think about as a first layer of neurons, and that's, in fact, how it works in the eye -- that's the neurons in the retina. And those feed forward into one layer after another layer, after another layer of neurons, all connected by synapses of different weights. The behavior of this network is characterized by the strengths of all of those synapses. Those characterize the computational properties of this network. And at the end of the day, you have a neuron or a small group of neurons that light up, saying, "bird."
Vocês podem pensar nos pixels como uma primeira camada de neurônios, que, na verdade, é como atuam no olho, são os neurônios na retina. E eles alimentam camada por camada de neurônios, todas conectadas por sinapses de diferentes pesos. O comportamento dessa rede é caracterizado pelas forças de todas aquelas sinapses. Elas caracterizam as propriedades computacionais dessa rede. E, no final das contas, você tem um neurônio, ou um grupo de neurônios, que ativam-se, dizendo "pássaro".
Now I'm going to represent those three things -- the input pixels and the synapses in the neural network, and bird, the output -- by three variables: x, w and y. There are maybe a million or so x's -- a million pixels in that image. There are billions or trillions of w's, which represent the weights of all these synapses in the neural network. And there's a very small number of y's, of outputs that that network has. "Bird" is only four letters, right? So let's pretend that this is just a simple formula, x "x" w = y. I'm putting the times in scare quotes because what's really going on there, of course, is a very complicated series of mathematical operations.
Agora, representarei essas três coisas: a entrada de pixels e as sinapses na rede neural, e o pássaro, a saída, através de três variáveis: x, w e y. Há um milhão ou mais de x, um milhão de pixels nesta imagem. Há bilhões ou trilhões de w, que representam o peso de todas estas sinapses na rede neural. E há um número muito pequeno de y, de saídas que essa rede tem. "Pássaro" tem sete letras, certo? Então, vamos imaginar que esta seja apenas uma fórmula simples: x "x" w = y. O sinal de multiplicação fica entre aspas, porque, na verdade, o que está acontecendo lá é uma série complicada de operações matemáticas.
That's one equation. There are three variables. And we all know that if you have one equation, you can solve one variable by knowing the other two things. So the problem of inference, that is, figuring out that the picture of a bird is a bird, is this one: it's where y is the unknown and w and x are known. You know the neural network, you know the pixels. As you can see, that's actually a relatively straightforward problem. You multiply two times three and you're done. I'll show you an artificial neural network that we've built recently, doing exactly that.
É uma equação. Há três variáveis, e todos nós sabemos que se você tem uma equação, pode encontrar uma variável, se souber os outros dois termos. Então, o problema de inferência, de entender que aquela figura de um pássaro é um pássaro, é este: na qual y é desconhecido, mas w e x são conhecidos. Conhecendo a rede neural, você conhece os pixels. Como podem ver, é um problema relativamente simples. Você multiplica duas vezes três e pronto. Mostrarei uma rede artificial de neurônios que criamos recentemente fazendo exatamente isso.
This is running in real time on a mobile phone, and that's, of course, amazing in its own right, that mobile phones can do so many billions and trillions of operations per second. What you're looking at is a phone looking at one after another picture of a bird, and actually not only saying, "Yes, it's a bird," but identifying the species of bird with a network of this sort. So in that picture, the x and the w are known, and the y is the unknown. I'm glossing over the very difficult part, of course, which is how on earth do we figure out the w, the brain that can do such a thing? How would we ever learn such a model?
Isto está passando em tempo real em um celular, e é, claro, surpreendente por si só, que celulares possam fazer bilhões e trilhões de operações por segundo. Vocês estão olhando para um celular vendo uma imagem de pássaro após a outra, e, na verdade, não só dizendo: "Sim, é um pássaro", mas identificando a espécie do pássaro com uma rede deste tipo. Nesta imagem, o x e o w são conhecidos e o y é desconhecido. Estou encobrindo a parte mais difícil, que é como descobrimos o w, o cérebro que pode fazer tal coisa? Como aprenderíamos tal modelo?
So this process of learning, of solving for w, if we were doing this with the simple equation in which we think about these as numbers, we know exactly how to do that: 6 = 2 x w, well, we divide by two and we're done. The problem is with this operator. So, division -- we've used division because it's the inverse to multiplication, but as I've just said, the multiplication is a bit of a lie here. This is a very, very complicated, very non-linear operation; it has no inverse. So we have to figure out a way to solve the equation without a division operator. And the way to do that is fairly straightforward. You just say, let's play a little algebra trick, and move the six over to the right-hand side of the equation. Now, we're still using multiplication. And that zero -- let's think about it as an error. In other words, if we've solved for w the right way, then the error will be zero. And if we haven't gotten it quite right, the error will be greater than zero.
Este processo de aprendizagem, de descobrir o w, se o resolvermos com a equação simples, na qual pensamos nestas variáveis como números, saberemos, exatamente, como resolvê-la: 6 = 2 x w, dividimos por dois e pronto. O problema é com este sinal. Usamos a divisão porque é o inverso da multiplicação, mas, como acabei de dizer, a multiplicação não deixa de ser uma mentira aqui. Esta é uma operação não-linear muito complicada; não existe o inverso. Então devemos encontrar uma forma de resolver a equação sem um sinal de divisão. E a forma de se fazer isso é razoavelmente fácil. Você diz: vamos fazer um truque de álgebra e mover o seis para a direita da equação. Agora, ainda temos uma multiplicação e aquele zero, vamos pensar nele como um erro. Em outras palavras, se acharmos o w da forma certa então o erro será zero. Se não conseguirmos isso da forma certa, o erro será maior do que zero. Agora podemos criar suposições para diminuir os erros,
So now we can just take guesses to minimize the error, and that's the sort of thing computers are very good at. So you've taken an initial guess: what if w = 0? Well, then the error is 6. What if w = 1? The error is 4. And then the computer can sort of play Marco Polo, and drive down the error close to zero. As it does that, it's getting successive approximations to w. Typically, it never quite gets there, but after about a dozen steps, we're up to w = 2.999, which is close enough. And this is the learning process.
e é o tipo de coisa que computadores fazem muito bem. Na primeira suposição: e se w = 0? Bem, o erro será 6. E se w = 1? O erro será 4. E, então, o computador tentará adivinhar e diminuir o erro para próximo de zero. Enquanto isso ocorre, ele está obtendo sucessivas aproximações de w. Tipicamente, nunca se chega lá, mas depois de várias etapas, estamos próximos de w = 2,999, o que é bem próximo. E esse é o processo de aprendizagem.
So remember that what's been going on here is that we've been taking a lot of known x's and known y's and solving for the w in the middle through an iterative process. It's exactly the same way that we do our own learning. We have many, many images as babies and we get told, "This is a bird; this is not a bird." And over time, through iteration, we solve for w, we solve for those neural connections.
Lembrem-se de que estamos pegando muitos x e y conhecidos e resolvendo o w no meio disso, através de um processo interativo. É exatamente assim que construímos nossa própria aprendizagem. Quando somos bebês nos mostram imagens e nos dizem: "Isso é um pássaro; isso não é um pássaro". Com o passar do tempo, através da interação, nós encontramos o w, encontramos essas conexões neurais.
So now, we've held x and w fixed to solve for y; that's everyday, fast perception. We figure out how we can solve for w, that's learning, which is a lot harder, because we need to do error minimization, using a lot of training examples.
Agora mantemos o valor de x e w para resolver y; isso acontece todo dia, percepção rápida. Compreendemos como achar w, isso é aprendizagem, o que é muito mais difícil, pois precisamos minimizar os erros, usando vários exemplos de treinamento.
And about a year ago, Alex Mordvintsev, on our team, decided to experiment with what happens if we try solving for x, given a known w and a known y. In other words, you know that it's a bird, and you already have your neural network that you've trained on birds, but what is the picture of a bird? It turns out that by using exactly the same error-minimization procedure, one can do that with the network trained to recognize birds, and the result turns out to be ... a picture of birds. So this is a picture of birds generated entirely by a neural network that was trained to recognize birds, just by solving for x rather than solving for y, and doing that iteratively.
Há aproximadamente um ano, Alex Mordvintsev, da nossa equipe, decidiu experimentar o que aconteceria se tentássemos encontrar x, conhecendo os valores de w e y. Em outras palavras, você sabe que isto é um pássaro, e já tem sua rede neural que treinou com pássaros, mas o que é a figura de um pássaro? Ocorre que, usando o mesmo procedimento de minimização de erros, pode-se fazer isso com a rede treinada para reconhecer pássaros e o resultado será... uma imagem de pássaros. Essa é uma imagem de pássaros totalmente gerada por uma rede neural, a qual foi treinada para reconhecer pássaros, apenas resolvendo x em vez de y, fazendo isso de forma interativa.
Here's another fun example. This was a work made by Mike Tyka in our group, which he calls "Animal Parade." It reminds me a little bit of William Kentridge's artworks, in which he makes sketches, rubs them out, makes sketches, rubs them out, and creates a movie this way. In this case, what Mike is doing is varying y over the space of different animals, in a network designed to recognize and distinguish different animals from each other. And you get this strange, Escher-like morph from one animal to another.
Aqui tem um outro exemplo divertido. Esse foi um trabalho de Mike Tyka, em nosso grupo, que ele chamou de "Desfile Animal". Faz lembrar um pouco obras de arte de William Kentridge, na qual ele faz desenhos e os apaga, sucessivamente, e cria um filme assim. Neste caso, Mike varia o y no espaço de diferentes animais, numa rede desenvolvida para reconhecer e distinguir diferentes animais. E você consegue essa estranha mudança de um animal para outro, estilo Escher.
Here he and Alex together have tried reducing the y's to a space of only two dimensions, thereby making a map out of the space of all things recognized by this network. Doing this kind of synthesis or generation of imagery over that entire surface, varying y over the surface, you make a kind of map -- a visual map of all the things the network knows how to recognize. The animals are all here; "armadillo" is right in that spot.
Aqui, Alex e ele, juntos, tentaram reduzir o y a um espaço de duas dimensões, fazendo assim um mapa fora do espaço de todas as coisas reconhecidas por essa rede. Fazendo esse tipo de síntese ou geração de imagem sobre essa superfície inteira, variando y sobre a superfície, você cria um mapa visual de todas as coisas que a rede consegue reconhecer. Todos os animas estão aqui; o tatu está bem naquele canto.
You can do this with other kinds of networks as well. This is a network designed to recognize faces, to distinguish one face from another. And here, we're putting in a y that says, "me," my own face parameters. And when this thing solves for x, it generates this rather crazy, kind of cubist, surreal, psychedelic picture of me from multiple points of view at once. The reason it looks like multiple points of view at once is because that network is designed to get rid of the ambiguity of a face being in one pose or another pose, being looked at with one kind of lighting, another kind of lighting. So when you do this sort of reconstruction, if you don't use some sort of guide image or guide statistics, then you'll get a sort of confusion of different points of view, because it's ambiguous. This is what happens if Alex uses his own face as a guide image during that optimization process to reconstruct my own face. So you can see it's not perfect. There's still quite a lot of work to do on how we optimize that optimization process. But you start to get something more like a coherent face, rendered using my own face as a guide.
Você também pode fazer isso com outras redes. Essa é uma rede criada para reconhecer faces, distinguir uma face de outra. E, aqui, colocamos um y que seria "eu", parâmetros da minha própria face. E quando essa rede encontra x, ela gera essa imagem doida, um estilo cubismo, surreal, uma figura psicodélica de mim a partir de múltiplos pontos de vista. A razão de parecer com múltiplos pontos de vista de uma só vez é porque a rede é criada para conseguir se livrar da ambiguidade de uma face em uma pose ou outra, sendo olhada com um tipo ou outro de luz. Então, quando faz esse tipo de reconstrução, se você não usar algum guia de imagem ou de estatística, pode ficar confuso, devido a diferentes pontos de vista, porque isso é ambíguo. Isto é o que acontece se Alex usar sua própria face como guia de imagem durante o processo de otimização para reconstruir minha face. Então, podem ver que não é perfeito. Ainda há muito trabalho a fazer sobre como otimizar aquele processo de otimização. Mas começa a ter algo como uma face coerente, acabando por usar minha própria face como guia.
You don't have to start with a blank canvas or with white noise. When you're solving for x, you can begin with an x, that is itself already some other image. That's what this little demonstration is. This is a network that is designed to categorize all sorts of different objects -- man-made structures, animals ... Here we're starting with just a picture of clouds, and as we optimize, basically, this network is figuring out what it sees in the clouds. And the more time you spend looking at this, the more things you also will see in the clouds. You could also use the face network to hallucinate into this, and you get some pretty crazy stuff.
Não é preciso começar com uma tela em branco ou com ruído branco. Quando se está resolvendo x, pode-se começar com um x, que, por si só, já é outra imagem. Isto é o que representa esta pequena demonstração. Isto é uma rede desenhada para categorizar todo tipo de diferentes objetos, criações humanas, animais... Aqui começamos apenas com uma figura de nuvens, e enquanto otimizamos, basicamente, esta rede está descobrindo o que se vê nas nuvens. E quanto mais você olha pra isso, mais coisas também verá nas nuvens. Poderia também usar a rede da face para ficar alucinado, então verá umas coisas muito loucas.
(Laughter)
(Risos)
Or, Mike has done some other experiments in which he takes that cloud image, hallucinates, zooms, hallucinates, zooms hallucinates, zooms. And in this way, you can get a sort of fugue state of the network, I suppose, or a sort of free association, in which the network is eating its own tail. So every image is now the basis for, "What do I think I see next? What do I think I see next? What do I think I see next?"
Mike fez algumas outras experiências, nas quais leva a imagem da nuvem, e ele alucina e aproxima, sucessivamente, e dessa forma, pode ter uma espécie de estado de fuga da rede, suponho, ou um tipo de associação livre, em que a rede morde sua própria cauda. Assim, toda imagem é base para a pergunta: "O que acho que verei agora? O que acho que verei agora? O que acho que verei agora?"
I showed this for the first time in public to a group at a lecture in Seattle called "Higher Education" -- this was right after marijuana was legalized.
Mostrei isso pela primeira vez em público, a um grupo, numa palestra em Seattle, chamado "Educação Maior"; isso aconteceu assim que a maconha foi legalizada.
(Laughter)
(Risos)
So I'd like to finish up quickly by just noting that this technology is not constrained. I've shown you purely visual examples because they're really fun to look at. It's not a purely visual technology. Our artist collaborator, Ross Goodwin, has done experiments involving a camera that takes a picture, and then a computer in his backpack writes a poem using neural networks, based on the contents of the image. And that poetry neural network has been trained on a large corpus of 20th-century poetry. And the poetry is, you know, I think, kind of not bad, actually.
Então, quero terminar logo, mencionando que esta tecnologia não está restrita. Mostrei a vocês exemplos puramente visuais porque são divertidos de se ver. Esta não é uma tecnologia exclusivamente visual. Nosso colaborador, Ross Goodwin, fez experiências envolvendo uma câmera que tira a foto, e aí, um computador na sua mochila, escreve um poema usando redes neurais, baseados nos conteúdos da imagem. E aquela poesia de rede neural tem sido treinada num grande corpus de poesia do século 20. E a poesia, na verdade, não é tão ruim, eu acho. (Risos)
(Laughter)
Para fechar,
In closing, I think that per Michelangelo, I think he was right; perception and creativity are very intimately connected. What we've just seen are neural networks that are entirely trained to discriminate, or to recognize different things in the world, able to be run in reverse, to generate. One of the things that suggests to me is not only that Michelangelo really did see the sculpture in the blocks of stone, but that any creature, any being, any alien that is able to do perceptual acts of that sort is also able to create because it's exactly the same machinery that's used in both cases.
acho que Michelangelo estava certo: percepção e criatividade estão intimamente ligadas. O que vimos são apenas redes neurais, que estão totalmente treinadas para discriminar ou reconhecer coisas diferentes no mundo, capazes de trabalhar em sentido contrário para produzir. Uma das coisas que me vem à cabeça é que não só Michelangelo viu a escultura nos blocos de pedra, mas qualquer criatura, qualquer ser, alienígena, que é capaz de fazer atos de percepção desse tipo, também é capaz de criar, porque é exatamente a mesma máquina usada nos dois casos.
Also, I think that perception and creativity are by no means uniquely human. We start to have computer models that can do exactly these sorts of things. And that ought to be unsurprising; the brain is computational.
Também penso que percepção e criatividade não são exclusivamente humanas. Temos modelos de computadores capazes de fazer justamente esse tipo de coisa, e não deveria ser surpreendente, pois o cérebro é computacional.
And finally, computing began as an exercise in designing intelligent machinery. It was very much modeled after the idea of how could we make machines intelligent. And we finally are starting to fulfill now some of the promises of those early pioneers, of Turing and von Neumann and McCulloch and Pitts. And I think that computing is not just about accounting or playing Candy Crush or something. From the beginning, we modeled them after our minds. And they give us both the ability to understand our own minds better and to extend them.
E finalmente, a computação começou como um exercício de planejar maquinaria inteligente. Foi muito pensado na ideia de como faríamos as máquinas ficarem inteligentes. E agora, estamos finalmente começando a cumprir algumas das promessas daqueles pioneiros, de Turing e Von Neumann, e McCulloch e Pitts. E acho que computação não é apenas números ou jogar Candy Crush ou algo assim. No começo, modelamos as máquinas segundo as nossas mentes. E elas nos dão tanto a habilidade de entender melhor nossa mente como de expandi-la.
Thank you very much.
Muito obrigado.
(Applause)
(Aplausos)