So, I lead a team at Google that works on machine intelligence; in other words, the engineering discipline of making computers and devices able to do some of the things that brains do. And this makes us interested in real brains and neuroscience as well, and especially interested in the things that our brains do that are still far superior to the performance of computers.
Dunque, sono a capo di un team di Google che lavora sull'intelligenza artificiale; in altre parole l'ingegneria che si occupa di creare computer ed altri dispositivi in grado di fare alcune delle cose che fa il cervello. E questo ci ha fatto interessare al cervello vero e alla neuroscienza, ed in particolare a quelle cose che fa il nostro cervello che sono di gran lunga superiori alle capacità dei computer.
Historically, one of those areas has been perception, the process by which things out there in the world -- sounds and images -- can turn into concepts in the mind. This is essential for our own brains, and it's also pretty useful on a computer. The machine perception algorithms, for example, that our team makes, are what enable your pictures on Google Photos to become searchable, based on what's in them. The flip side of perception is creativity: turning a concept into something out there into the world. So over the past year, our work on machine perception has also unexpectedly connected with the world of machine creativity and machine art.
Storicamente, una di queste aree è stata la percezione, il processo con cui le cose nel mod, suoni ed immagini, possono diventare concetti nella nostra mente. Questo è essenziale per il nostro cervello, ed è anche piuttosto utile per un computer. Gli algoritmi di percezione della macchina per esempio, elaborati dal nostro team, sono ciò che rende le vostre foto su Google Foto cercabili, in base a ciò che c'è nelle foto. L'altro lato della percezione è la creatività: trasformare un concetto in qualcosa che esiste nel mondo reale. Così l'anno scorso, il nostro lavoro sulla percezione delle macchine, ci ha inaspettatamente condotto al mondo della creatività nelle macchine e dell'arte nelle macchine.
I think Michelangelo had a penetrating insight into to this dual relationship between perception and creativity. This is a famous quote of his: "Every block of stone has a statue inside of it, and the job of the sculptor is to discover it." So I think that what Michelangelo was getting at is that we create by perceiving, and that perception itself is an act of imagination and is the stuff of creativity.
Penso che Michelangelo ebbe una profonda intuizione riguardo questa duplice relazione tra percezione e creatività. Questo è una sua famosa citazione: "Ogni blocco di pietra ha una statua dentro di sè ed è compito dello scultore scoprirla". Penso che quello che Michelangelo intendesse dire è che creiamo dalla percezione, e che la percezione stessa è un atto dell'immaginazione ed è qualcosa della creatività.
The organ that does all the thinking and perceiving and imagining, of course, is the brain. And I'd like to begin with a brief bit of history about what we know about brains. Because unlike, say, the heart or the intestines, you really can't say very much about a brain by just looking at it, at least with the naked eye. The early anatomists who looked at brains gave the superficial structures of this thing all kinds of fanciful names, like hippocampus, meaning "little shrimp." But of course that sort of thing doesn't tell us very much about what's actually going on inside.
L'organo che si occupa di pensare percepire ed immaginare naturalmente è il cervello. Vorrei cominciare con un breve resoconto sulla storia della nostra conoscenza del cervello. Perché a differenza, per esempio, del cuore o dell'intestino, non possiamo dire molto del cervello solo osservandolo, almeno ad occhio nudo. I primi anatomisti che studiarono il cervello diedero alle superficiali strutture di questa cosa nomi fantasiosi, come ippocampo, che significa "gamberetto". Ma naturalmente questo non ci dice molto su cosa realmente succede all'interno.
The first person who, I think, really developed some kind of insight into what was going on in the brain was the great Spanish neuroanatomist, Santiago Ramón y Cajal, in the 19th century, who used microscopy and special stains that could selectively fill in or render in very high contrast the individual cells in the brain, in order to start to understand their morphologies. And these are the kinds of drawings that he made of neurons in the 19th century.
Il primo che, credo, sviluppò davvero una qualche intuizione su cosa succedesse all'interno del cervello fu il grande neuroanatomista spagnolo Santiago Ramón y Cajal, nel XIX secolo, che utilizzò il microscopio e speciali tinture che potevano selettivamente riempire o risaltare in elevato contrasto le singole cellule del cervello, per iniziare a comprenderne la morfologia. E questi sono gli schizzi che fece dei neuroni nel XIX secolo.
This is from a bird brain. And you see this incredible variety of different sorts of cells, even the cellular theory itself was quite new at this point. And these structures, these cells that have these arborizations, these branches that can go very, very long distances -- this was very novel at the time. They're reminiscent, of course, of wires. That might have been obvious to some people in the 19th century; the revolutions of wiring and electricity were just getting underway. But in many ways, these microanatomical drawings of Ramón y Cajal's, like this one, they're still in some ways unsurpassed.
Questo è il cervello di un uccello. Vedete l'incredibile varietà di cellule differenti, persino la teoria cellulare stessa era abbastanza nuova all'epoca. E queste strutture, queste cellule che hanno queste ramificazioni, questi rami che possono percorrere distanze davvero lunghissime... questa era una vera novità all'epoca. E naturalmente, ci ricordano dei fili elettrici. Questo sarebbe potuto essere ovvio per alcuni nel XIX secolo; le rivoluzioni dei circuiti, dell'elettricità stavano cominciando. Ma in molti modi, i disegni di microanatomia di Ramón y Cajal, come questo, sono ancora in qualche modo attuali.
We're still more than a century later, trying to finish the job that Ramón y Cajal started. These are raw data from our collaborators at the Max Planck Institute of Neuroscience. And what our collaborators have done is to image little pieces of brain tissue. The entire sample here is about one cubic millimeter in size, and I'm showing you a very, very small piece of it here. That bar on the left is about one micron. The structures you see are mitochondria that are the size of bacteria. And these are consecutive slices through this very, very tiny block of tissue. Just for comparison's sake, the diameter of an average strand of hair is about 100 microns. So we're looking at something much, much smaller than a single strand of hair.
Dopo più di un secolo, stiamo ancora cercando di finire il lavoro iniziato da Ramón y Cajal. Questi sono dati grezzi dai nostri collaboratori all'Istituto Max Planck di Neuroscienze. Ciò che hanno fatto i nostri collaboratori è rappresentare frammenti di tessuto celebrale. L'intero campione qui è di circa un millimetro cubico, e ve ne sto mostrando un pezzo piccolissimo qui. Quella barra a sinistra è di circa un micron. Le strutture che vedete sono i mitocondri che sono delle dimensioni dei batteri. E queste sono sezioni consecutive di questo minuscolo blocco di tessuto. Solo per fare un confronto, il diametro medio di un capello misura circa 100 microns. Quindi stiamo osservando qualcosa di molto, molto più piccolo di un singolo capello.
And from these kinds of serial electron microscopy slices, one can start to make reconstructions in 3D of neurons that look like these. So these are sort of in the same style as Ramón y Cajal. Only a few neurons lit up, because otherwise we wouldn't be able to see anything here. It would be so crowded, so full of structure, of wiring all connecting one neuron to another.
E da queste serie di parti microscopiche di elettroni, si possono cominciare ricostruzioni 3D dei neuroni che appaiono come questi. Sono in qualche modo simili al lavoro svolto da Ramón y Cajal. Solo pochi neuroni sono evidenziati, perché altrimenti non potremmo osservare nulla qui. Sarebbe molto affollato e pieno di strutture, di fili che uniscono tutti i neutroni tra loro.
So Ramón y Cajal was a little bit ahead of his time, and progress on understanding the brain proceeded slowly over the next few decades. But we knew that neurons used electricity, and by World War II, our technology was advanced enough to start doing real electrical experiments on live neurons to better understand how they worked. This was the very same time when computers were being invented, very much based on the idea of modeling the brain -- of "intelligent machinery," as Alan Turing called it, one of the fathers of computer science.
Quindi, Ramón y Cajal era un po' avanti per i suoi tempi, e gli sviluppi sulla comprensione del cervello avanzarono lentamente nel corso dei decenni successivi. Ma sapevamo che i neuroni usano l'elettricità, e dalla Seconda Guerra Mondiale, la nostra tecnologia era abbastanza avanzata da iniziare a fare veri esperimenti elettrici su neuroni vivi per capire meglio il loro funzionamento. Questa fu l'epoca in cui vennero inventati i computer, basati fondamentalmente sul modello del cervello, di "macchina intelligente" come Alan Turing lo chiamò, uno dei padri della scienza del computer.
Warren McCulloch and Walter Pitts looked at Ramón y Cajal's drawing of visual cortex, which I'm showing here. This is the cortex that processes imagery that comes from the eye. And for them, this looked like a circuit diagram. So there are a lot of details in McCulloch and Pitts's circuit diagram that are not quite right. But this basic idea that visual cortex works like a series of computational elements that pass information one to the next in a cascade, is essentially correct.
Warren MacCulloch e Walter Pitts studiarono i disegni di Ramón y Cajal della corteccia visiva, che vi mostro qui. Questa è la corteccia che elabora le immagini provenienti dall'occhio. Secondo loro, ciò appariva come un diagramma di un circuito. Molti dettagli dei diagrammi di MacCulloch e Pitts non sono proprio corretti. Ma questa idea di base che la corteccia visiva lavorasse come una serie di elementi di calcolo che trasmettono informazioni l'un l'altra in sequenza è essenzialmente corretto.
Let's talk for a moment about what a model for processing visual information would need to do. The basic task of perception is to take an image like this one and say, "That's a bird," which is a very simple thing for us to do with our brains. But you should all understand that for a computer, this was pretty much impossible just a few years ago. The classical computing paradigm is not one in which this task is easy to do.
Analizziamo un attimo ciò che un modello di elaborazione di informazioni visive dovrebbe fare. Il compito fondamentale della percezione è di catturare un'immagine come questa e dire: "Questo è un uccello," che è una cosa molto semplice per il nostro cervello. Ma tutti voi dovreste capire che per un computer, ciò era praticamente impossibile sino a qualche anno fa. Il classico paradigma di calcolo in questo caso non è così semplice da realizzare.
So what's going on between the pixels, between the image of the bird and the word "bird," is essentially a set of neurons connected to each other in a neural network, as I'm diagramming here. This neural network could be biological, inside our visual cortices, or, nowadays, we start to have the capability to model such neural networks on the computer. And I'll show you what that actually looks like.
Ciò che accade tra i pixel, tra l'immagine dell'uccello e la parola "uccello", essenzialmente è un gruppo di neuroni connessi tra loro in una rete neurale, come sto schematizzando qui. Questa rete neurale può essere biologica, nella nostra corteccia visuale, oppure, oggi, possiamo modellare queste reti neuronali su un computer. E vi mostrerò come in realtà ciò appaia.
So the pixels you can think about as a first layer of neurons, and that's, in fact, how it works in the eye -- that's the neurons in the retina. And those feed forward into one layer after another layer, after another layer of neurons, all connected by synapses of different weights. The behavior of this network is characterized by the strengths of all of those synapses. Those characterize the computational properties of this network. And at the end of the day, you have a neuron or a small group of neurons that light up, saying, "bird."
Quindi i pixel potete immaginarli come un primo strato di neuroni, ed è così, infatti, che funziona l'occhio: questi sono i neuroni della retina. Ed essi trasmettono da uno strato all'altro, tutti connessi da sinapsi di peso differente. Il comportamento di questa rete è caratterizzato dalle forze di tutte queste sinapsi. Esse caratterizzano le proprietà di calcolo di questa rete. E alla fine della giornata, abbiamo un neurone o un piccolo gruppo di neuroni che si accendono e dicono "uccello".
Now I'm going to represent those three things -- the input pixels and the synapses in the neural network, and bird, the output -- by three variables: x, w and y. There are maybe a million or so x's -- a million pixels in that image. There are billions or trillions of w's, which represent the weights of all these synapses in the neural network. And there's a very small number of y's, of outputs that that network has. "Bird" is only four letters, right? So let's pretend that this is just a simple formula, x "x" w = y. I'm putting the times in scare quotes because what's really going on there, of course, is a very complicated series of mathematical operations.
Adesso vi mostrerò queste tre cose: i pixel di input, le sinapsi nella rete neurale, e l'uccello, il risultato, attraverso tre variabili: x, w ed y. Ci sono forse un milione di x più o meno, un milione di pixel in questa immagine. Ci sono miliardi o triliardi di w, che rappresentano il peso di tutte queste sinapsi nella rete neurale. E c'è un piccolissimo numero di y, di uscite che ha quella rete. Uccello è di sole tre sillabe, giusto? Facciamo finta che sia solo una semplice formula, x "x" w = y. Sto mettendo il "per" tra virgolette perché cio che realmente accade, ovviamente, è una complicatissima serie di operazioni matematiche.
That's one equation. There are three variables. And we all know that if you have one equation, you can solve one variable by knowing the other two things. So the problem of inference, that is, figuring out that the picture of a bird is a bird, is this one: it's where y is the unknown and w and x are known. You know the neural network, you know the pixels. As you can see, that's actually a relatively straightforward problem. You multiply two times three and you're done. I'll show you an artificial neural network that we've built recently, doing exactly that.
Questa è un'equazione. Ci sono tre variabili. E sappiamo tutti che se hai un'equazione, puoi risolvere una variabile conoscendo le altre due. Quindi il problema di arrivare alla soluzione, vale a dire, capire che l'immagine dell'uccello è un uccello, è questo: è che y è l'incognita e w ed x i termini noti. Conoscete la rete neurale e conoscete i pixel. Come potete vedere questo in realtà è un problema relativamente semplice. Moltiplicate per due volte tre ed è fatta. Vi mostro una rete neurale artificiale che abbiamo recentemente realizzato facendo esattamente questo.
This is running in real time on a mobile phone, and that's, of course, amazing in its own right, that mobile phones can do so many billions and trillions of operations per second. What you're looking at is a phone looking at one after another picture of a bird, and actually not only saying, "Yes, it's a bird," but identifying the species of bird with a network of this sort. So in that picture, the x and the w are known, and the y is the unknown. I'm glossing over the very difficult part, of course, which is how on earth do we figure out the w, the brain that can do such a thing? How would we ever learn such a model?
Funziona in tempo reale su un cellulare, e questo è di certo sorprendente di per sè, che i cellulari possono fare miliardi e triliardi di operazioni al secondo. Quello che state guardando è un cellulare che guarda un'immagine di un uccello dopo l'altra ed in realtà non dice solo: "Sì, è un uccello", ma identifica le specie di uccello con una rete di questo tipo. Quindi in questa foto, la x e la w sono note, e la y è l'incognita. Sto tralasciando la parte più difficile ovviamente, che è come diamine ci immaginiamo la w, il cervello che può fare una cosa simile ? Come potremmo mai conoscere un simile modello?
So this process of learning, of solving for w, if we were doing this with the simple equation in which we think about these as numbers, we know exactly how to do that: 6 = 2 x w, well, we divide by two and we're done. The problem is with this operator. So, division -- we've used division because it's the inverse to multiplication, but as I've just said, the multiplication is a bit of a lie here. This is a very, very complicated, very non-linear operation; it has no inverse. So we have to figure out a way to solve the equation without a division operator. And the way to do that is fairly straightforward. You just say, let's play a little algebra trick, and move the six over to the right-hand side of the equation. Now, we're still using multiplication. And that zero -- let's think about it as an error. In other words, if we've solved for w the right way, then the error will be zero. And if we haven't gotten it quite right, the error will be greater than zero.
Così questo processo di apprendimento di risolvere tramite la w, se stavamo facendo questo con una semplice equazione nella quale pensiamo a questi come numeri, sappiamo esattamente come fare: 6 = 2 x w, bene, dividiamo per due ed è fatta. Il problema sta in questa operazione. La divisione... abbiamo usato la divisione perché è l'inverso della moltiplicazione, ma come abbiamo appena detto, la moltiplicazione è un bugia qui. Questa è un'operazione complicatissima, davvero non semplice; non ha l'inverso. Cosi dobbiamo cercare di risolvere l'equazione senza un'operazione di divisione. E fare ciò è abbastanza semplice. Diciamo solo che facciamo un trucchetto algebrico, e spostiamo il sei nella parte a destra dell'equazione. Ora, stiamo ancora usando la moltiplicazione. E quello zero, pensiamolo come un errore. In altre parole, se abbiamo risolto la w in modo corretto, allora l'errore sarà lo zero. E se non l'abbiamo fatto giusto, l'errore sarà maggiore di zero.
So now we can just take guesses to minimize the error, and that's the sort of thing computers are very good at. So you've taken an initial guess: what if w = 0? Well, then the error is 6. What if w = 1? The error is 4. And then the computer can sort of play Marco Polo, and drive down the error close to zero. As it does that, it's getting successive approximations to w. Typically, it never quite gets there, but after about a dozen steps, we're up to w = 2.999, which is close enough. And this is the learning process.
Cosi ora possiamo fare delle prove per minimizzare l'errore e questo è il genere di cose in cui i computer sono molto bravi. Quindi abbiamo un valore fittizio iniziale: se w = 0? Beh, allora l'errore è 6. Se w = 1? L'errore è 4. E così il computer può giocare ad una sorta di Marco Polo, e abbassare il margine di errore vicino allo zero. E così facendo, sta ottenendo continue approssimazioni per w. Generalmente, non ci si avvicina mai, ma dopo una dozzina di passaggi arriviamo a w = 2,999, che è abbastanza vicino. E questo è il processo di apprendimento.
So remember that what's been going on here is that we've been taking a lot of known x's and known y's and solving for the w in the middle through an iterative process. It's exactly the same way that we do our own learning. We have many, many images as babies and we get told, "This is a bird; this is not a bird." And over time, through iteration, we solve for w, we solve for those neural connections.
Quindi, ricordate che quello che succede qui è che abbiamo preso un mucchio di x note ed y note e abbiamo risolto la w nel mezzo attraverso un processo iterativo. È esattamente lo stesso processo che utilizziamo per apprendere. Riceviamo moltissime immagini da bambini che ci dicono: "questo è un uccello; questo non è un uccello." E con il tempo, attraverso l'iterazione, risolviamo la w, risolviamo quei collegamenti neurali.
So now, we've held x and w fixed to solve for y; that's everyday, fast perception. We figure out how we can solve for w, that's learning, which is a lot harder, because we need to do error minimization, using a lot of training examples.
Quindi adesso abbiamo mantenuto fisse x ed w per risolvere y; questa è la rapida percezione quotidiana. Abbiamo capito come risolvere la w, che è apprendere, che è molto più difficile, perché abbiamo bisogno di minimizzare l'errore, usando molti esempi come allenamento.
And about a year ago, Alex Mordvintsev, on our team, decided to experiment with what happens if we try solving for x, given a known w and a known y. In other words, you know that it's a bird, and you already have your neural network that you've trained on birds, but what is the picture of a bird? It turns out that by using exactly the same error-minimization procedure, one can do that with the network trained to recognize birds, and the result turns out to be ... a picture of birds. So this is a picture of birds generated entirely by a neural network that was trained to recognize birds, just by solving for x rather than solving for y, and doing that iteratively.
E circa un anno fa, Alex Mordvintsev, nel nostro team, decise di sperimentare cosa accade se cerchiamo di risolvere x, conoscendo w e y. In altre parole, sapete che è un uccello, e avete già la rete neurale che avete allenato sugli uccelli, ma cos'è l'immagine di un uccello? È venuto fuori che utilizzando la stessa procedura di minimizzazione dell'errore, si può fare con la rete allenata a riconoscere gli uccelli, ed il risultato è... un'immagine di uccelli. Quindi questa è un'immagine di uccelli interamente generata dalla rete neurale allenata a riconoscere gli uccelli, risolvendo solo x piuttosto che risolvere y, e facendolo in modo iterativo.
Here's another fun example. This was a work made by Mike Tyka in our group, which he calls "Animal Parade." It reminds me a little bit of William Kentridge's artworks, in which he makes sketches, rubs them out, makes sketches, rubs them out, and creates a movie this way. In this case, what Mike is doing is varying y over the space of different animals, in a network designed to recognize and distinguish different animals from each other. And you get this strange, Escher-like morph from one animal to another.
Ho qui un altro esempio divertente. Questo era un lavoro fatto da Mike Tyra nel nostro gruppo che lui chiama "Parata degli animali". Mi ricorda un po' le opere d'arte di William Kentridge, in cui fa schizzi, li cancella, fa schizzi, li cancella, ed in questa maniera crea un film. In questo caso, quello che Mike fa è variare la y tra diversi animali, in una rete disegnata per riconoscere e distinguere diversi animali l'uno dall''altro. E si ottiene questa strana trasformazione stile Escher da un animale all'altro.
Here he and Alex together have tried reducing the y's to a space of only two dimensions, thereby making a map out of the space of all things recognized by this network. Doing this kind of synthesis or generation of imagery over that entire surface, varying y over the surface, you make a kind of map -- a visual map of all the things the network knows how to recognize. The animals are all here; "armadillo" is right in that spot.
Qui lui ed Alex insieme hanno cercato di ridurre la y ad uno spazio di sole due dimensioni, in modo tale da creare una mappa a aprtire dallo spazio delle cose riconosciute da questa rete. Facendo questo tipo di sintesi o generazione di immagini su tutta quella superficie, variando y sulla superficie, si può creare una sorta di mappa, una mappa visuale di tutte le cose che la rete sa come riconoscere. Gli animali sono tutti qui; "armadillo" è in quel posto.
You can do this with other kinds of networks as well. This is a network designed to recognize faces, to distinguish one face from another. And here, we're putting in a y that says, "me," my own face parameters. And when this thing solves for x, it generates this rather crazy, kind of cubist, surreal, psychedelic picture of me from multiple points of view at once. The reason it looks like multiple points of view at once is because that network is designed to get rid of the ambiguity of a face being in one pose or another pose, being looked at with one kind of lighting, another kind of lighting. So when you do this sort of reconstruction, if you don't use some sort of guide image or guide statistics, then you'll get a sort of confusion of different points of view, because it's ambiguous. This is what happens if Alex uses his own face as a guide image during that optimization process to reconstruct my own face. So you can see it's not perfect. There's still quite a lot of work to do on how we optimize that optimization process. But you start to get something more like a coherent face, rendered using my own face as a guide.
Potete fare questo anche con altri generi di reti. Questa è una rete disegnata per riconoscere i visi, per distinguere una faccia da un'altra. E qui, stiamo inserendo una y che dice "me", i miei parametri facciali. E quando questa cosa risolve la x, genera questa specie di pazza, cubista, surreale, psichedelica immagine di me stesso da molteplici punti di vista insieme. La ragione per cui sembrano più punti di vista insieme è che la rete è costruita per scartare le ambiguità di un volto che sia in una posa o in un'altra guardato con un tipo di luce, poi con un altro. Così quando si fa questo tipo di ricostruzione, se non si usa una qualche sorta di immagine guida, o statistica guida, otterrete una sorta di confusione di differenti punti di vista, perchè è ambiguo. Questo è quello che succede se Alex usa la sua faccia come immagine campione durante il processo di ottimizzazione per ricostruire il mio viso. Come potete vedere non è perfetto. C'è ancora un bel po' di lavoro da fare su come migliorare il processo di ottimizzazione. Ma si è cominciato ad ottenere qualcosa di più simile a un viso, usando la mia faccia come modello.
You don't have to start with a blank canvas or with white noise. When you're solving for x, you can begin with an x, that is itself already some other image. That's what this little demonstration is. This is a network that is designed to categorize all sorts of different objects -- man-made structures, animals ... Here we're starting with just a picture of clouds, and as we optimize, basically, this network is figuring out what it sees in the clouds. And the more time you spend looking at this, the more things you also will see in the clouds. You could also use the face network to hallucinate into this, and you get some pretty crazy stuff.
Non è necessario iniziare con una tela bianca o con un rumore bianco. Quando risolvete la x, potete iniziare con una x, che di per sè è già una qualche altra immagine. Questa ne è una piccola dimostrazione. Questa è una reta disegnata per categorizzare ogni genere di oggetti diversi: strutture create dall'uomo, animali... Qui cominciamo semplicemente con una foto di nubi, e appena ottimizziamo, sostanzialmente, questa rete cerca di capire ciò che vede nelle nubi. E più tempo state a guardarla, più cose riuscirete a vedere nelle nubi. Si potrebbe anche utilizzare la rete dei visi per allucinarla ed ottenere cose piuttosto folli.
(Laughter)
(Risate)
Or, Mike has done some other experiments in which he takes that cloud image, hallucinates, zooms, hallucinates, zooms hallucinates, zooms. And in this way, you can get a sort of fugue state of the network, I suppose, or a sort of free association, in which the network is eating its own tail. So every image is now the basis for, "What do I think I see next? What do I think I see next? What do I think I see next?"
Oppure, Mike ha fatto qualche altro esperimento in cui prende questa immagine di nuvole allucinata, zoomata, allucinata zoomata, allucinata, zoomata. Ed in questo modo, è possibile ottenere una sorta di stato di fuga dalla rete, suppongo, o una sorta di libera associazione, nella quale la rete si morde la coda. Così ogni immagine è adesso la base per: "Cosa penso di vedere dopo? Cosa penso di vedere dopo? Cosa penso di vedere dopo?"
I showed this for the first time in public to a group at a lecture in Seattle called "Higher Education" -- this was right after marijuana was legalized.
Ho mostrato questa cosa per la prima volta in pubblico a un gruppo in una conferenza a Seattle chiamato "Istruzione superiore", subito dopo che la marijuana fu legalizzata.
(Laughter)
(Risate)
So I'd like to finish up quickly by just noting that this technology is not constrained. I've shown you purely visual examples because they're really fun to look at. It's not a purely visual technology. Our artist collaborator, Ross Goodwin, has done experiments involving a camera that takes a picture, and then a computer in his backpack writes a poem using neural networks, based on the contents of the image. And that poetry neural network has been trained on a large corpus of 20th-century poetry. And the poetry is, you know, I think, kind of not bad, actually.
Così mi piacerebbe concludere velocemente semplicemente facendovi notare che questa tecnologia non è vincolata. Vi ho mostrato esempi puramente visuali perché sono divertenti da vedere. Ma non è una tecnologia puramente visiva. Il nostro collaboratore artistico, Ross Goodwin, ha fatto esperimenti con una fotocamera che cattura un'immagine, e con un computer nel suo zaino che scrive una poesia usando reti neurali, basata sui contenuti dell'immagine. E quella rete neurale di poesia è stata allenata su un vasto materiale di poesie del XX secolo. E, sapete, la poesia, secondo me, in realtà non è male.
(Laughter)
(Risate)
In closing, I think that per Michelangelo, I think he was right; perception and creativity are very intimately connected. What we've just seen are neural networks that are entirely trained to discriminate, or to recognize different things in the world, able to be run in reverse, to generate. One of the things that suggests to me is not only that Michelangelo really did see the sculpture in the blocks of stone, but that any creature, any being, any alien that is able to do perceptual acts of that sort is also able to create because it's exactly the same machinery that's used in both cases.
Per finire, penso che Michelangelo avesse ragione; percezione e creatività sono strettamente correlate. Quello che abbiamo appena visto sono reti neurali che sono completamente allenate a distinguere o a riconoscere differenti cose nel mondo, e se attivate al contrario, per creare. Una delle cose che mi suggerisce è che non solo Michelangelo potesse davvero vedere la scultura all'interno del blocco di pietra, ma che ogni creatura, ogni essere, ogni alieno che è in grado di eseguire atti percettivi di questo genere è anche in grado di creare perché è esattamente la stessa macchina che viene usata in entrambi i casi.
Also, I think that perception and creativity are by no means uniquely human. We start to have computer models that can do exactly these sorts of things. And that ought to be unsurprising; the brain is computational.
Inoltre penso che la percezione e la creazione non siano mezzi unicamente umani. Iniziamo ad avere modelli di computer che fanno proprio questo genere di cose. E questo non dovrebbe sorprendere; il cervello è computazionale.
And finally, computing began as an exercise in designing intelligent machinery. It was very much modeled after the idea of how could we make machines intelligent. And we finally are starting to fulfill now some of the promises of those early pioneers, of Turing and von Neumann and McCulloch and Pitts. And I think that computing is not just about accounting or playing Candy Crush or something. From the beginning, we modeled them after our minds. And they give us both the ability to understand our own minds better and to extend them.
Ed infine, il calcolo iniziò come un esercizio per creare macchine intelligenti. È iniziato dall'idea che potessimo creare macchine intelligenti. E finalmente stiamo iniziando ad adempiere adesso ad alcune delle promesse di quei primi pionieri, di Turing e von Neumann, di MacCulloch e Pitts. E pens che l'informatica non sia solo calcolare o giocare a Candy Crush o altro. Fin dal principio, l'abbiamo modellata sulle nostre menti. Ed essa ci hanno fornito sia la capacità di capire meglio la nostra mente sia di ampliarla.
Thank you very much.
Grazie mille.
(Applause)
(ApplausiI)