So, I lead a team at Google that works on machine intelligence; in other words, the engineering discipline of making computers and devices able to do some of the things that brains do. And this makes us interested in real brains and neuroscience as well, and especially interested in the things that our brains do that are still far superior to the performance of computers.
Google'da makine zekâsı üzerine çalışan bir takımı yönetiyorum; yani, bilgisayar ve makineleri yapan mühendislik disiplini beynin yaptığı bazı şeyleri yapabiliyor. Bu da bizim gerçek beyinlere ve nörolojiye de ve özellikle bilgisayarların performansından hâlâ üstün olan beynimizin yaptığı şeylere ilgi duymamızı sağlıyor.
Historically, one of those areas has been perception, the process by which things out there in the world -- sounds and images -- can turn into concepts in the mind. This is essential for our own brains, and it's also pretty useful on a computer. The machine perception algorithms, for example, that our team makes, are what enable your pictures on Google Photos to become searchable, based on what's in them. The flip side of perception is creativity: turning a concept into something out there into the world. So over the past year, our work on machine perception has also unexpectedly connected with the world of machine creativity and machine art.
Tarihsel olarak bu alanlardan biri algıdır, dünyada algılanarak var olan şeyler -- sesler ve resimler gibi -- zihinde kavramlara dönüşebilir. Bu beynimiz için vazgeçilmezdir ve bir bilgisayarda da oldukça kullanışlıdır. Takımımın yaptığı makine algı algoritmaları örneğin, Google Fotoğraflar'da resimlerinizdeki şeyleri baz alarak onların aranabilir olmasını sağlıyor. Algının diğer yüzü yaratıcılık: Bir kavramı dünyadaki bir nesneye dönüştürmektir. Geçen yıl boyunca makine algısı üzerine yaptığımız çalışmalar da beklenmedik bir şekilde makine yaratıcılığı ve makine sanatı dünyasıyla bağlandı.
I think Michelangelo had a penetrating insight into to this dual relationship between perception and creativity. This is a famous quote of his: "Every block of stone has a statue inside of it, and the job of the sculptor is to discover it." So I think that what Michelangelo was getting at is that we create by perceiving, and that perception itself is an act of imagination and is the stuff of creativity.
Bence Michelangelo algı ve yaratıcılık arasındaki ikili ilişkiye dair keskin bir bakış açısına sahipti. Onun ünlü bir sözüdür: "Her bir taş blok içinde bir heykel barındırır ve heykeltraşın görevi bunu ortaya çıkarmaktır." Yani bence Michelangelo'nun anlatmak istediği algılayarak yaratırız, algının kendisi hayal gücümüzün bir eylemi ve yaratıcılığın malzemesidir.
The organ that does all the thinking and perceiving and imagining, of course, is the brain. And I'd like to begin with a brief bit of history about what we know about brains. Because unlike, say, the heart or the intestines, you really can't say very much about a brain by just looking at it, at least with the naked eye. The early anatomists who looked at brains gave the superficial structures of this thing all kinds of fanciful names, like hippocampus, meaning "little shrimp." But of course that sort of thing doesn't tell us very much about what's actually going on inside.
Düşünmeyi, algılamayı ve hayal etmeyi sağlayan organımız tabii ki de beynimizdir. Beyinler hakkında bildiğimiz şeylerin kısa bir tarihiyle başlamak istiyorum. Çünkü kalp ya da bağırsakların aksine en azından çıplak gözle bakarak bir beyin hakkında çok bir şey söyleyemezsin. Beyni inceleyen ilk anatomi uzmanları beynin yüzeysel yapılarına, "denizatı" anlamına gelen hipokampüs gibi birçok tuhaf isim vermişler. Fakat bu bize aslında içinde ne olduğu hakkında pek bir şey ifade etmiyor.
The first person who, I think, really developed some kind of insight into what was going on in the brain was the great Spanish neuroanatomist, Santiago Ramón y Cajal, in the 19th century, who used microscopy and special stains that could selectively fill in or render in very high contrast the individual cells in the brain, in order to start to understand their morphologies. And these are the kinds of drawings that he made of neurons in the 19th century.
Bence beyinde ne olduğuna dair gerçekten bir bakış açısı geliştiren ilk kişi, 19. yüzyılda beyindeki bireysel hücrelerin morfolojilerini (yapı) anlamaya başlamak için mikroskop ve bu hücreleri yüksek kontrastta titizlikle doldurabilen ya da eritebilen özel kimyasallar kullanan, büyük İspanyol nöro-anatomist Santiago Ramón y Cajal'dır. Bunlar da 19. yy'da nöronlardan (sinir hücresi) yaptığı çizimler.
This is from a bird brain. And you see this incredible variety of different sorts of cells, even the cellular theory itself was quite new at this point. And these structures, these cells that have these arborizations, these branches that can go very, very long distances -- this was very novel at the time. They're reminiscent, of course, of wires. That might have been obvious to some people in the 19th century; the revolutions of wiring and electricity were just getting underway. But in many ways, these microanatomical drawings of Ramón y Cajal's, like this one, they're still in some ways unsurpassed.
Bir kuş beyninden alıntı. Bu inanılmaz farklı çeşitlikteki hücreleri görüyorsunuz, hücre teorisi bile o zaman çok yeniydi. Bu yapılar, dallanmaların olduğu hücreler, çok çok uzağa gidebilen dallar o zamanlar çok yeniydi. Tabii ki de kabloları andırıyorlar. 19. yy'da bu bazı insanlar için açık ve netti; kabloların ve elektriğin devrimi yeni bir yolculuğa başlıyordu. Fakat birçok açıdan örnekteki gibi Ramón y Cajal'ın mikroanatomik çizimleri hâlâ bazı açılardan emsalsiz.
We're still more than a century later, trying to finish the job that Ramón y Cajal started. These are raw data from our collaborators at the Max Planck Institute of Neuroscience. And what our collaborators have done is to image little pieces of brain tissue. The entire sample here is about one cubic millimeter in size, and I'm showing you a very, very small piece of it here. That bar on the left is about one micron. The structures you see are mitochondria that are the size of bacteria. And these are consecutive slices through this very, very tiny block of tissue. Just for comparison's sake, the diameter of an average strand of hair is about 100 microns. So we're looking at something much, much smaller than a single strand of hair.
Ramón y Cajal'ın başladığı işi bitirmeye çabalarken hâlâ yüzyıl sonrasından daha uzağız. Bunlar Max Planck Sinirbilim Enstitüsü'ndeki ortaklarımızdan gelen ham verilerdir. Ortaklarımızın yaptığı şey beyin dokusunun küçük parçalarını hayal etmekti. Buradaki tüm örnek boyutun yaklaşık bir milimetre kübü ve size bunun çok ama çok küçük bir parçasını gösteriyorum. Sol taraftaki çizgi yaklaşık bir mikron. Gördüğünüz yapılar bakteri boyutundaki mitokondriler. Bunlar çok çok ince olan doku bloklarındaki ard arda gelen dilimler. Sadece karşılaştırmak amacıyla, ortalama bir saç telinin çapı yaklaşık 100 mikron. Yani tek bir saç telinden çok çok küçük bir şey arıyoruz.
And from these kinds of serial electron microscopy slices, one can start to make reconstructions in 3D of neurons that look like these. So these are sort of in the same style as Ramón y Cajal. Only a few neurons lit up, because otherwise we wouldn't be able to see anything here. It would be so crowded, so full of structure, of wiring all connecting one neuron to another.
Bir bilim insanı bu çeşit seri elektron mikroskopi dilimlerinden bunlara benzeyen üç boyutlu nöronlarda yeniden yapılandırmaya başlayabilir. Sonucunda bunlar Ramón y Cajal'la aynı tarzda. Sadece birkaç nöron parlıyor, yoksa burada hiçbir şey göremezdik. Çok kalabalık olurdu, bir nöronu diğer bir nörona bağlayan yapılarla dolu.
So Ramón y Cajal was a little bit ahead of his time, and progress on understanding the brain proceeded slowly over the next few decades. But we knew that neurons used electricity, and by World War II, our technology was advanced enough to start doing real electrical experiments on live neurons to better understand how they worked. This was the very same time when computers were being invented, very much based on the idea of modeling the brain -- of "intelligent machinery," as Alan Turing called it, one of the fathers of computer science.
Ramón y Cajal zamanının biraz ilerisindeydi ve beyni anlamadaki ilerlemesini önündeki birkaç 10 yıl boyunca sürdürdü. Nöronların elektrik kullandığını biliyorduk ve 2. Dünya Savaşı'yla teknolojimiz nasıl çalıştıklarını daha iyi anlamak için canlı nöronlarda gerçek elektrikli deneyleri yapmaya başlayacak kadar gelişmişti. Bu tam da bilgisayarların; bilgisayar biliminin fikir öncülerinden biri olan Alan Turing'in deyimiyle beyin modelleme fikrine dayanan "akıllı makinelerin" icadıyla aynı dönemdi.
Warren McCulloch and Walter Pitts looked at Ramón y Cajal's drawing of visual cortex, which I'm showing here. This is the cortex that processes imagery that comes from the eye. And for them, this looked like a circuit diagram. So there are a lot of details in McCulloch and Pitts's circuit diagram that are not quite right. But this basic idea that visual cortex works like a series of computational elements that pass information one to the next in a cascade, is essentially correct.
Warren McCulloch ve Walter Pitts, Ramón y Cajal'ın burada gösterdiğim görme korteksinin (merkezi) çizimlerine baktı. Bu korteks gözden gelen görüntüleri işliyor. Onlar için bu devre şeması gibiydi. Bu yüzden McCulloch ve Pitts'in devre şemasında tamamen doğru olmayan birçok detay bulunmakta. Ama bu temel görme korteksinin hesaplama elemanları serisi gibi çalışarak sonrakine ard arda bilgi aktarması fikri temelde doğrudur.
Let's talk for a moment about what a model for processing visual information would need to do. The basic task of perception is to take an image like this one and say, "That's a bird," which is a very simple thing for us to do with our brains. But you should all understand that for a computer, this was pretty much impossible just a few years ago. The classical computing paradigm is not one in which this task is easy to do.
Biraz görsel bilgi işleme için modelin ne yapması gerektiğinden bahsedelim. Algının temel görevi bu gibi bir resme bakıp şöyle demektir, "Bu bir kuş." ki bu bizim beyinlerimizle yaptığımız çok kolay bir şeydir. Ama şunu anlamalısınız ki bilgisayar için, birkaç yıl önce neredeyse imkânsızdı. Klasik hesaplama paradigması bu işi kolay yapanlardan biri değil.
So what's going on between the pixels, between the image of the bird and the word "bird," is essentially a set of neurons connected to each other in a neural network, as I'm diagramming here. This neural network could be biological, inside our visual cortices, or, nowadays, we start to have the capability to model such neural networks on the computer. And I'll show you what that actually looks like.
Pikseller arasında, kuş resmi ve "kuş" kelimesi arasında olan, temelde sinir ağında birbirine bağlı nöronlar kümesidir, burada şemalaştırdığım gibi. Bu sinir ağı, görme kortekslerimizin içerisinde, biyolojik olabilir veya günümüzde, bu gibi sinir ağları modelleme kapasitesine sahip olmaya başladık bilgisayarlarda. Size gerçekte nasıl göründüğünü açıklayacağım.
So the pixels you can think about as a first layer of neurons, and that's, in fact, how it works in the eye -- that's the neurons in the retina. And those feed forward into one layer after another layer, after another layer of neurons, all connected by synapses of different weights. The behavior of this network is characterized by the strengths of all of those synapses. Those characterize the computational properties of this network. And at the end of the day, you have a neuron or a small group of neurons that light up, saying, "bird."
Pikselleri nöronların ilk katmanı gibi düşünebilirsiniz ve aslında gözde de bu şekilde işler -- bunlar retinadaki nöronlar. İleri beslenir bir katmandan diğer katmana, ardından diğer farklı ağırlıklı sinapslarla birbirine bağlı olan nöronlar katmanına. Bu ağın davranışı tüm bu sinapsların gücü ile karakterize edilir. Ağın hesaplama gücün özelliklerini karakterize ederler. Günün sonunda, tek bir nöron veya küçük bir nöron grubunuz olur, "Kuş" sözü ile parlayan.
Now I'm going to represent those three things -- the input pixels and the synapses in the neural network, and bird, the output -- by three variables: x, w and y. There are maybe a million or so x's -- a million pixels in that image. There are billions or trillions of w's, which represent the weights of all these synapses in the neural network. And there's a very small number of y's, of outputs that that network has. "Bird" is only four letters, right? So let's pretend that this is just a simple formula, x "x" w = y. I'm putting the times in scare quotes because what's really going on there, of course, is a very complicated series of mathematical operations.
Şimdi şu üç şeyi tasvir edeceğim-- giriş pikselleri ve sinir ağındaki sinapslar ve kuş yani çıktı verisi -- şu üç değişkenle: x, w ve y. Belki de bir milyon ya da civarında x -- o görüntüde bir milyon piksel var. Milyarlarca ya da trilyonlarca w'lar var sinir ağındaki tüm bu sinapsların ağırlıklarını gösteren. Az sayıda y'ler var, ağın çıktısı olarak. "Kuş" (Bird) sadece 4 harfli değil mi? Bunun basit bir formül olduğunu farz edelim: x "x" w = y. Çarpım işaretini tırnak arasına aldım çünkü orada tam olarak olan, şüphesiz, matematiksel operasyonların çok karmaşık serileridir.
That's one equation. There are three variables. And we all know that if you have one equation, you can solve one variable by knowing the other two things. So the problem of inference, that is, figuring out that the picture of a bird is a bird, is this one: it's where y is the unknown and w and x are known. You know the neural network, you know the pixels. As you can see, that's actually a relatively straightforward problem. You multiply two times three and you're done. I'll show you an artificial neural network that we've built recently, doing exactly that.
Bu, bir denklem. Üç değişken var. Hepimizin bildiği gibi eğer bir denklemin varsa, diğer ikisini bilerek, bir değişkeni bulabilirsin. Çıkarım sorunu ise kuş resminde kuş olduğunu çıkarmakta. Bu ise: y bilinmeyen, w ve x biliniyor. Sinir ağını biliyorsunuz, pikselleri biliyorsunuz. Görüldüğü gibi nispeten anlaşılır bir problem. 3 ile 2'yi çarpıyorsunuz ve bitiyor. Geçenlerde oluşturduğumuz, aynısını yapan yapay bir sinir ağı göstereceğim size.
This is running in real time on a mobile phone, and that's, of course, amazing in its own right, that mobile phones can do so many billions and trillions of operations per second. What you're looking at is a phone looking at one after another picture of a bird, and actually not only saying, "Yes, it's a bird," but identifying the species of bird with a network of this sort. So in that picture, the x and the w are known, and the y is the unknown. I'm glossing over the very difficult part, of course, which is how on earth do we figure out the w, the brain that can do such a thing? How would we ever learn such a model?
Gerçek zamanlı olarak cep telefonunda işletiliyor ve elbette başlı başına harika, cep telefonlarının saniyede milyarlarca ve trilyonlarca işlemi yapabiliyor olması. Seyrettiğiniz, art arda kuş resimlerinin olduğu bir telefon ve aslında sadece "Evet, bu bir kuş," demekle kalmıyor hatta ağ ile kuşun cinsini de tanımlıyor. Resimde, x ve w biliniyor, y bilinmiyor. Zor kısmını gizliyorum, tabii ki, w'yi nasıl hesaplayabiliriz, beyin böyle bir şeyi nasıl yapabilir? Böyle bir modeli nasıl öğrenebiliriz?
So this process of learning, of solving for w, if we were doing this with the simple equation in which we think about these as numbers, we know exactly how to do that: 6 = 2 x w, well, we divide by two and we're done. The problem is with this operator. So, division -- we've used division because it's the inverse to multiplication, but as I've just said, the multiplication is a bit of a lie here. This is a very, very complicated, very non-linear operation; it has no inverse. So we have to figure out a way to solve the equation without a division operator. And the way to do that is fairly straightforward. You just say, let's play a little algebra trick, and move the six over to the right-hand side of the equation. Now, we're still using multiplication. And that zero -- let's think about it as an error. In other words, if we've solved for w the right way, then the error will be zero. And if we haven't gotten it quite right, the error will be greater than zero.
Bu öğrenme, w'yi hesaplama sürecinde sayı olarak düşündüğümüz o basit denklemdeki gibi yapsaydık, kesin olarak yapılışını bilirdik: 6=2 x w, 2'ye böleriz ve biter. Problem bu işaret ile. Bölme -- bölmeyi kullandık çünkü çarpmanın tersi, ama bahsettiğim gibi buradaki çarpma biraz göstermelik. Bu oldukça karmaşık, doğrusal olmayan bir işlem; tersi yok. Denklemi çözmek için bir yol bulmalıyız bölme işlemi olmadan. Ve bunu yapmanın yolu gayet açık. Biraz cebir hilesi yapalım diyebiliriz ve 6'yı denklemin sağ tarafına taşıyalım. Hâlâ çarpma işlemini kullanıyoruz. 0'ı hata olarak düşünelim. Yani, w'yi doğru bulursak hata 0 olacaktır. Doğru bulamazsak, hata 0'dan büyük olacaktır.
So now we can just take guesses to minimize the error, and that's the sort of thing computers are very good at. So you've taken an initial guess: what if w = 0? Well, then the error is 6. What if w = 1? The error is 4. And then the computer can sort of play Marco Polo, and drive down the error close to zero. As it does that, it's getting successive approximations to w. Typically, it never quite gets there, but after about a dozen steps, we're up to w = 2.999, which is close enough. And this is the learning process.
Şimdi hatayı minimize etmek için tahminlerde bulunabiliriz ki bu da bilgisayarların iyi olduğu bir alan. Başka bir tahminde bulundunuz: Farz edelim w=0 olsun. O zaman hata 6 olur. Ya w=1 olursa? Hata 4 olur. O zaman bilgisayar bir çeşit körebe (Marco Polo) oynayabilir ve hatayı 0'a yakınlaştırabilir. Bunu yaparken de w için ardışık yaklaşıklama elde eder. Genellikle tam olarak ulaşamaz ama bir düzine aşamadan sonra w=2,999 'e kadar geldik ki bu da yeterince yakın. Bu öğrenme süreci.
So remember that what's been going on here is that we've been taking a lot of known x's and known y's and solving for the w in the middle through an iterative process. It's exactly the same way that we do our own learning. We have many, many images as babies and we get told, "This is a bird; this is not a bird." And over time, through iteration, we solve for w, we solve for those neural connections.
Unutmayın, burada yaptığımız; birçok bilinen x ve y ile ortadaki w'yi yinelemeli süreç boyunca çözüyoruz. Öğrenirken yaptıklarımızla tamamen aynı. Bebekliğimizden birçok anımız vardır, bize "Bu kuş; bu kuş değil." denen. Ve zamanla, yinelemeler boyunca w'yi çözüyoruz, sinirsel bağlantıları çözüyoruz.
So now, we've held x and w fixed to solve for y; that's everyday, fast perception. We figure out how we can solve for w, that's learning, which is a lot harder, because we need to do error minimization, using a lot of training examples.
Şimdi, y'yi çözmek için sabit x ve w'ye sahibiz ki bu da her gün, hızlı algılama. W'yi nasıl çözebileceğimizi buluyoruz ki bu da çok daha zor olan öğrenmedir, çünkü hata küçültme yapmamız gerekir, birçok eğitim örnekleri kullanarak.
And about a year ago, Alex Mordvintsev, on our team, decided to experiment with what happens if we try solving for x, given a known w and a known y. In other words, you know that it's a bird, and you already have your neural network that you've trained on birds, but what is the picture of a bird? It turns out that by using exactly the same error-minimization procedure, one can do that with the network trained to recognize birds, and the result turns out to be ... a picture of birds. So this is a picture of birds generated entirely by a neural network that was trained to recognize birds, just by solving for x rather than solving for y, and doing that iteratively.
Yaklaşık bir yıl önce, ekibimizden Alex Mordvintsev bilinen bir w ve y ile x'i çözmeye çalışırsak ne olacağını görmek için deney yapmaya karar verdi. Diğer bir deyişle, kuş olduğunu biliyorsunuz ve kuşlar üzerine eğitilen sinir ağınızda zaten bulunmakta, ancak kuşun resmi nedir? Aynı hata küçültme işlemini kullanarak, kuşları tanımlamak için eğitilen ağ ile yapılabileceği sonucu ortaya çıkar, ve sonuç ise ... kuş resmi olur. Yani bu, tamamen kuşları tanımlamak üzere eğitilen sinir ağı tarafından üretilen kuşların resmidir, özyinelemeli olarak yalnızca y'yi hesaplamak yerine x'in hesaplanmasıyla.
Here's another fun example. This was a work made by Mike Tyka in our group, which he calls "Animal Parade." It reminds me a little bit of William Kentridge's artworks, in which he makes sketches, rubs them out, makes sketches, rubs them out, and creates a movie this way. In this case, what Mike is doing is varying y over the space of different animals, in a network designed to recognize and distinguish different animals from each other. And you get this strange, Escher-like morph from one animal to another.
Bir diğer enteresan örnek. Ekibimizden Mike Tyka tarafından yapılan bir çalışma, "Hayvan Defilesi" olarak adlandırdığı. Bana biraz William Kentridge'in çalışmalarını hatırlatıyor, eskizleri yapıp sildiği, yapıp sildiği ve bu şekilde film yaptığı. Bu durumda, Mike, farklı hayvanların üzerindeki boşluklarda y'yi değiştiriyor, farklı hayvanları birbirinden ayırmak ve onları tanımlamak için tasarlanmış bir ağda. Bu tuhaf, Escher'imsi bir hayvandan diğerine biçimler elde edilir.
Here he and Alex together have tried reducing the y's to a space of only two dimensions, thereby making a map out of the space of all things recognized by this network. Doing this kind of synthesis or generation of imagery over that entire surface, varying y over the surface, you make a kind of map -- a visual map of all the things the network knows how to recognize. The animals are all here; "armadillo" is right in that spot.
Burada o ve Alex birlikte y'leri yalnızca iki boyutlu uzaya indirgemeye çalıştı, ağ tarafından tanımlanan boşluklarıyla planlama yaparak. Bu şekilde tüm yüzey üzerinde bir sentez ya da imgelem kuşağıyla, yüzey üzerinde değişen y ile bir çeşit harita yapıyorsunuz, ağın nasıl tanımlayacağını bildiği her şeyin görsel bir haritası. Bütün hayvanlar burada; "armadillo" tam bu noktada.
You can do this with other kinds of networks as well. This is a network designed to recognize faces, to distinguish one face from another. And here, we're putting in a y that says, "me," my own face parameters. And when this thing solves for x, it generates this rather crazy, kind of cubist, surreal, psychedelic picture of me from multiple points of view at once. The reason it looks like multiple points of view at once is because that network is designed to get rid of the ambiguity of a face being in one pose or another pose, being looked at with one kind of lighting, another kind of lighting. So when you do this sort of reconstruction, if you don't use some sort of guide image or guide statistics, then you'll get a sort of confusion of different points of view, because it's ambiguous. This is what happens if Alex uses his own face as a guide image during that optimization process to reconstruct my own face. So you can see it's not perfect. There's still quite a lot of work to do on how we optimize that optimization process. But you start to get something more like a coherent face, rendered using my own face as a guide.
Bunu diğer ağlarla da yapabilirsiniz. Bu ağ yüzleri tanımlamak için tasarlanmış, yüzleri birbirinden ayırt edebilmek için. Buraya "ben" olarak y'yi koyuyoruz, kendi yüz parametrelerim. X'i hesapladığında bu oldukça çılgın, kübist gibi, gerçeküstü, psikedelik resmimi üretiyor, birdenbire, çoklu görüş açılarından. Çoklu görüş açılı gibi görünmesinin sebebi ise ağın, yüzün şu pozda ya da bu pozda ya da şu veya bu şekilde aydınlatmada olmasındaki anlaşmazlıktan kurtulmak için tasarlanmış olması. Bu tarz bir restorasyon yapacaksanız, kılavuz resim ya da istatistikler kullanmazsanız, farklı görüş açılarında bir tür bozulma elde edersiniz, çünkü belirsizdir. Benim yüzümü iyileştirme sürecinde Alex kendi yüzünü kılavuz resim olarak kullandığında böyle oluyor. Gördüğünüz gibi mükemmel değil. Hâlâ optimizasyon sürecini iyileştirmemiz için yapmamız gereken çok iş var. Ama daha tutarlı bir yüze erişmeye başlıyorsunuz yorumlamada model olarak benim yüzüm kullanıldığında.
You don't have to start with a blank canvas or with white noise. When you're solving for x, you can begin with an x, that is itself already some other image. That's what this little demonstration is. This is a network that is designed to categorize all sorts of different objects -- man-made structures, animals ... Here we're starting with just a picture of clouds, and as we optimize, basically, this network is figuring out what it sees in the clouds. And the more time you spend looking at this, the more things you also will see in the clouds. You could also use the face network to hallucinate into this, and you get some pretty crazy stuff.
Siyah bir tuvalle ya da beyaz gürültüyle başlamak zorunda değilsiniz. X'i bulmak için başka bir resimdeki x ile başlayabilirsiniz. Bu küçük gösterim de bununla ilgili. Bu ise her türden, birbirinden farklı nesneleri kategorize etmek için tasarlanmış bir ağ, insan yapımı yapılar, hayvanlar gibi... Burada sadece bir bulut resmi ile başlıyoruz ve optimize ettikçe, temel olarak bu ağ, bulutlarda gördüklerini çözüyor. Buna bakarak ne kadar uzun süre harcarsanız, o kadar fazlasını göreceksiniz bulutlarda. Aynı zamanda bulandırmak için yüz ağını kullanabilir ve oldukça çılgın şeyler yapabilirsiniz.
(Laughter)
(Gülüşmeler)
Or, Mike has done some other experiments in which he takes that cloud image, hallucinates, zooms, hallucinates, zooms hallucinates, zooms. And in this way, you can get a sort of fugue state of the network, I suppose, or a sort of free association, in which the network is eating its own tail. So every image is now the basis for, "What do I think I see next? What do I think I see next? What do I think I see next?"
Veya Mike başka denemeler de yaptı, denemelerde bulut resmini alıyor, bulandırıyor, yakınlaştırıyor, bulandırıyor, yakınlaştırıyor, bulandırıyor, yakınlaştırıyor. Bu şekilde, ağın bir çeşit füj evresini elde edersiniz sanırım ya da bir çeşit serbest çağrışım ağın kendi kuyruğunu yediği. Yani şu an her resim zemin oluşturmakta, "Bir sonrakinde ne yapmayı düşünüyorum?" "Bir sonrakinde ne yapmayı düşünüyorum?"
I showed this for the first time in public to a group at a lecture in Seattle called "Higher Education" -- this was right after marijuana was legalized.
Bunu ilk kez alenen, Seattle'da bir gruba "Yüksek Öğrenim" adlı derste gösterdim tam da esrarın yasallaştırılmasından sonraydı.
(Laughter)
(Gülüşmeler)
So I'd like to finish up quickly by just noting that this technology is not constrained. I've shown you purely visual examples because they're really fun to look at. It's not a purely visual technology. Our artist collaborator, Ross Goodwin, has done experiments involving a camera that takes a picture, and then a computer in his backpack writes a poem using neural networks, based on the contents of the image. And that poetry neural network has been trained on a large corpus of 20th-century poetry. And the poetry is, you know, I think, kind of not bad, actually.
Hızla bitirmek istiyorum, bu teknolojinin engellenmediğini not ederek. Tamamen görsel örnekler gösterdim, çünkü bakması gerçekten eğlenceli. Tamamen görsel bir teknoloji değil. Ressam ortağımız, Ross Goodwin, resim çeken bir kamera ile deneyler yaptı, resmin içeriğine bağlı olarak sırtında sinir ağı kullanarak şiir yazan bir bilgisayarla. O sinir ağı şiiri, büyük 20. yüzyıl şiir külliyatı üzerinde eğitilmiştir. Şiir, bence, çok da kötü değil açıkcası.
(Laughter)
(Gülüşmeler)
In closing, I think that per Michelangelo, I think he was right; perception and creativity are very intimately connected. What we've just seen are neural networks that are entirely trained to discriminate, or to recognize different things in the world, able to be run in reverse, to generate. One of the things that suggests to me is not only that Michelangelo really did see the sculpture in the blocks of stone, but that any creature, any being, any alien that is able to do perceptual acts of that sort is also able to create because it's exactly the same machinery that's used in both cases.
Kapanış olarak, bence Michelangelo, bence haklıydı; algı ve yaratıcılık derinlemesine bağlıdır. Gördüklerimiz tamamen ayırt etmek ya da dünyadaki farklı şeyleri tanılamak için tam tersi yönde çalışmak ya da üretmek üzere eğitilmiştir. Aklıma gelenlerden bir tanesi ise Michelangelo gerçekten taş içindeki bloklarda heykeli gördü, üstelik algısal davranışlar yapabilen herhangi bir yaratık, varlık ya da uzaylı da keza üretebilir, çünkü iki durumda da kullanılan tamamen aynı düzenek.
Also, I think that perception and creativity are by no means uniquely human. We start to have computer models that can do exactly these sorts of things. And that ought to be unsurprising; the brain is computational.
Aynı zamanda bence algı ve yaratıcılık kesinlikle eşsiz olarak insani değil. Bu tarz şeyleri yapabilecek bilgisayar modellerine sahip olmaya başladık. Şaşırtıcı olmayan bir şekilde, beyin hesaba dayalıdır.
And finally, computing began as an exercise in designing intelligent machinery. It was very much modeled after the idea of how could we make machines intelligent. And we finally are starting to fulfill now some of the promises of those early pioneers, of Turing and von Neumann and McCulloch and Pitts. And I think that computing is not just about accounting or playing Candy Crush or something. From the beginning, we modeled them after our minds. And they give us both the ability to understand our own minds better and to extend them.
Son olarak, programlama akıllı makineleri tasarlama alıştırmaları olarak başladı. Makineleri nasıl akıllı yapabiliriz fikrinden sonra modellendi. Ve nihayet artık bazı o eski öncü vaatleri gerçekleştirmeye başlıyoruz, Turing'in, von Neumann'nın, McCulloch'ın ve Pitts'in. Ve bence programlama sadece hesaplama ya da Candy Crush oynama değildir. Başından beri, onları zihnimize benzer modelledik. Onlar da bize hem kendi zihinlerimizi anlama, hem de geliştirme kabiliyetini verdiler.
Thank you very much.
Çok teşekkürler.
(Applause)
(Alkışlar)