People are funny. We're constantly trying to understand and interpret the world around us. I live in a house with two black cats, and let me tell you, every time I see a black, bunched up sweater out of the corner of my eye, I think it's a cat.
Az emberek viccesek. Folyamatos próbáljuk megérteni és értelmezni a világot. Két fekete macskám van, és hadd mondjam el, hogy mikor a szemem sarkából meglátok valahol egy ledobott fekete pulcsit, azt hiszem, az egyik macska az.
It's not just the things we see. Sometimes we attribute more intelligence than might actually be there. Maybe you've seen the dogs on TikTok. They have these little buttons that say things like "walk" or "treat." They can push them to communicate some things with their owners, and their owners think they use them to communicate some pretty impressive things. But do the dogs know what they're saying?
És nem csak azzal vagyunk így, amit látunk. Néha több értelmet feltételezünk egy helyzetben, mint amennyi van. Talán önök is láttak már olyan kutyás TikTok-videót, mikor a kutya megnyomja a “séta” vagy a “nasi” gombot, és így kommunikál a gazdájával. A gazdik pedig azt hiszik, hogy a kutyák elképesztő dolgokat tudnak így közölni. De vajon tudják a kutyák, hogy mit mondanak?
Or perhaps you've heard the story of Clever Hans the horse, and he could do math. And not just like, simple math problems, really complicated ones, like, if the eighth day of the month falls on a Tuesday, what's the date of the following Friday? It's like, pretty impressive for a horse. Unfortunately, Hans wasn't doing math, but what he was doing was equally impressive. Hans had learned to watch the people in the room to tell when he should tap his hoof. So he communicated his answers by tapping his hoof. It turns out that if you know the answer to "if the eighth day of the month falls on a Tuesday, what's the date of the following Friday," you will subconsciously change your posture once the horse has given the correct 18 taps. So Hans couldn't do math, but he had learned to watch the people in the room who could do math, which, I mean, still pretty impressive for a horse. But this is an old picture, and we would not fall for Clever Hans today. Or would we?
Vagy talán hallották már Okos Hans, a ló történetét, aki tudott számolni. Nemcsak egyszerű feladványokat tudott megoldani, hanem egész bonyolultakat is. Például: Ha adott hónap nyolcadika kedd, hanyadika lesz a következő héten pénteken? Ez azért elég lenyűgöző teljesítmény egy lótól! És bár sajnos Hans nem tudott számolni, tudott valamit, ami nem kevésbé csodálatos. Hans megtanulta figyelni a helységben tartózkodó embereket, és ebből tudta, mikor dobbantson. A válaszait ugyanis dobbantásokkal közölte. Kiderült, hogy ha az ember tudja a választ arra a kérdésre, hogy ha adott hónap nyolcadika kedd, hanyadika lesz a következő héten pénteken, akaratlanul is változtat a testhelyzetén, ha a ló megtette a szükséges 18 dobbantást. Hans tehát nem tudott számolni, de megtanulta értelmezni a teremben azok jelzéseit, akik tudtak. Ami szerintem fantasztikus egy ló esetében. De ez egy régi történet, és ma már nem dőlnénk be Hansnak. Vagy igen? (Nevetés)
Well, I work in AI, and let me tell you, things are wild. There have been multiple examples of people being completely convinced that AI understands them. In 2022, a Google engineer thought that Google’s AI was sentient. And you may have had a really human-like conversation with something like ChatGPT. But models we're training today are so much better than the models we had even five years ago. It really is remarkable.
Nos, a szakterületem a mesterséges intelligencia, és elképesztő dolgok történnek itt. Sokan teljesen meg vannak győződve arról, hogy az MI érti őket. 2022-ben a Google egyik fejlesztő mérnöke úgy gondolta, hogy a Google mesterséges intelligenciájának érzelmei vannak. És valóban: a ChatGPT-vel például egészen emberi beszélgetéseket lehet folytatni. Azok a modellek, amelyeket ma tanítunk be, sokkal jobbak, mint az akár öt évvel korábbiak. A fejlődés figyelemreméltó.
So at this super crazy moment in time, let’s ask the super crazy question: Does AI understand us, or are we having our own Clever Hans moment?
De ebben a szuper izgalmas korban, tegyük fel azt a szuper izgalmas kérdést, hogy valóban ért minket az MI, vagy ez is egy Okos Hans típusú történet.
Some philosophers think that computers will never understand language. To illustrate this, they developed something they call the Chinese room argument. In the Chinese room, there is a person, hypothetical person, who does not understand Chinese, but he has along with him a set of instructions that tell him how to respond in Chinese to any Chinese sentence. Here's how the Chinese room works. A piece of paper comes in through a slot in the door, has something written in Chinese on it. The person uses their instructions to figure out how to respond. They write the response down on a piece of paper and then send it back out through the door. To somebody who speaks Chinese, standing outside this room, it might seem like the person inside the room speaks Chinese. But we know they do not, because no knowledge of Chinese is required to follow the instructions. Performance on this task does not show that you know Chinese.
Néhány filozófus szerint a számítógép soha nem lesz képes megérteni az emberi nyelvet. Ennek bizonyítására kidolgozták az ún. kínai szoba elméletet. Ebben a kínai szobában van valaki, egy kitalált személy, aki nem beszél kínaiul, de kapott egy sor utasítást, hogy hogyan válaszoljon kínaiul egy kínaiul elhangzó közlésre. Lássuk, hogy működik a kínai szoba. Az ajtóra vágott nyíláson egy cédula esik a padlóra, amelyen kínai írás áll. A szobában lévő személy az utasítások alapján megpróbál válaszolni. A válaszát leírja egy darab papírra, és az ajtónyíláson át visszadobja. Annak a kínainak, aki az ajtó előtt áll, úgy tűnik, hogy az, aki a szobában van, tud kínaiul. Mi azonban tudjuk, hogy nem. Az utasítások értelmezéséhez ugyanis nincs szükség kínai nyelvtudásra. Az tehát, hogy teljesítette a feladatot, nem azt jelenti, hogy tud kínaiul.
So what does that tell us about AI? Well, when you and I stand outside of the room, when we speak to one of these AIs like ChatGPT, we are the person standing outside the room. We're feeding in English sentences, we're getting English sentences back. It really looks like the models understand us. It really looks like they know English. But under the hood, these models are just following a set of instructions, albeit complex. How do we know if AI understands us?
És hogy mit árul ez el az MI-ről? Ha mi állunk a szoba ajtaja előtt, amikor egy MI-vel, pl. a ChatGPT-vel társalgunk, mi vagyunk az igazi nyelvhasználók. Beküldjük az angol mondatokat, és angol mondatokat kapunk válaszként. Minden arra mutat, hogy a program ért miket. Tényleg úgy tűnik, hogy az MI beszél angolul. De valójában ezek a modellek csak egy sor utasítást követnek, jóllehet rendkívül komplex utasításokat. De honnan tudjuk, hogy ért-e minket az MI?
To answer that question, let's go back to the Chinese room again. Let's say we have two Chinese rooms. In one Chinese room is somebody who actually speaks Chinese, and in the other room is our impostor. When the person who actually speaks Chinese gets a piece of paper that says something in Chinese in it, they can read it, no problem. But when our imposter gets it again, he has to use his set of instructions to figure out how to respond. From the outside, it might be impossible to distinguish these two rooms, but we know inside something really different is happening. To illustrate that, let's say inside the minds of our two people, inside of our two rooms, is a little scratch pad. And everything they have to remember in order to do this task has to be written on that little scratch pad. If we could see what was written on that scratch pad, we would be able to tell how different their approach to the task is. So though the input and the output of these two rooms might be exactly the same, the process of getting from input to output -- completely different.
Hogy erre választ kapjunk, menjünk vissza a kínai szobába. Tegyük fel, hogy most két kínai szobánk van. Az egyikben van valaki, aki tényleg beszél kínaiul, a másik szobában viszont az álkínai ül. Ha az, aki tényleg tud kínaiul kap egy cédulát, amin kínai írás szerepel, gond nélkül elolvassa. Ha viszont az álkínai kapja az üzenetet, neki szüksége van az utasításokra ahhoz, hogy válaszolni tudjon. Kívülről lehetetlen megkülönböztetni a két szobát, de azt tudjuk, hogy a két szobában különböző folyamatok zajlanak. Képzeljük el, hogy a két szobában tartózkodó két embernek van egy kis jegyzetfüzete. Minden lépést, ami a feladat végrehajtásához szükséges, fel kell jegyezniük ebbe a füzetbe. Ha megnézhetnénk, mi áll ezekben a füzetekben, tudnánk, mennyire másként közelítik meg a feladatot. Így lehet, hogy a bemenet és a kimenet mindkét szobában ugyanaz, de a kimenethez vezető folyamat teljesen más.
So again, what does that tell us about AI? Again, if AI, even if it generates completely plausible dialogue, answers questions just like we would expect, it may still be an imposter of sorts. If we want to know if AI understands language like we do, we need to know what it's doing. We need to get inside to see what it's doing. Is it an imposter or not? We need to see its scratch pad, and we need to be able to compare it to the scratch pad of somebody who actually understands language. But like scratch pads in brains, that's not something we can actually see, right?
Mit árul ez el nekünk a mesterséges intelligenciáról? Bár az MI tökéletesen elfogadható párbeszédeket generál, és az elvárásoknak megfelelően válaszol, ezek a válaszok bizonyos szinten nem valódiak. Ha meg akarjuk tudni, hogy az MI érti-e a nyelvet úgy, ahogy mi, meg kell tudnunk, hogyan működik. Bele kell néznünk, hogy lássuk, hogy zajlik ez a folyamat: illúzió mindez vagy nem? Meg kell vizsgálnunk a jegyzettömbjét, és össze kell hasonlítanunk egy tényleges nyelvhasználó jegyzeteivel. De ahogy az emberi agyba sem láthatunk bele, ezt sem láthatjuk, igaz?
Well, it turns out that we can kind of see scratch pads in brains. Using something like fMRI or EEG, we can take what are like little snapshots of the brain while it’s reading. So have people read words or stories and then take pictures of their brain. And those brain images are like fuzzy, out-of-focus pictures of the scratch pad of the brain. They tell us a little bit about how the brain is processing and representing information while you read.
A helyzet az, hogy van rá mód, hogy belenézzünk az agy jegyzeteibe. MRI- vagy EEG-készülék segítségével pillanatfelvételt készíthetünk az agyról olvasás közben. Felkérünk embereket, hogy olvassanak el valamit, mi pedig elkészítjük a felvételeket. Ezek a képek, bár kissé homályosak és életlenek, megmutatják, mi zajlik az agyban. Megtudhatjuk belőlük, hogyan dolgozza fel és jeleníti meg az agy az információt olvasás közben.
So here are three brain images taken while a person read the word "apartment," "house" and "celery." You can see just with your naked eye that the brain image for "apartment" and "house" are more similar to each other than they are to the brain image for "celery." And you know, of course that apartments and houses are more similar than they are to celery, just the words. So said another way, the brain uses its scratchpad when reading the words "apartment" and "house" in a way that's more similar than when you read the word "celery." The scratch pad tells us a little bit about how the brain represents the language. It's not a perfect picture of what the brain's doing, but it's good enough.
Itt azokat a képeket látjuk, amelyek akkor készültek, mikor alanyaink a “lakás”, “ház” és “zeller” szavakat olvasták. Jól látható, hogy a “lakás” és “ház” szavak közelebb helyezkednek el egymáshoz, a “zellertől” viszont távolabb. És természetesen mind tudjuk, hogy a “lakás” és a “ház” jobban hasonlítanak egymáshoz, mint a “zellerhez”. Másként fogalmazva, az agyunk egymáshoz közelebb jegyzi fel a “lakás” és “ház” szavakat, a “zeller” szót viszont máshová írja. A jegyzetekből megtudhatunk valamit arról, hogyan jeleníti meg az agy a nyelvet. Nem látjuk pontosan, mit csinál az agy, de egyelőre ez is megfelel. Itt vannak tehát az agy jegyzetei.
OK, so we have scratch pads for the brain. Now we need a scratch pad for AI. So inside a lot of AIs is a neural network. And inside of a neural network is a bunch of these little neurons. So here the neurons are like these little gray circles. And we would like to know what is the scratch pad of a neural network? Well, when we feed in a word into a neural network, each of the little neurons computes a number. Those little numbers I'm representing here with colors. So every neuron computes this little number, and those numbers tell us something about how the neural network is processing language. Taken together, all of those little circles paint us a picture of how the neural network is representing language, and they give us the scratch pad of the neural network.
Ilyesmire van szükségünk az MI megértéséhez is. A mesterséges intelligencia is egyfajta neurális hálózat, és ezen a hálózaton belül számos kis neuron található. A neuronok olyanok, mint ezek a kis szürke körök. Mi pedig szeretnénk látni, hogy néznek ki a neurális hálózat jegyzetei. Ha ebbe a hálózatba betáplálunk egy szót, minden neuronhoz társítunk egy számot. A számokat itt színekkel jeleztem. Minden neuronnak van tehát egy száma, és ezekből megtudhatunk valamit arról, hogy a hálózat hogyan dolgozza fel a nyelvet. Összességében tehát a kis körök képet adnak arról, hogyan jeleníti meg a hálózat a nyelvet. Ez lesz a mesterséges ideghálózat jegyzetfüzete.
OK, great. Now we have two scratch pads, one from the brain and one from AI. And we want to know: Is AI doing something like what the brain is doing? How can we test that?
Nagyszerű! Megvan a két jegyzetfüzet: az agyé és az MI-é. Azt szeretnénk kideríteni, hogy az MI működése hasonlít-e az agyéhoz? Hogyan tudhatjuk ezt meg?
Here's what researchers have come up with. We're going to train a new model. That new model is going to look at neural network scratch pad for a particular word and try to predict the brain scratch pad for the same word. We can do it, by the way, around two. So let's train a new model. It’s going to look at the neural network scratch pad for a particular word and try to predict the brain scratchpad. If the brain and AI are doing nothing alike, have nothing in common, we won't be able to do this prediction task. It won't be possible to predict one from the other.
A kutatók a következőt javasolták: Tanítsunk be egy új modellt. Ez az modell kikeres az MI jegyzeteiből egy bizonyos szót, majd megpróbálja kitalálni, hol van ez a szó az agy jegyzeteiben, vagy fordítva. Tanítsuk hát be ezt az új modellt, amely megkeres az MI jegyzeteiben egy szót, és próbálja kitalálni, hol van ez a szó az agyban. Ha az agyban és a mesterséges intelligenciában nincs semmi közös, ha a működésük nem hasonló, a feladatot nem fogjuk tudni elvégezni. Nem fogunk tudni következtetni az egyik működéséből a másikéra.
So we've reached a fork in the road and you can probably tell I'm about to tell you one of two things. I’m going to tell you AI is amazing, or I'm going to tell you AI is an imposter. Researchers like me love to remind you that AI is nothing like the brain. And that is true. But could it also be the AI and the brain share something in common?
Itt válaszúthoz értünk, és talán már kitalálták, hogy most jön a válasz az eredeti kérdésünkre: Csoda az MI vagy inkább csalódás? Mi, kutatók szeretünk mindenkit emlékeztetni arra, hogy az MI nem úgy működik, mint az agy. És ez így is van. De lehetséges-e, hogy az agyban és az MI-ben mégis van valami közös?
So we’ve done this scratch pad prediction task, and it turns out, 75 percent of the time the predicted neural network scratchpad for a particular word is more similar to the true neural network scratchpad for that word than it is to the neural network scratch pad for some other randomly chosen word -- 75 percent is much better than chance. What about for more complicated things, not just words, but sentences, even stories? Again, this scratch pad prediction task works. We’re able to predict the neural network scratch pad from the brain and vice versa. Amazing. So does that mean that neural networks and AI understand language just like we do? Well, truthfully, no. Though these scratch pad prediction tasks show above-chance accuracy, the underlying correlations are still pretty weak. And though neural networks are inspired by the brain, they don't have the same kind of structure and complexity that we see in the brain. Neural networks also don't exist in the world. A neural network has never opened a door or seen a sunset, heard a baby cry. Can a neural network that doesn't actually exist in the world, hasn't really experienced the world, really understand language about the world?
Miután megpróbáltunk a jegyzetekből következtetéseket levonni, kiderült, hogy az esetek 75%-ában egy szó feltételezett helye a mesterséges neurális jegyzetekben közelebb van ahhoz, ahol a szó az agy jegyzeteiben szerepel, mint egy másik, tetszőleges szóhoz a mesterséges hálózatban. A 75% pedig több, mint puszta véletlen. Mi a helyzet az összetettebb dolgokkal: mondatokkal, történetekkel? Itt is működik a módszer. Az agy működéséből következtethetünk az MI-ére és fordítva. Elképesztő! Kimondhatjuk tehát, hogy a neurális hálózatok és az MI épp úgy értik a nyelvet, mint mi? Nos, az igazat megvallva, nem. Bár az elvégzett összevetések pontossága többre utal véletlenszerűségnél, a háttérben húzódó összefüggések nem egyértelműek. És bár a mesterséges hálózatok mintájául az agy szolgál, ezek mégsem olyan összetettek és strukturáltak, mint az emberi agy. Másrészről a neurális hálózatok önmagukban nem léteznek, Egyetlen neurális hálózat sem nyitott még ki ajtót, látta a naplementét, vagy hallott egy kisbabát sírni. Lehetséges-e, hogy egy önmagában nem létező mesterséges hálózat, melynek nincs saját tapasztalata a világáról, érti az emberi nyelvet?
Still, these scratch pad prediction experiments have held up -- multiple brain imaging experiments, multiple neural networks. We've also found that as the neural networks get more accurate, they also start to use their scratch pad in a way that becomes more brain-like. And it's not just language. We've seen similar results in navigation and vision.
A jegyzetfüzetek összevetése - számos hálózatban, számos agyi képalkotó kísérletben - bizonyos mértékben erre utal. Azt is megtudtuk, hogy ahogy a mesterséges hálózatok egyre pontosabbak lesznek, a jegyzetfüzetüket is elkezdik úgy használni, mint az agy. És nem csak a nyelv esetében. Hasonló eredményeket láttunk a navigáció és a látás területén is.
So AI is not doing exactly what the brain is doing, but it's not completely random either. So from where I sit, if we want to know if AI really understands language like we do, we need to get inside of the Chinese room. We need to know what the AI is doing, and we need to be able to compare that to what people are doing when they understand language.
Az MI tehát nem pontosan úgy működik, mint az agy, de működése esetlegesnek sem mondható. Úgy gondolom, hogy ha szeretnénk megtudni, hogy az MI érti-e a nyelvet úgy, mint mi, be kell mennünk a kínai szobába. Meg kell tudnunk, mit csinál pontosan az MI, és ezt össze kell hasonlítanunk azzal, amit mi, emberek csinálunk, mikor használjuk a nyelvet.
AI is moving so fast. Today, I'm asking you, does AI understand language that might seem like a silly question in ten years. Or ten months.
Az MI rendkívül gyorsan fejlődik. Ma azt kérdezem, érti-e az MI a nyelvet. Elképzelhető, hogy ez a kérdés 10 év múlva butaságnak hangzana - vagy 10 hónap múlva.
(Laughter)
(Nevetés)
But one thing will remain true. We are meaning-making humans, and we are going to continue to look for meaning and interpret the world around us. And we will need to remember that if we only look at the input and output of AI, it's very easy to be fooled. We need to get inside of the metaphorical room of AI in order to see what's happening. It's what's inside the counts.
Egy azonban biztos: értelemkereső lények vagyunk, mindig keresni fogjuk a dolgok értelmét, és próbáljuk értelmezni a körülöttünk lévő világot. Nem szabad elfelejtenünk, hogy ha csak azt nézzük, mire tanítottuk az MI-t, és mit kapunk tőle, könnyen vonhatunk le téves következtetést. Be kell jutnunk az MI kínai szobájába, hogy megtudjuk, mi zajlik ott pontosan, mert a lényeg az, ami belül van.
Thank you.
Köszönöm.
(Applause)
(Taps)