Alex Gendler: The Turing test: Can a computer pass for a human?

What is consciousness? Can an artificial machine really think? Does the mind just consist of neurons in the brain, or is there some intangible spark at its core? For many, these have been vital considerations for the future of artificial intelligence. But British computer scientist Alan Turing decided to disregard all these questions in favor of a much simpler one: can a computer talk like a human?

Mi a tudat? Képes-e egy gép valóban gondolkodni? Az elme csupán idegsejtek hálózata az agyban? Vagy van a mélyén valami megfoghatatlan szikra? Sokak számára lényegi kérdések ezek a mesterséges értelem jövőjével kapcsolatban. Ám Alan Turing brit informatikus mellőzte mindezeket a kérdéseket, és egy jóval egyszerűbbre koncentrált: képes-e a számítógép úgy beszélgetni, mint egy ember?

This question led to an idea for measuring aritificial intelligence that would famously come to be known as the Turing test. In the 1950 paper, "Computing Machinery and Intelligence," Turing proposed the following game. A human judge has a text conversation with unseen players and evaluates their responses. To pass the test, a computer must be able to replace one of the players without substantially changing the results. In other words, a computer would be considered intelligent if its conversation couldn't be easily distinguished from a human's.

A kérdés a mesterséges értelem mérésének ötletéhez vezetett, ami később Turing-teszt néven vált ismertté. A Computing Machinery and Intelligence című, 1950-ben megjelent tanulmányában Turing egy próba ötletével állt elő: Egy bíráló írásban beszélget nem látható játékosokkal, majd értékeli a válaszaikat. A próba akkor sikeres, ha egy számítógép be tud állni az egyik játékos helyére úgy, hogy a csere jóformán észrevétlen a végeredmény szempontjából. Azaz egy számítógépet akkor tekinthetnénk értelmesnek, ha úgy beszélgetne, hogy az nem lenne megkülönböztethető az emberi csevegéstől.

Turing predicted that by the year 2000, machines with 100 megabytes of memory would be able to easily pass his test. But he may have jumped the gun. Even though today's computers have far more memory than that, few have succeeded, and those that have done well focused more on finding clever ways to fool judges than using overwhelming computing power. Though it was never subjected to a real test, the first program with some claim to success was called ELIZA. With only a fairly short and simple script, it managed to mislead many people by mimicking a psychologist, encouraging them to talk more and reflecting their own questions back at them. Another early script PARRY took the opposite approach by imitating a paranoid schizophrenic who kept steering the conversation back to his own preprogrammed obsessions. Their success in fooling people highlighted one weakness of the test. Humans regularly attribute intelligence to a whole range of things that are not actually intelligent. Nonetheless, annual competitions like the Loebner Prize, have made the test more formal with judges knowing ahead of time that some of their conversation partners are machines.

Turing jóslata szerint 2000-re odáig jutunk, hogy a 100 MB memóriájú gépek könnyedén kiállják majd ezt a próbát. De a jóslat talán elhamarkodott volt. Bár a mai számítógépeknek ennél jóval nagyobb a memóriájuk, csak kevesen mentek át a teszten, és amelyek sikerrel vették az akadályt, azok inkább a bírálók ügyes átejtésének köszönhették a sikert, nem pedig a lenyűgöző számítási képességeiknek. Bár soha nem tesztelték élesben, az első némileg sikeresnek mondható program az ELIZA volt. Egy viszonylag rövid és egyszerű program használatával sikerült sokakat félrevezetnie úgy, hogy egy pszichológust utánozva beszédre biztatta beszélgetőtársait, és visszadobta nekik tulajdon kérdéseiket. A PARRY nevű másik korai program más irányból közelítette meg a kérdést, és egy paranoid skizofrént utánzott, aki folyton beprogramozott mániáira terelte a szót. ELIZA és PARRY sikere felhívta a figyelmet a teszt egyik gyenge pontjára. Mégpedig arra, hogy gyakran tulajdonítunk értelmet egy sor olyan dolognak, amelyek valójában nem értelmesek. Mindenesetre az olyan éves versenyek, mint a Loebner-díj formálisabbá tették a tesztet. A bírálók itt előre tudják, hogy egyes csevegőtársaik gépek lesznek.

But while the quality has improved, many chatbot programmers have used similar strategies to ELIZA and PARRY. 1997's winner Catherine could carry on amazingly focused and intelligent conversation, but mostly if the judge wanted to talk about Bill Clinton. And the more recent winner Eugene Goostman was given the persona of a 13-year-old Ukrainian boy, so judges interpreted its nonsequiturs and awkward grammar as language and culture barriers. Meanwhile, other programs like Cleverbot have taken a different approach by statistically analyzing huge databases of real conversations to determine the best responses. Some also store memories of previous conversations in order to improve over time. But while Cleverbot's individual responses can sound incredibly human, its lack of a consistent personality and inability to deal with brand new topics are a dead giveaway.

És bár a csevegőrobotok egyre jobbak, a programozóik gyakran nyúlnak vissza az ELIZA- és a PARRY-szerű stratégiákhoz. Catherine, az 1997-es díj nyertese képes volt elképesztő összeszedetten és értelmesen beszélgetni, de leginkább csak akkor, ha a bíráló Bill Clintonról akart csevegni. Egy későbbi nyertes, Eugene Goostman egy 13 éves ukrán fiút személyesített meg, úgyhogy a bírálók a nyelvi nehézségeknek és a kulturális különbségeknek tudták be a robot csapongását és esetlen nyelvtani szerkezeteit. Eközben más programok, pl. a Cleverbot, más taktikát alkalmaztak: valódi beszélgetések nagy adatbázisait elemezték statisztikai módszerekkel hogy megtalálják a legjobb válaszokat. Néhány gép meg is jegyzi a korábbi beszélgetéseket, így idővel képes a fejlődésre. De míg Cleverbot egyes válaszai hihetetlenül emberien hangzanak, a következetes személyiség hiánya és az, hogy új témákkal nem tud mit kezdeni, rögtön leleplezik a programot.

Who in Turing's day could have predicted that today's computers would be able to pilot spacecraft, perform delicate surgeries, and solve massive equations, but still struggle with the most basic small talk? Human language turns out to be an amazingly complex phenomenon that can't be captured by even the largest dictionary. Chatbots can be baffled by simple pauses, like "umm..." or questions with no correct answer. And a simple conversational sentence, like, "I took the juice out of the fridge and gave it to him, but forgot to check the date," requires a wealth of underlying knowledge and intuition to parse. It turns out that simulating a human conversation takes more than just increasing memory and processing power, and as we get closer to Turing's goal, we may have to deal with all those big questions about consciousness after all.

Ki gondolta volna Turing idejében, hogy a mai számítógépek képesek lesznek űrrepülőket irányítani, kényes műtéteket végrehajtani, és bonyolult egyenleteket megoldani, de még mindig elvéreznek majd a legegyszerűbb csevegés során? Az emberi nyelv elképesztően összetett jelenség, amelyet a legnagyobb szótárakkal sem lehet megragadni. A csevegőrobotok képesek összezavarodni szimpla szünetektől, mint pl. "öööö" vagy olyan kérdésektől, amikre nincs helyes válasz. Egy sima mondat értelmezése, pl. hogy "Kivettem a gyümölcslevet a hűtőből, és odaadtam neki, de elfelejtettem megnézni a dátumot", rengeteg mögöttes tudást és ösztönös értést feltételez. Az emberi beszélgetés utánzásához, úgy tűnik, hogy talán nem elég csak a gép memóriáját és a processzor sebességét növelni, és ahogy közeledünk Turing célja felé, végül talán szembe kell néznünk a tudattal kapcsolatos összes nagy kérdéssel.

Alex Gendler: The Turing test: Can a computer pass for a human?

Alex Gendler: The Turing test: Can a computer pass for a human?

Related talks

Briana Brownell: How does artificial intelligence learn?

Matt Porter and Margaret Hamilton: NASA's first software engineer: Margaret Hamilton

Chiara Decaroli: The high-stakes race to make quantum computers work

Related talks

Briana Brownell: How does artificial intelligence learn?

Matt Porter and Margaret Hamilton: NASA's first software engineer: Margaret Hamilton

Chiara Decaroli: The high-stakes race to make quantum computers work