Alex Gendler: The Turing test: Can a computer pass for a human?

What is consciousness? Can an artificial machine really think? Does the mind just consist of neurons in the brain, or is there some intangible spark at its core? For many, these have been vital considerations for the future of artificial intelligence. But British computer scientist Alan Turing decided to disregard all these questions in favor of a much simpler one: can a computer talk like a human?

Nhận thức là gì? Một cỗ máy nhân tạo có thể suy nghĩ không? Có phải trí óc của ta chỉ chứa các nơ-ron thần kinh trong não, hay còn có một dấu hiệu mơ hồ nào đó nằm ngay trung tâm của não? Với nhiều người, chúng là những cân nhắc rất quan trọng cho tương lai của trí tuệ nhân tạo. Nhưng nhà khoa học máy tính người Anh Alan Turing đã gạt bỏ những câu hỏi đó cho một điều đơn giản hơn nhiều: Liệu máy tính có thể nói như con người?

This question led to an idea for measuring aritificial intelligence that would famously come to be known as the Turing test. In the 1950 paper, "Computing Machinery and Intelligence," Turing proposed the following game. A human judge has a text conversation with unseen players and evaluates their responses. To pass the test, a computer must be able to replace one of the players without substantially changing the results. In other words, a computer would be considered intelligent if its conversation couldn't be easily distinguished from a human's.

Câu hỏi này đã dẫn tới một sáng kiến để đo lường trí tuệ nhân tạo mà từ đó được nhiều người biết đến với cái tên Bài thử nghiệm Turing. Vào năm 1950, trong một bài báo với tựa đề "Những Cỗ Máy Tính Toán và Trí Thông Minh" Turing đã đề ra trò chơi sau đây. Một người giám khảo có cuộc trò chuyện qua tin nhắn với những người chơi bí ẩn. và phân tích cách trả lời của họ. Để vượt qua bài kiểm tra, máy tính phải có khả năng thế chỗ một trong các người chơi mà vẫn không thay đổi kết quả đáng kể. Nói một cách khác, máy tính sẽ được xem là thông minh nếu cuộc hội thoại của nó không khác nhiều với cuộc hội thoại của con người.

Turing predicted that by the year 2000, machines with 100 megabytes of memory would be able to easily pass his test. But he may have jumped the gun. Even though today's computers have far more memory than that, few have succeeded, and those that have done well focused more on finding clever ways to fool judges than using overwhelming computing power. Though it was never subjected to a real test, the first program with some claim to success was called ELIZA. With only a fairly short and simple script, it managed to mislead many people by mimicking a psychologist, encouraging them to talk more and reflecting their own questions back at them. Another early script PARRY took the opposite approach by imitating a paranoid schizophrenic who kept steering the conversation back to his own preprogrammed obsessions. Their success in fooling people highlighted one weakness of the test. Humans regularly attribute intelligence to a whole range of things that are not actually intelligent. Nonetheless, annual competitions like the Loebner Prize, have made the test more formal with judges knowing ahead of time that some of their conversation partners are machines.

Turing đoán là đến năm 2000, máy móc với 100 megabytes bộ nhớ sẽ dễ dàng vượt qua bài thử nghiệm này. Nhưng có lẽ ông đã nhảy trước một bước. Ngay cả khi máy tính hiện nay đã có dung lượng bộ nhớ vượt xa mức đó, rất ít máy tính vượt qua bài kiểm tra đó. và những loại máy tính làm được thì lại tập trung vào việc tìm cách thông minh để đánh lừa các giám khảo hơn là dùng năng lực tính toán siêu phàm. Dù nó chưa bao giờ được đưa ra kiểm tra trong bài thử nghiệm thật, chương trình đầu tiên được một số người công nhận là thành công mang tên ELIZA. Chỉ với một bản thảo ngắn và đơn giản, nó có thể đánh lừa nhiều người bằng cách giả dạng làm một bác sĩ tâm lý, khơi gợi họ nói nhiều hơn và phản hồi chính lời băn khoăn đó về lại họ. Một bản thảo trước đó là PARRY lại có cách tiếp cận ngược lại bằng cách mô phỏng một người bị chứng hoang tưởng tâm thần phân liệt lái câu chuyện trở về chính nỗi ám ảnh đã được lập trình trước của anh ta. Thành công trong việc lừa người khác đã nói lên một điểm yếu của bài thử nghiệm. Con người thường cho nhiều loại đồ vật là thông minh dù thực sự chúng không hề thông minh. Dù vậy, các cuộc thi hằng năm như Giải Loebner, đã làm bài thử nghiệm trở nên quy tắc hơn mà giám khảo được biết từ trước là một vài người tham gia là máy tính.

But while the quality has improved, many chatbot programmers have used similar strategies to ELIZA and PARRY. 1997's winner Catherine could carry on amazingly focused and intelligent conversation, but mostly if the judge wanted to talk about Bill Clinton. And the more recent winner Eugene Goostman was given the persona of a 13-year-old Ukrainian boy, so judges interpreted its nonsequiturs and awkward grammar as language and culture barriers. Meanwhile, other programs like Cleverbot have taken a different approach by statistically analyzing huge databases of real conversations to determine the best responses. Some also store memories of previous conversations in order to improve over time. But while Cleverbot's individual responses can sound incredibly human, its lack of a consistent personality and inability to deal with brand new topics are a dead giveaway.

Mặc dù chất lượng đã được cải thiện, nhiều lập trình viên chatbot đã sử dụng chiến thuật tương tự như ELIZA và PARRY. Người chiến thắng năm 1997 Catherine có thể dẫn dắt một cuộc hội thoại thông minh và có trọng tâm đáng kinh ngạc, nhưng chỉ khi giám khảo muốn nói về Bill Clinton. Và người chiến thắng gần đây Eugene Goostman được lập trình với tính cách của một cậu bé 13 tuổi người Ukraina, để giám khảo đánh giá ngữ pháp kỳ lạ và lập luận thiếu logic của nó như là rào cản ngôn ngữ và văn hóa. Trong khi đó, các chương trình khác như Cleverbot lại chọn con đường khác bằng cách thống kê những cơ sở dữ liệu lớn của các cuộc hội thoại thật, từ đó đưa ra câu trả lời thích hợp nhất. Vài loại máy khác có thể lưu lại thông tin về các cuộc trò chuyện trước để cải thiện từng ngày. Trong khi mỗi câu trả lời của Cleverbot nghe giống con người đến lạ thường, chúng lại thiếu cá tính đặc trưng và không có khả năng giải quyết những chủ đề mới là một dấu hiệu vạch trần rõ ràng.

Who in Turing's day could have predicted that today's computers would be able to pilot spacecraft, perform delicate surgeries, and solve massive equations, but still struggle with the most basic small talk? Human language turns out to be an amazingly complex phenomenon that can't be captured by even the largest dictionary. Chatbots can be baffled by simple pauses, like "umm..." or questions with no correct answer. And a simple conversational sentence, like, "I took the juice out of the fridge and gave it to him, but forgot to check the date," requires a wealth of underlying knowledge and intuition to parse. It turns out that simulating a human conversation takes more than just increasing memory and processing power, and as we get closer to Turing's goal, we may have to deal with all those big questions about consciousness after all.

Những người cùng thời với Turing khó mà đoán được máy tính hiện nay lại có thể điều khiển phi thuyền, làm những cuộc phẫu thuật tinh xảo, và giải được những phương trình phức tạp, nhưng lại vẫn gặp trở ngại với cuộc trò chuyện đơn giản nhất? Ngôn ngữ của con người hóa ra lại là một hiện tượng vô cùng phức tạp mà không thể bắt chước được ngay cả với từ điển lớn nhất. Chatbot có thể gặp khó khăn với những điểm dừng đơn giản, như "umm..." hay với câu hỏi không có câu trả lời đúng. Và ngay cả câu trò chuyện đơn giản, như, "Tôi lấy nước ép từ tủ lạnh và đưa cho anh ấy, nhưng lại quên kiểm tra hạn sử dụng" đòi hỏi kiến thức cơ bản dồi dào và trực giác để phân tích. Suy cho cùng, mô phỏng một cuộc trò chuyện của con người cần nhiều hơn là làm tăng bộ nhớ và khả năng xử lý năng lượng, và càng tiến gần đến mục tiêu của Turing, ta cần giải quyết tất cả những câu hỏi về nhận thức thực sự là gì.

Alex Gendler: The Turing test: Can a computer pass for a human?

Alex Gendler: The Turing test: Can a computer pass for a human?

Related talks

Briana Brownell: How does artificial intelligence learn?

Matt Porter and Margaret Hamilton: NASA's first software engineer: Margaret Hamilton

Chiara Decaroli: The high-stakes race to make quantum computers work

Related talks

Briana Brownell: How does artificial intelligence learn?

Matt Porter and Margaret Hamilton: NASA's first software engineer: Margaret Hamilton

Chiara Decaroli: The high-stakes race to make quantum computers work