Noriko Arai: Can a robot pass a university entrance exam?

Today, I'm going to talk about AI and us. AI researchers have always said that we humans do not need to worry, because only menial jobs will be taken over by machines. Is that really true? They have also said that AI will create new jobs, so those who lose their jobs will find a new one. Of course. But the real question is: How many of those who may lose their jobs to AI will be able to land a new one, especially when AI is smart enough to learn better than most of us?

Hôm nay, tôi sẽ bàn về Trí tuệ nhân tạo (TTNT) và loài người chúng ta. Những nhà nghiên cứu về TTNT luôn nói rằng con người thật sự không cần phải lo lắng vì máy móc chỉ đảm nhiệm những công việc của người giúp việc thôi. Nhưng điều đó có thật sự đúng? Họ còn nói rằng TTNT sẽ tạo ra thêm những việc làm, vì vậy những người mất việc sẽ tìm được công việc mới. Dĩ nhiên là vậy. Nhưng câu hỏi thật sự là: Có bao nhiêu người có lẽ bị mất việc vì TTNT sẽ có thể tìm được một công việc mới, đặc biệt khi TTNT đủ thông minh để có thể học hỏi tốt hơn đa số chúng ta?

Let me ask you a question: How many of you think that AI will pass the entrance examination of a top university by 2020? Oh, so many. OK. So some of you may say, "Of course, yes!" Now singularity is the issue. And some others may say, "Maybe, because AI already won against a top Go player." And others may say, "No, never. Uh-uh." That means we do not know the answer yet, right? So that was the reason why I started Todai Robot Project, making an AI which passes the entrance examination of the University of Tokyo, the top university in Japan.

Để tôi hỏi các bạn một câu hỏi: Bao nhiêu người trong các bạn nghĩ là TTNT sẽ vượt qua kì thi tuyển sinh của các trường đại học hàng đầu trước năm 2020? Ồ nhiều người nghĩ vậy sao, được rồi. Một vài người trong số các bạn có thể sẽ nói : " Tất nhiên là có!". Giả thuyết thiểu số chính là vấn đề. Và một số người khác có thể sẽ nói: " Có thể lắm chứ, bởi vì TTNT đã thắng các kì thủ cờ vây hàng đầu rồi." Những người khác có thể sẽ nói: "Uh-Uh. Không, không bao giờ. " Nghĩa là chúng ta thật sự không biết câu trả lời là gì, phải không? Đó chính là lí do vì sao tôi đã khởi động Dự án Robot Todai, nhằm chế tạo ra TTNT có khả năng vượt qua kỳ thi tuyển sinh của Đại học Tokyo, đại học hàng đầu Nhật Bản.

This is our Todai Robot. And, of course, the brain of the robot is working in the remote server. It is now writing a 600-word essay on maritime trade in the 17th century. How does that sound?

Đây là Robot Todai của chúng tôi. Và dĩ nhiên, não của chú robot này đang làm việc trên máy chủ từ xa. Chú đang viết bài văn 600 từ về thương mại hàng hải ở thế kỉ 17. Các bạn cảm thấy thế nào?

Why did I take the entrance exam as its benchmark? Because I thought we had to study the performance of AI in comparison to humans, especially on the skills and expertise which are believed to be acquired only by humans and only through education. To enter Todai, the University of Tokyo, you have to pass two different types of exams. The first one is a national standardized test in multiple-choice style. You have to take seven subjects and achieve a high score -- I would say like an 85 percent or more accuracy rate -- to be allowed to take the second stage written test prepared by Todai.

Tại sao tôi lại tham gia kì thi tuyển này theo điểm chuẩn của trường? Bởi vì tôi nghĩ chúng ta phải nghiên cứu thành tích của TTNT so với con người, đặc biệt là về mặt kĩ năng và sự thành thạo vốn được cho là chỉ con người mới đạt được, tiếp thu được và chỉ thông qua được đào tạo. Để có thể học tập tại Đại học Tokyo, Todai, bạn phải vượt qua hai bài thi khác nhau. Bài thứ nhất là khảo thí theo tiêu chuẩn quốc gia theo hình thức trắc nghiệm. Bạn phải thi bảy môn và phải đạt được điểm cao. Hay phải đúng được 84% hoặc hơn thế nữa , để đủ tiêu chuẩn làm bài thứ hai, thi viết được soạn bởi Todai.

So let me first explain how modern AI works, taking the "Jeopardy!" challenge as an example. Here is a typical "Jeopardy!" question: "Mozart's last symphony shares its name with this planet." Interestingly, a "Jeopardy!" question always asks, always ends with "this" something: "this" planet, "this" country, "this" rock musician, and so on. In other words, "Jeopardy!" doesn't ask many different types of questions, but a single type, which we call "factoid questions."

Vậy, để tôi giải thích TTNT hiện đại vận hành như thế nào, thông qua ví dụ tham gia gameshow đố vui kiến thức "Jeopardy!" Đây là câu hỏi điển hình của "Jeopardy!": "Bản giao hưởng cuối cùng của Mozart có cùng tên với hành tinh này." Thú vị là, ''Jeopardy!" luôn có câu hỏi dạng như vậy, luôn luôn kết thúc với từ "này" như: hành tinh "này", đất nước "này", nhạc sĩ nhạc rock "này", v.v. Nói cách khác, "Jeopardy!" không có nhiều loại câu hỏi đa dạng, phong phú mà chỉ có một loại, gọi là "câu hỏi factoid" (câu hỏi ai,cái gì,ở đâu...)

By the way, do you know the answer? If you do not know the answer and if you want to know the answer, what would you do? You Google, right? Of course. Why not? But you have to pick appropriate keywords like "Mozart," "last" and "symphony" to search. The machine basically does the same. Then this Wikipedia page will be ranked top. Then the machine reads the page. No, uh-uh.

Nhân tiện, bạn có biết đáp án không? Nếu bạn thật sự không tìm ra câu trả lời và nếu muốn biết, bạn sẽ làm gì? Tất nhiên là tra Google phải không? Tại sao không chứ? Nhưng bạn phải chọn ra những từ khoá thích hợp như "Mozart", "cuối cùng" và "bản giao hưởng" để tìm kiếm. Máy móc về cơ bản cũng làm giống vậy. Sau đó trang Wikipedia sẽ hiện ra ở đầu trang tìm kiếm. Và rồi máy sẽ đọc trang này. Không, uh-uh.

Unfortunately, none of the modern AIs, including Watson, Siri and Todai Robot, is able to read. But they are very good at searching and optimizing. It will recognize that the keywords "Mozart," "last" and "symphony" are appearing heavily around here. So if it can find a word which is a planet and which is co-occurring with these keywords, that must be the answer. This is how Watson finds the answer "Jupiter," in this case.

Không may là, không có một TTNT hiện đại nào, bao gồm cả Watson, Siri and Robot Todai, có thể đọc được. Nhưng chúng lại rất giỏi trong việc tìm kiếm và tối ưu hoá. Nó sẽ nhận dạng các từ khoá "Mozart", "cuối cùng" và "bản giao hưởng" đang xuất hiện dày đặc khắp xung quanh. Vì vậy nếu nó có thể tìm ra từ "hành tinh" và từ đồng thời xuất hiện với những từ khoá này, đó chắc chắn là câu trả lời. Trong trường hợp này, đây chính là cách Watson tìm ra đáp án "Jupiter" (Sao Mộc) .

Our Todai Robot works similarly, but a bit smarter in answering history yes-no questions, like, "'Charlemagne repelled the Magyars.' Is this sentence true or false?" Our robot starts producing a factoid question, like: "Charlemagne repelled [this person type]" by itself. Then, "Avars" but not "Magyars" is ranked top. This sentence is likely to be false. Our robot does not read, does not understand, but it is statistically correct in many cases.

Robot Todai cũng làm việc tương tự vậy, nhưng thông minh hơn một chút trong việc trả lời các câu hỏi về lịch sử dạng có- không, như: "Hoàng đế Charlemagne đã chinh phục người Magyar. Đúng hay sai?" Robot liền bắt đầu tự đưa ra câu hỏi factoid, như: "Hoàng đế Charlemagne đã chinh phục [người này]." Sau đó, "người Avar" sẽ xuất hiện ở top tìm kiếm thay vì "người Magya". Câu này có thể sai. Bởi vì robot của chúng tôi thật sự không đọc được, không hiểu được, nhưng qua số liệu thống kê, nó lại đúng trong rất nhiều trường hợp.

For the second stage written test, it is required to write a 600-word essay like this one:

Về bài thi viết của bước thứ hai, yêu cầu phải viết một bài văn dài 600 từ chẳng hạn như:

[Discuss the rise and fall of the maritime trade in East and Southeast Asia in the 17th century ...]

[Bàn về sự tăng và giảm của thương mại hàng hải ở phía Đông và Đông Nam châu Á trong thế kỉ 17...]

and as I have shown earlier, our robot took the sentences from the textbooks and Wikipedia, combined them together, and optimized it to produce an essay without understanding a thing.

và như những gì tôi đã nói, robot đã trích những câu từ sách giáo khoa và Wikipedia, rồi kết hợp chúng lại với nhau, và tối ưu hoá để viết thành một bài văn mà chẳng cần hiểu một thứ gì cả.

(Laughter)

(Tiếng cười)

But surprisingly, it wrote a better essay than most of the students.

Nhưng thật bất ngờ, bài văn mà robot viết còn tốt hơn cả đa số học sinh.

(Laughter)

(Tiếng cười)

How about mathematics? A fully automatic math-solving machine has been a dream since the birth of the word "artificial intelligence," but it has stayed at the level of arithmetic for a long, long time. Last year, we finally succeeded in developing a system which solved pre-university-level problems from end to end, like this one. This is the original problem written in Japanese, and we had to teach it 2,000 mathematical axioms and 8,000 Japanese words to make it accept the problems written in natural language. And it is now translating the original problems into machine-readable formulas. Weird, but it is now ready to solve it, I think. Go and solve it. Yes! It is now executing symbolic computation. Even more weird, but probably this is the most fun part for the machine.

Vậy môn Toán thì sao? Một chiếc máy giải toán tự động hoàn toàn luôn là ước mơ của bao người từ lúc thuật ngữ "Trí tuệ nhân tạo" ra đời nhưng nó vẫn chỉ gói gọn ở cấp độ thuật toán đã rất lâu, rất lâu rồi. Vào năm ngoái, cuối cùng chúng tôi cũng thành công trong việc phát triển hệ thống giải toán cấp độ dự bị đại học từ đầu đến cuối, như cái này đây. Đây là bài toán gốc viết bằng tiếng Nhật, và chúng tôi đã phải dạy robot những 2000 tiên đề toán học và 8000 chữ Nhật để nó chấp nhận những bài toán được viết bằng ngôn ngữ tự nhiên. Và hiện tại nó đang dịch các bài toán gốc sang dạng thuật ngữ máy tính. Có vẻ kì quặc nhưng tôi nghĩ là robot bây giờ đã sẵn sàng để giải toán rồi. Giải đi nào. Đúng vậy! Hiện giờ robot đang tính toán các thuật toán dùng kí hiệu. Nghe có vẻ kì lạ hơn nhưng đó chắc chắn là phần thú vị nhất của chiếc máy.

(Laughter)

(Tiếng cười)

Now it outputs a perfect answer, though its proof is impossible to read, even for mathematicians. Anyway, last year our robot was among the top one percent in the second stage written exam in mathematics.

Bây giờ robot xuất ra một đáp án hoàn hảo, ngay cả các nhà toán học cũng không thể hiểu được cách đáp án được chứng minh. Dù sao chăng nữa thì vào năm ngoái, robot của chúng tôi nằm trong top 1% ở bài thứ hai, bài thi toán tự luận.

(Applause)

(Vỗ tay)

Thank you.

Cám ơn.

So, did it enter Todai? No, not as I expected. Why? Because it doesn't understand any meaning. Let me show you a typical error it made in the English test.

Vậy, robot có được học tại Todai? Không, khác xa những gì tôi mong chờ. Tại sao ư? Vì nó không thể hiểu những thứ có nghĩa. Để tôi đưa ra lỗi sai điển hình mà chú mắc phải trong bài kiểm tra tiếng Anh.

[Nate: We're almost at the bookstore. Just a few more minutes. Sunil: Wait. ______ . Nate: Thank you! That always happens ...]

[Nate: Chúng ta gần đến nhà sách rồi. Một vài phút nữa thôi. Sunil: Chờ đã.____. Nate: Cám ơn! Chuyện này xảy ra suốt...]

Two people are talking. For us, who can understand the situation --

Bọn họ đang nói chuyện. Chúng tôi có thể hiểu tình huống như sau:

[1. "We walked for a long time." 2. "We're almost there." 3. "Your shoes look expensive." 4. "Your shoelace is untied."]

[1."Chúng ta đã đi lâu lắm rồi." 2."Chúng ta gần tới rồi." 3."Giày của bạn nhìn đắt quá." 4."Dây giày bạn bung rồi kìa."]

it is obvious number four is the correct answer, right? But Todai Robot chose number two, even after learning 15 billion English sentences using deep learning technologies. OK, so now you might understand what I said: modern AIs do not read, do not understand. They only disguise as if they do.

Rõ ràng số 4 là đáp án chính xác, đúng không? Nhưng Robot Todai lại chọn số 2, mặc dù nó đã học 15 triệu câu tiếng Anh, sử dụng các công nghệ Deep Learning. Được rồi, bây giờ các bạn có thể đã hiểu tôi nói gì rồi: TTNT hiện đại thật sự không đọc được, không hiểu được. Chúng chỉ đang nguỵ trang như thể chúng có thể đọc, hiểu được vậy.

This is the distribution graph of half a million students who took the same exam as Todai Robot. Now our Todai Robot is among the top 20 percent, and it was capable to pass more than 60 percent of the universities in Japan -- but not Todai. But see how it is beyond the volume zone of to-be white-collar workers.

Đây là đồ thị phân loại 500.000 học sinh tham dự kì thi giống với Robot Todai. Robot Todai nằm trong số top 20%, có thể đạt đủ điểm chuẩn kì thi của hơn 60% các trường đại học ở Nhật Bản, ngoại trừ trường Todai Nhưng có thể thấy rằng robot nằm ngoài khu vực những người chuẩn bị trở thành nhân viên văn phòng.

You might think I was delighted. After all, my robot was surpassing students everywhere. Instead, I was alarmed. How on earth could this unintelligent machine outperform students -- our children? Right? I decided to investigate what was going on in the human world. I took hundreds of sentences from high school textbooks and made easy multiple-choice quizzes, and asked thousands of high school students to answer.

Bạn có thể nghĩ là tôi đã rất vui mừng. Vì sau tất cả, robot của tôi đã vượt trội hơn những học sinh từ khắp mọi nơi. Thay vì vui mừng, tôi đã hoảng sợ. Làm thế nào cỗ máy không hiểu biết gì lại thể hiện giỏi hơn con em chúng ta? Phải không? Tôi quyết định nghiên cứu chuyện gì đã xảy ra với thế giới loài người. Tôi đã trích hàng trăm câu từ sách giáo khoa bậc trung học và biến chúng thành những câu đố đơn giản theo hình thức trắc nghiệm, và đem hỏi hàng ngàn học sinh trung học.

Here is an example:

Và đây là ví dụ:

[Buddhism spread to ... , Christianity to ... and Oceania, and Islam to ...]

[Đạo Phật truyền bá đến...,Đạo Chúa đến ...và Châu Đại Dương và đạo Hồi truyền đến..]

Of course, the original problems are written in Japanese, their mother tongue.

Các câu hỏi gốc này tất nhiên được viết bằng tiếng Nhật, tiếng mẹ đẻ của các em.

[ ______ has spread to Oceania. 1. Hinduism 2. Christianity 3. Islam 4. Buddhism ]

[ __lan rộng tới châu Đại Dương 1. Đạo Hindu 2. Đạo Cơ đốc 3. Đạo Hồi 4.Đạo Phật ]

Obviously, Christianity is the answer, isn't it? It's written! And Todai Robot chose the correct answer, too. But one-third of junior high school students failed to answer this question. Do you think it is only the case in Japan? I do not think so, because Japan is always ranked among the top in OECD PISA tests, measuring 15-year-old students' performance in mathematics, science and reading every three years.

Đạo Cơ đốc rõ ràng là đáp án đúng, phải không? Đáp án được viết ra rồi! Và Robot Todai cũng chọn ngay đáp án chính xác luôn. Nhưng 1/3 học sinh trung học cơ sở đã không đưa ra được đáp án chính xác. Vậy bạn có nghĩ đó là trường hợp duy nhất chỉ xảy ra ở Nhật không? Nhưng tôi thật sự không nghĩ như vậy, Vì Nhật luôn có kết quả nằm trong top của bài kiểm tra PISA trong OECD, xem xét đánh giá năng lực đạt được của học sinh lứa tuổi 15 trong lĩnh vực toán, khoa học và đọc hiểu trong mỗi 3 năm.

We have been believing that everybody can learn and learn well, as long as we provide good learning materials free on the web so that they can access through the internet. But such wonderful materials may benefit only those who can read well, and the percentage of those who can read well may be much less than we expected. How we humans will coexist with AI is something we have to think about carefully, based on solid evidence. At the same time, we have to think in a hurry because time is running out.

Chúng tôi vẫn luôn tin tưởng rằng mọi người có thể học và có thể học tốt, học giỏi, miễn là chúng ta cứ cung cấp những tài liệu học tập thật tốt miễn phí trên web để mọi người có thể tiếp cận qua internet. Nhưng những tài liệu tuyệt vời này có thể chỉ giúp ích cho người có thể đọc hiểu tốt và phần trăm số người có khả năng đọc hiểu tốt có lẽ ít hơn hẳn chúng tôi đã nghĩ. Vậy chúng ta phải suy nghĩ cẩn thận rằng làm sao loài người lại có thể cùng tồn tại với Trí tuệ nhân tạo dựa vào căn cứ xác thực. Đồng thời, chúng ta phải gấp rút suy nghĩ bởi vì thời gian đang dần rút ngắn đi rồi.

Thank you.

Cám ơn.

(Applause)

(Tiếng vỗ tay)

Chris Anderson: Noriko, thank you.

Xin cám ơn bà Noriko.

Noriko Arai: Thank you.

Cám ơn.

CA: In your talk, you so beautifully give us a sense of how AIs think, what they can do amazingly and what they can't do. But -- do I read you right, that you think we really need quite an urgent revolution in education to help kids do the things that humans can do better than AIs?

Trong bài nói,bà đã cho thấy việc TTNT suy nghĩ ra sao, thứ chúng có thể làm xuất sắc và thứ chúng không thể làm được. Nhưng, tôi có hiểu ý bà không, rằng chúng ta cần một cuộc cách mạng khẩn cấp trong lĩnh vực giáo dục nhằm giúp thế hệ mai sau thực hiện các thứ con người vốn có thể làm tốt hơn TTNT, phải không?

NA: Yes, yes, yes. Because we humans can understand the meaning. That is something which is very, very lacking in AI. But most of the students just pack the knowledge without understanding the meaning of the knowledge, so that is not knowledge, that is just memorizing, and AI can do the same thing. So we have to think about a new type of education.

Vâng, đúng, đúng vậy. Bởi vì loài người chúng ta có thể hiểu được ý nghĩa, thứ mà TTNT rất, rất thiếu. Nhưng phần lớn học sinh chỉ biết nhồi nhét kiến thức vào đầu mình mà không hiểu được ý nghĩa những thứ các em đang học thật sự là gì. Đó cũng chỉ là thứ ta đang cố nhớ, không phải là kiến thức và TTNT có thể làm tương tự như thế. Vì vậy, chúng ta cần nghĩ đến một loại hình giáo dục mới.

CA: A shift from knowledge, rote knowledge, to meaning.

Tức là thay đổi từ kiến thức, học vẹt sang học theo kiểu hiểu ý nghĩa.

NA: Mm-hmm.

Ừm.

CA: Well, there's a challenge for the educators. Thank you so much.

Vâng,đó sẽ là thách thức cho những người làm giáo dục đây.Cám ơn bà.

NA: Thank you very much. Thank you.

Cám ơn rất nhiều. Cám ơn.

(Applause)

(Tiếng vỗ tay)

This is our Todai Robot. And, of course, the brain of the robot is working in the remote server. It is now writing a 600-word essay on maritime trade in the 17th century. How does that sound?

For the second stage written test, it is required to write a 600-word essay like this one:

Về bài thi viết của bước thứ hai, yêu cầu phải viết một bài văn dài 600 từ chẳng hạn như:

[Discuss the rise and fall of the maritime trade in East and Southeast Asia in the 17th century ...]

[Bàn về sự tăng và giảm của thương mại hàng hải ở phía Đông và Đông Nam châu Á trong thế kỉ 17...]

and as I have shown earlier, our robot took the sentences from the textbooks and Wikipedia, combined them together, and optimized it to produce an essay without understanding a thing.

(Laughter)

(Tiếng cười)

But surprisingly, it wrote a better essay than most of the students.

Nhưng thật bất ngờ, bài văn mà robot viết còn tốt hơn cả đa số học sinh.

(Laughter)

(Tiếng cười)

(Laughter)

(Tiếng cười)

(Applause)

(Vỗ tay)

Thank you.

Cám ơn.

So, did it enter Todai? No, not as I expected. Why? Because it doesn't understand any meaning. Let me show you a typical error it made in the English test.

[Nate: We're almost at the bookstore. Just a few more minutes. Sunil: Wait. ______ . Nate: Thank you! That always happens ...]

[Nate: Chúng ta gần đến nhà sách rồi. Một vài phút nữa thôi. Sunil: Chờ đã.____. Nate: Cám ơn! Chuyện này xảy ra suốt...]

Two people are talking. For us, who can understand the situation --

Bọn họ đang nói chuyện. Chúng tôi có thể hiểu tình huống như sau:

[1. "We walked for a long time." 2. "We're almost there." 3. "Your shoes look expensive." 4. "Your shoelace is untied."]

[1."Chúng ta đã đi lâu lắm rồi." 2."Chúng ta gần tới rồi." 3."Giày của bạn nhìn đắt quá." 4."Dây giày bạn bung rồi kìa."]

Here is an example:

Và đây là ví dụ:

[Buddhism spread to ... , Christianity to ... and Oceania, and Islam to ...]

[Đạo Phật truyền bá đến...,Đạo Chúa đến ...và Châu Đại Dương và đạo Hồi truyền đến..]

Of course, the original problems are written in Japanese, their mother tongue.

Các câu hỏi gốc này tất nhiên được viết bằng tiếng Nhật, tiếng mẹ đẻ của các em.

[ ______ has spread to Oceania. 1. Hinduism 2. Christianity 3. Islam 4. Buddhism ]

[ __lan rộng tới châu Đại Dương 1. Đạo Hindu 2. Đạo Cơ đốc 3. Đạo Hồi 4.Đạo Phật ]

Thank you.

Cám ơn.

(Applause)

(Tiếng vỗ tay)

Chris Anderson: Noriko, thank you.

Xin cám ơn bà Noriko.

Noriko Arai: Thank you.

Cám ơn.

CA: A shift from knowledge, rote knowledge, to meaning.

Tức là thay đổi từ kiến thức, học vẹt sang học theo kiểu hiểu ý nghĩa.

NA: Mm-hmm.

Ừm.

CA: Well, there's a challenge for the educators. Thank you so much.

Vâng,đó sẽ là thách thức cho những người làm giáo dục đây.Cám ơn bà.

NA: Thank you very much. Thank you.

Cám ơn rất nhiều. Cám ơn.

(Applause)

(Tiếng vỗ tay)

Noriko Arai: Can a robot pass a university entrance exam?

Noriko Arai: Can a robot pass a university entrance exam?

Related talks

Zeynep Tufekci: Machine intelligence makes human morals more important

Robin Hanson: What would happen if we upload our brains to computers?

Joseph Redmon: How computers learn to recognize objects instantly

Stuart Russell: 3 principles for creating safer AI

Kriti Sharma: How to keep human bias out of AI

David Lee: Why jobs of the future won't feel like work

Related talks

Zeynep Tufekci: Machine intelligence makes human morals more important

Robin Hanson: What would happen if we upload our brains to computers?

Joseph Redmon: How computers learn to recognize objects instantly

Stuart Russell: 3 principles for creating safer AI

Kriti Sharma: How to keep human bias out of AI

David Lee: Why jobs of the future won't feel like work