Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients,

Ngày nay,

pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

trí tuệ nhân tạo đang giúp đỡ các bác sĩ trong việc chẩn đoán bệnh cho bệnh nhân, giúp các phi công thực hiện các chuyến bay thương mại, và giúp các nhà quy hoạch thành phố dự đoán giao thông. Nhưng cho dù những AI này đang làm gì, các nhà khoa học đã thiết kế chúng có thể không biết chính xác họ đang làm như thế nào. Điều này là do tính tự học của trí tuệ nhân tạo, khi chúng thực hiện một tập hợp các hướng dẫn đơn giản để tạo một chuỗi độc nhất bao gồm các quy tắc và chiến lược. Vậy chính xác thì máy tính học như thế nào?

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Có nhiều cách khác nhau để xây dựng các chương trình tự học. Nhưng tất cả đều dựa vào ba loại học máy cơ bản: học không giám sát, học có giám sát, và học tăng cường. Để thấy được sự hoạt động của từng loại, hãy tưởng tượng các nhà nghiên cứu đang cố gắng lấy thông tin từ một tập hợp dữ liệu y tế có chứa hàng ngàn hồ sơ bệnh nhân.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Trước hết, về học không giám sát. Cách tiếp cận này sẽ là lý tưởng để phân tích tất cả các cấu hình để tìm các điểm tương đồng và các mẫu hữu ích. Một số bệnh nhân có thể có biểu hiện bệnh giống nhau, hoặc phương pháp điều trị có thể tạo ra các bộ tác dụng phụ cụ thể. Cách tiếp cận tìm kiếm mẫu trên diện rộng này có thể được sử dụng để xác định các điểm tương đồng giữa các hồ sơ bệnh nhân và tìm các mẫu mới nổi, tất cả được thực hiện không có sự hướng dẫn của con người.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Nhưng hãy tưởng tượng rằng các bác sĩ đang tìm kiếm cái gì đó cụ thể hơn. Các bác sĩ muốn tạo một thuật toán để chẩn đoán một tình trạng cụ thể. Họ bắt đầu bằng cách thu thập hai bộ dữ liệu— hình ảnh y tế và kết quả xét nghiệm từ cả những bệnh nhân khỏe mạnh và những người được chẩn đoán mắc bệnh. Sau đó, họ nhập dữ liệu này vào một chương trình được thiết kế để xác định các tính năng chia sẻ của người bệnh nhưng không phải các bệnh nhân khoẻ mạnh. Dựa trên tần suất xuất hiện của một số tính năng nhất định, chương trình sẽ gán giá trị cho những ý nghĩa chẩn đoán của các tính năng, nhằm tạo ra một thuật toán để chẩn đoán bệnh nhân trong tương lai. Tuy nhiên, khác với học không giám sát, các bác sĩ và nhà khoa học đóng vai trò tích cực trong những gì sắp xảy ra. Các bác sĩ sẽ đưa ra chẩn đoán cuối cùng và kiểm tra độ chính xác của dự đoán bằng thuật toán. Sau đó, các nhà khoa học có thể sử dụng bộ dữ liệu được cập nhật để điều chỉnh các thông số chương trình và cải thiện độ chính xác của nó. Phương pháp thực hành này được gọi là học có giám sát.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Bây giờ, giả sử các bác sĩ muốn thiết kế một thuật toán khác để đề xuất kế hoạch điều trị. Vì những kế hoạch này sẽ được thực hiện theo từng giai đoạn, và chúng có thể thay đổi theo phản ứng của từng cá nhân với phương pháp điều trị của họ, các bác sĩ quyết định sử dụng học tăng cường. Chương trình này sử dụng phương pháp lặp lại để thu thập phản hồi về loại thuốc, liều lượng và các phương pháp điều trị có hiệu quả nhất. Sau đó, nó so sánh dữ liệu đó đối chiếu với hồ sơ của bệnh nhân để đưa ra kế hoạch điều trị. Khi các phương pháp điều trị có tiến triển và chương trình nhận được nhiều phản hồi hơn, nó có thể liên tục cập nhật kế hoạch cho từng bệnh nhân. Không có kỹ thuật nào trong ba kỹ thuật kể trên thông minh hơn hẳn. Trong khi một số yêu cầu nhiều hoặc ít hơn sự can thiệp của con người, tất cả chúng đều có thế mạnh và điểm yếu riêng, điều đó khiến chúng phù hợp nhất với các nhiệm vụ nhất định. Tuy nhiên, bằng cách sử dụng chúng cùng nhau, các nhà nghiên cứu có thể xây dựng các hệ thống AI phức tạp, nơi các chương trình riêng lẻ có thể giám sát và dạy lẫn nhau. Ví dụ như, khi chương trình học không giám sát tìm kiếm những nhóm bệnh nhân giống nhau nó có thể gửi dữ liệu để kết nối đến chương trình học giám sát. Chương trình này sau đó kết hợp thông tin vào dự đoán của nó hoặc có lẽ là hàng tá sự củng cố của chương trình học có thể mô phỏng kết quả tiềm năng để thu thập phản hồi về các kế hoạch điều trị khác nhau.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Có khá nhiều cách để tạo hệ thống máy móc học và có lẽ mô hình nhiều triển vọng nhất là người có khả năng bắt chước mối quan hệ giữa tế bào thần kinh não. Các trí tuệ nơ-ron nhân tạo này có thể sử dụng hàng triệu kết nối để giải quyết các nhiệm vụ khó khăn như nhận dạng hình ảnh, nhận dạng giọng nói, và thậm chí là dịch nhiều ngôn ngữ. Tuy nhiên, khi những mô hình này càng trở nên tự định hướng, càng khó hơn cho các nhà khoa học máy tính để xác định cách tự học thuật toán và đưa ra những giải pháp. Các nhà nghiên cứu đang tìm cách để việc học máy trở nên minh bạch hơn. Nhưng khi AI tham gia nhiều hơn vào cuộc sống của chúng ta, những quyết định bí ẩn này có tác động ngày càng lớn tới công việc, sức khỏe và sự an toàn của chúng ta. Vì vậy, khi máy móc tiếp tục học để điều tra, thương lượng và giao tiếp, chúng ta cũng phải xem xét cách dạy chúng để chúng dạy nhau hoạt động có đạo đức.

Today, artificial intelligence helps doctors diagnose patients,

Ngày nay,

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?