Briana Brownell: How does artificial intelligence learn?

Σήμερα, η τεχνητή νοημοσύνη βοηθάει στις ιατρικές διαγνώσεις, στην πτήση αεροπλάνων και στην πρόγνωση της κίνησης στους δρόμους. Ό,τι και αν κάνει όμως, οι μηχανικοί υπολογιστών που τη σχεδίασαν πιθανότατα δε γνωρίζουν πώς ακριβώς το κάνει. Αυτό συμβαίνει επειδή η τεχνητή νοημοσύνη είναι συχνά αυτοδίδακτη, επεξεργαζόμενη ένα απλό σύνολο οδηγιών, για να δημιουργήσει μια μοναδική σειρά κανόνων και στρατηγικών. Πώς ακριβώς λοιπόν μαθαίνει μια μηχανή;

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Υπάρχουν πολλοί τρόποι να δημιουργήσουμε προγράμματα αυτοδίδαξης. ’Όλα όμως βασίζονται στους τρεις βασικούς τύπους μηχανικής εκμάθησης: μάθηση χωρίς επιτήρηση, με επιτήρηση και ενισχυτική μάθηση. Για να τους δούμε στην πράξη, ας φανταστούμε ότι ερευνητές προσπαθούν να εξάγουν πληροφορίες από ένα πακέτο ιατρικών δεδομένων που περιλαμβάνει χιλιάδες προφίλ ασθενών.

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Πρώτα από όλα, μάθηση χωρίς επιτήρηση. Η προσέγγιση αυτή θα ήταν ιδανική για την ανάλυση όλων των προφίλ ώστε να βρεθούν ομοιότητες και χρήσιμα μοτίβα. Ίσως κάποιοι ασθενείς έχουν όμοιες εκφάνσεις της ασθένειας ή ίσως μια θεραπεία προκαλεί συγκεκριμένες σειρές παρενεργειών. Η ευρεία αυτή μορφή ανίχνευσης μοτίβων θα χρησίμευε στην αναγνώριση ομοιοτήτων ανάμεσα στα προφίλ ασθενών και στην εύρεση μοτίβων, χωρίς την ανθρώπινη καθοδήγηση.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Ας φανταστούμε όμως ότι οι ιατροί ψάχνουν για κάτι πιο συγκεκριμένο. Οι ιατροί αυτοί θέλουν να δημιουργήσουν έναν αλγόριθμο για τη διάγνωση μιας συγκεκριμένης πάθησης. Ξεκινούν με τη συλλογή δύο πακέτων δεδομένων -- ιατρικές απεικονίσεις και αποτελέσματα εξετάσεων και από υγιείς ασθενείς και από αυτούς που διαγνώστηκαν με την πάθηση. Μετά, εισάγουν αυτά τα δεδομένα σε ένα πρόγραμμα σχεδιασμένο για να αναγνωρίζει κοινά χαρακτηριστικά των άρρωστων ασθενών αλλά όχι των υγιών ασθενών. Βασιζόμενο στο πόσο συχνά βλέπει συγκεκριμένα χαρακτηριστικά, το πρόγραμμα θα αντιστοιχεί αξίες στη διαγνωστική σημασία τους, παράγοντας έναν αλγόριθμο για τη μελλοντική διάγνωση ασθενών. Ωστόσο, αντίθετα με τη μάθηση χωρίς επιτήρηση, οι γιατροί και οι μηχανικοί υπολογιστών έχουν ενεργό ρόλο σε αυτό που ακολουθεί. Οι γιατροί θα κάνουν την τελική διάγνωση και θα ελέγχουν την ακρίβεια της πρόβλεψης του αλγόριθμου. Τότε, οι μηχανικοί υπολογιστών μπορούν να χρησιμοποιούν τα ανανεωμένα δεδομένα για την προσαρμογή των παραμέτρων και τη βελτίωση της ακρίβειας του προγράμματος. Αυτή η πρακτική προσέγγιση λέγεται μάθηση με επιτήρηση.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Ας πούμε λοιπόν ότι οι γιατροί θέλουν να σχεδιάσουν έναν άλλον αλγόριθμο για να προτείνουν πλάνα θεραπείας. Αφού αυτά τα πλάνα θα εφαρμόζονται σε στάδια, και μπορεί να αλλάζουν ανάλογα με την αντίδραση καθενός στις θεραπείες, οι γιατροί αποφασίζουν να χρησιμοποιούν ενισχυτική μάθηση. Αυτή η μορφή έχει μια επαναλαμβανόμενη προσέγγιση συγκέντρωσης ανατροφοδότησης σχετικά με το ποια φάρμακα, δοσολογίες και θεραπείες είναι πιο αποτελεσματικά. Μετά, συγκρίνει εκείνα τα δεδομένα με το προφίλ κάθε ασθενή για να δημιουργεί το μοναδικό, βέλτιστο πλάνο θεραπείας τους. Όσο οι θεραπείες προχωρούν και το πρόγραμμα ανατροφοδοτείται περισσότερο, μπορεί να ενημερώνει συνεχώς το πλάνο κάθε ασθενή. Καμία από τις τρεις τεχνικές δεν είναι εγγενώς εξυπνότερη από όποια άλλη. Eνόσω κάποιες απαιτούν πολλή ή λίγη ανθρώπινη παρέμβαση, όλες έχουν δυνατά και αδύναμα σημεία που τις κάνουν πλέον κατάλληλες για συγκεκριμένες δουλειές. Όμως, με την ταυτόχρονη χρήση τους, οι ερευνητές μπορούν να χτίσουν σύνθετα συστήματα τεχνητής νοημοσύνης, όπου μεμονωμένα προγράμματα μπορούν να επιτηρούν και να διδάσκουν το ένα το άλλο. Δηλαδή, όταν το πρόγραμμά μας για μάθηση χωρίς επιτήρηση βρίσκει παρόμοιες ομάδες ασθενών, μπορεί να στέλνει δεδομένα σε ένα συνδεδεμένο πρόγραμμα μάθησης με επιτήρηση το οποίο θα μπορούσε να ενσωματώσει αυτές τις πληροφορίες στις προβλέψεις του. Ή ίσως δεκάδες προγράμματα ενισχυτικής μάθησης μπορεί να προσομοιώνουν πιθανά αποτελέσματα ασθενών για να συλλέγουν ανατροφοδότηση για διάφορα πλάνα θεραπείας.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Υπάρχουν πολλοί τρόποι να φτιάξει κανείς συστήματα εκμάθησης μηχανών, και ίσως τα πιο υποσχόμενα μοντέλα είναι αυτά που μιμούνται τη σχέση μεταξύ νευρώνων και εγκεφάλου. Αυτά τα τεχνητά νευρικά δίκτυα μπορούν να χρησιμοποιούν εκατομμύρια συνδέσεις για να αντιμετωπίζουν δύσκολες εργασίες, όπως η αναγνώριση εικόνας ή ομιλίας, ακόμα και η μετάφραση γλώσσας. Ωστόσο, όσο πιο αυτοκατευθυνόμενα γίνονται αυτά τα μοντέλα, τόσο δυσκολότερο είναι για τους μηχανικούς υπολογιστών να καθορίσουν πώς οι αυτοδίδακτοι αλγόριθμοι φτάνουν στη λύση τους. Ερευνητές ήδη βλέπουν τρόπους να κάνουν την εκμάθηση μηχανών πιο διαυγή. Αλλά όσο η τεχνητή νοημοσύνη συμμετέχει περισσότερο στην καθημερινότητά μας, αυτές οι αινιγματικές αποφάσεις επηρεάζουν όλο και περισσότερο την εργασία, την υγεία και την ασφάλειά μας. Όσο λοιπόν οι μηχανές συνεχίζουν εκμάθηση έρευνας, διαπραγμάτευσης και επικοινωνίας, πρέπει επίσης να σκεφτούμε πώς να τους διδάξουμε να μάθουν η μία στην άλλη να λειτουργούν ηθικά.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?