Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Oggi l’intelligenza artificiale aiuta i medici a fare le diagnosi, i piloti a pilotare gli aerei e gli urbanisti a predire il traffico. Ma a prescindere da cosa le IA stiano facendo, è probabile che gli informatici che le hanno programmate non sappiano esattamente come lo stiano facendo. Questo perché l’intelligenza artificiale spesso è autodidatta, in quanto esegue una semplice serie di istruzioni per creare una singola serie di regole e strategie. Allora come impara esattamente una macchina?

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Ci sono molti modi di costruire programmi che imparano da soli, ma tutti si basano su tre tipi fondamentali di apprendimento automatico: non supervisionato, supervisionato e per rinforzo. Per vedere come funzionano, immaginiamo dei ricercatori che cercano di estrarre informazioni da una serie di dati medici contenenti migliaia di profili di pazienti.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Partiamo dall’apprendimento non supervisionato. Questo sarebbe l’approccio ideale per esaminare tutti i profili e trovare somiglianze generali e schemi utili. Alcuni pazienti potrebbero presentare sintomi simili per una malattia o una cura potrebbe produrre un insieme specifico di effetti collaterali. Questo approccio generico di ricerca degli schemi può identificare somiglianze tra i profili dei pazienti e trovare schemi emergenti, tutto senza l’assistenza dell’uomo.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Ma immaginiamo che i medici cerchino qualcosa di più specifico. Questi dottori vogliono creare un algoritmo per diagnosticare una malattia specifica. Iniziano raccogliendo due serie di dati: immagini mediche e risultati di esami sia da pazienti sani che da pazienti con la malattia. Poi, inseriscono questi dati in un programma creato per identificare caratteristiche condivise dai pazienti malati, ma non da quelli sani. In base alla frequenza con cui vede certi sintomi, il programma assegnerà dei valori di importanza diagnostica a tali sintomi, generando un algoritmo per la diagnosi dei pazienti futuri. Ma, diversamente che nell’apprendimento automatico non supervisionato, medici e informatici hanno un ruolo attivo in quello che accade dopo. I medici faranno la diagnosi finale e verificheranno l’accuratezza della previsione dell’algoritmo. Poi gli informatici potranno usare l’insieme dei dati aggiornato per regolare i parametri del programma e migliorarne l’accuratezza. Questo approccio partecipativo è detto “apprendimento supervisionato”.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Ora, mettiamo che quei medici vogliano creare un altro algoritmo per suggerire i piani di cura. Poiché questi piani verranno implementati a tappe e potrebbero cambiare sulla base delle risposte individuali alle cure, i medici decidono di usare l’apprendimento per rinforzo. Questo programma usa un approccio iterativo per raccogliere feedback su quali farmaci, dosaggi e cure siano più efficaci. Poi, confronta quei dati con i profili di ogni paziente per creare un piano di cure ottimale e specifico. Col procedere delle cure e l’arrivo di ulteriori feedback, il programma riesce ad aggiornare il piano per ogni paziente. Nessuna di queste tre tecniche di per sé è più intelligente delle altre. Sebbene alcune richiedano un qualche intervento umano, hanno tutte dei punti di forza e dei limiti che le rendono più adatte per determinati compiti. Però, usandole insieme, i ricercatori possono costruire sistemi complessi di IA, in cui i singoli programmi possono supervisionarsi e istruirsi a vicenda. Quando il programma di apprendimento non supervisionato trova un gruppo di pazienti simili, può inviare quei dati a un programma di apprendimento supervisionato collegato. Quel programma potrà incorporare le informazioni nelle proprie previsioni. O dozzine di programmi di apprendimento per rinforzo potrebbero simulare i possibili esiti per i pazienti per raccogliere i feedback sui diversi piani di cura.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Ci sono molti modi per creare i sistemi di apprendimento automatico e forse i modelli più promettenti sono quelli che imitano le relazioni esistenti tra i neuroni nel cervello. Queste reti neurali artificiali possono usare milioni di connessioni per affrontare compiti difficili quali il riconoscimento di immagini, il riconoscimento vocale e persino le traduzioni linguistiche. Tuttavia, più questi modelli diventano autonomi, più è difficile per gli informatici determinare come questi algoritmi autodidatti arrivino alle loro soluzioni. I ricercatori stanno esaminando i modi per rendere più trasparente l’apprendimento automatico. Poiché l’IA è sempre più presente nella nostra vita quotidiana, queste decisioni enigmatiche hanno impatti sempre maggiori sul lavoro, la salute e la sicurezza di tutti noi. E poiché le macchine continuano a imparare, esaminare, superare ostacoli e comunicare,

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?