Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Aujourd’hui, l’intelligence artificielle épaule les médecins pour poser des diagnostics, les pilotes pour faire voler leurs avions et les urbanistes pour prédire le trafic. Quoi que fassent ces IA, les informaticiens qui les ont conçues ignorent comment elles fonctionnent. La raison est que l’intelligence artificielle apprend par elle-même, partant d’un ensemble simple d’instructions pour créer une multitude de règles et de stratégies.

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Comment apprend une machine ? Il a beaucoup de façons d’écrire des programmes d’auto-apprentissage, mais elles sont fondées sur trois façons simples d’apprentissage machine. L’apprentissage machine non supervisé, supervisé et par renforcement. Pour voir comment cela fonctionne, imaginons des chercheurs qui tentent d’extraire des informations d’un set de données médicales issues de milliers de patients.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Commençons avec l’apprentissage non supervisé. Cette approche est idéale pour analyser tous les profils et trouver des similitudes et des tendances utiles. Certains patients souffrent de pathologies aux symptômes similaires, ou certains traitements produisent des sets spécifiques d’effets secondaires. Cette approche est utile pour identifier des similitudes entre des profils de patients et détecter des tendances sans supervision par l’homme.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Mais imaginons qu’un médecin cherche quelque chose de plus spécifique. Ces médecins ont besoin d’un algorithme capable de diagnostiquer un état précis. Ils collectent d’abord un ensemble de données, des images médicales et des résultats de patients sains et de patients atteints par la pathologie étudiée. Ensuite, ils encodent ces données dans un algorithme conçu pour identifier des caractéristiques présentes chez les patients malades mais pas chez les personnes saines. Sur base de la fréquence d’apparition de ces caractéristiques, le programme leur assigne une valeur utile pour poser un diagnostic, générant ainsi un algorithme capable à l’avenir de poser un diagnostic. Toutefois, contrairement à l’apprentissage non supervisé, les médecins et les informaticiens ont un rôle actif dans l’étape suivante. Les médecins poseront le diagnostic final et vérifieront l’exactitude de la prédiction de l’algorithme. Ensuite, les informaticiens utiliseront ces données mises à jour pour ajuster les paramètres du programme et en améliorer l’exactitude. Cette approche est appelée apprentissage supervisé.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Imaginons que les médecins souhaitent concevoir un autre algorithme pour faire des recommandations thérapeutiques. Comme ces traitements seront réalisés par phase, et qu’ils sont susceptibles de varier selon les réponses des patients aux soins, les médecins décident d’utiliser l’apprentissage par renforcement. C’est une approche itérative qui alimente la machine en retour d’expérience sur quels médicaments, quels dosages et quels soins sont les plus efficaces. Ensuite, la machine compare ces données avec les profils des patients pour concevoir un traitement unique et optimal. Avec la progression du traitement, la machine obtient des nouvelles données et elle réalise des mises à jour de chaque traitement individuel. Aucune de ces trois techniques n’est intrinsèquement meilleure qu’une autre. Elles requièrent plus ou moins d’intervention humaine mais elles ont leurs forces et leurs faiblesses qui les rendent adaptées à certaines tâches. Mais en combinant leur utilisation, les chercheurs peuvent construire des systèmes complexes d’IA où des programmes individuels se supervisent et apprennent l’un de l’autre. Par exemple, si un programme d’apprentissage non supervisé trouve une cohorte de patients semblables, il peut envoyer les données à un programme d’apprentissage supervisé connecté. Ce programme peut alors incorporer cette donnée dans ses prédictions. Ou des dizaines de programmes d’apprentissage par renforcement peuvent simuler les résultats potentiels d’un patient, pour collecter des données sur différents traitements.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Il y a beaucoup de façons de créer un système d’apprentissage machine. Les modèles les plus prometteurs sont ceux qui imitent la relation entre les neurones de notre cerveau. Ces réseaux neuronaux artificiels utilisent des millions de liens pour gérer des tâches complexes comme la reconnaissance d’images, la reconnaissance vocale, et même la traduction. Cependant, plus ces modèles s’auto-gèrent, plus il est difficile pour les informaticiens de déterminer comment ces algorithmes produisent une solution. On cherche des façons de rendre l’apprentissage machine plus transparent. Mais alors que l’IA est de plus en plus présente dans nos vies, ses décisions énigmatiques ont un impact croissant sur notre travail, notre santé et notre sécurité. Alors que les machines continuent d’apprendre pour investiguer, négocier et communiquer,

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?