Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Hoy, la inteligencia artificial ayuda a los médicos a diagnosticar a pacientes, los pilotos vuelan aviones comerciales y los urbanistas predicen el tráfico. Pero no importa lo que hagan estas IA, los informáticos que las diseñaron probablemente no sepan exactamente cómo lo están haciendo. Se debe a que la inteligencia artificial a menudo es autodidacta, trabajando con un simple conjunto de instrucciones para crear una matriz única de reglas y estrategias. ¿Cómo aprende exactamente una máquina?

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Hay muchas formas para desarrollar programas de autoaprendizaje. Pero todos confían en tres tipos básicos de aprendizaje automático: aprendizaje no supervisado y supervisado, aprendizaje reforzado. Para verlos en acción, imaginemos que los investigadores están tratando de obtener información de un conjunto de datos médicos que contiene miles de perfiles de pacientes.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Primero, aprendizaje sin supervisión. Este enfoque sería ideal para analizar todos los perfiles para encontrar similitudes generales y patrones útiles. Tal vez ciertos pacientes tengan similares presentaciones de enfermedades, o tal vez un tratamiento produce series específicas de efectos secundarios. El amplio enfoque de búsqueda de patrones se puede usar para identificar similitudes entre los perfiles de los pacientes y encontrar patrones emergentes, todo sin la guía humana.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Pero imaginemos que los médicos están buscando para algo más específico. Estos médicos quieren crear un algoritmo para diagnosticar una condición particular. Comienzan recolectando dos conjuntos de datos, imágenes médicas y resultados de pruebas tanto de pacientes sanos como de aquellos diagnosticados con la condición. Luego, ingresan estos datos en un programa diseñado para identificar características compartidas por los pacientes enfermos pero no los pacientes sanos. Según la frecuencia con la que ve determinadas funciones, el programa valorará la importancia de diagnóstico de esas características, generando un algoritmo para el diagnóstico de futuros pacientes. Sin embargo, a diferencia del aprendizaje no supervisado, médicos e informáticos tienen un rol activo en lo que sucederá a continuación. Los médicos harán el diagnóstico final y comprobar la exactitud de la predicción del algoritmo. Los científicos de la computación pueden usar los conjuntos de datos actualizados para ajustar los parámetros del programa y mejorar su precisión. Este enfoque práctico se llama aprendizaje supervisado.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Ahora, digamos que estos médicos quieren diseñar otro algoritmo para recomendar planes de tratamiento. Dado que estos planes se implementarán en etapas, y pueden cambiar dependiendo de cada respuesta individual a los tratamientos, los doctores deciden usar aprendizaje reforzado. Este programa utiliza un enfoque iterativo para recopilar comentarios sobre qué medicamentos, dosis y tratamientos son más efectivos. Luego, compara esos datos contra el perfil de cada paciente para crear su único y óptimo plan de tratamiento. A medida que avanzan los tratamientos y el programa recibe más comentarios, puede actualizarse constantemente el plan para cada paciente. Ninguna de estas tres técnicas es más inteligente que cualquier otra. Mientras que algunos requieren alguna Intervención humana, todos tienen sus propias fortalezas y debilidades lo que los hace más adecuados para determinadas tareas. Sin embargo, al usarlos juntos, los investigadores pueden construir sistemas de IA complejos, donde programas individuales pueden supervisarse y enseñarse unos a otros. Cuando nuestro programa de aprendizaje no supervisado encuentra grupos de pacientes que son similares, podría enviar esos datos a un programa de aprendizaje supervisado. Ese programa podría incorporar esta información en sus predicciones. O quizás docenas de programas de aprendizaje reforzado podría simular los posibles resultados del paciente para recibir comentarios sobre planes de tratamiento.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Hay varios modos de crear estos sistemas de aprendizaje automático, tal vez los modelos más prometedores, son los que imitan la relación entre las neuronas del cerebro. Estas redes neuronales artificiales pueden utilizar millones de conexiones para abordar tareas difíciles como reconocimiento de imágenes y de voz e incluso traducción de idiomas. Sin embargo, cuanto más autodirigidos se vuelven estos modelos, más difícil es para los informáticos determinar cómo estos algoritmos autodidactas llegan a su solución. Investigadores ya buscan modos de hacer que el aprendizaje sea más transparente. Pero a medida que la IA se involucra más en nuestra vida diaria, estas enigmáticas decisiones tienen impactos cada vez mayores sobre nuestro trabajo, salud y seguridad. Para que las máquinas sigan aprendiendo a investigar, negociar y comunicarse, debemos considerar cómo enseñarles para que se enseñen entre sí operar con ética.

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?