Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

A inteligência artificial já ajuda médicos a diagnosticar pacientes, pilotos a pilotar aeronaves comerciais, e urbanistas a prever o trânsito. Mas não importa o que essas IAs estejam fazendo, os cientistas que as criaram provavelmente não sabem exatamente como elas fazem isso. Isso porque inteligências artificiais costumam ser autodidatas, trabalhando com um simples conjunto de instruções para criar um sistema único de regras e estratégias. Então como é que uma máquina aprende?

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Existem diversas maneiras de se desenvolver programas autodidatas, mas todas elas se baseiam nos três tipos básicos de aprendizado de máquina: aprendizado sem supervisão, com supervisão e por reforço. Para vê-los em ação, vamos imaginar que pesquisadores estejam tentando extrair informação de um conjunto de dados médicos contendo centenas de fichas de pacientes.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Primeiro, aprendizagem sem supervisão. Essa abordagem seria ideal para analisar todas as fichas para encontrar semelhanças gerais e padrões úteis. Talvez alguns pacientes tenham sintomas parecidos, ou talvez um tratamento produza quadros específicos de efeitos colaterais. Essa abordagem de procura de padrões pode ser usada para encontrar semelhanças entre fichas de pacientes e achar padrões emergentes, tudo isso sem orientação humana.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Mas vamos imaginar que os médicos estejam buscando algo mais específico. Eles querem criar um algoritmo para diagnosticar uma doença em particular. Eles começam coletando dois conjuntos de dados: imagens médicas e resultados de exames tanto de pacientes saudáveis quanto dos diagnosticados com a doença. Então, eles inserem esses dados em um programa criado para identificar características em comum dos pacientes doentes que não acometem os pacientes saudáveis. Com base na frequência com que vê certas características, o programa atribui valores à significância dessas características para o diagnóstico, gerando um algoritmo para diagnosticar futuros pacientes. No entanto, diferente do que acontece na aprendizagem sem supervisão, médicos e cientistas da computação têm um papel ativo no que acontece a seguir. Os médicos vão realizar o diagnóstico final e verificar a exatidão das previsões do algoritmo. Então os cientistas podem usar o conjunto de dados atualizado para ajustar os parâmetros do programa e melhorar sua precisão. Esta abordagem prática é chamada de aprendizagem supervisionada.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Agora, vamos supor que esses médicos queiram criar outro algoritmo para recomendar tratamentos. Já que esses tratamentos serão implementados em etapas, e podem variar, dependendo da resposta de cada paciente a ele, os médicos decidem usar a aprendizagem por reforço. Esse programa usa uma abordagem de repetição para obter informações sobre quais medicamentos, dosagens e tratamentos são mais efetivos. Então, compara os dados com a ficha de cada paciente, para criar seu tratamento único e otimizado. À medida que o tratamento avança e o programa recebe mais informações, ele pode atualizar constantemente o tratamento para cada paciente. Nenhuma dessas técnicas é mais inteligente do que a outra. Enquanto algumas requerem mais ou menos intervenção humana, todas elas têm suas próprias forças e fraquezas. o que as torna mais apropriadas para certas tarefas. No entanto, ao usá-las em conjunto, pesquisadores podem criar complexos sistemas de IA, em que programas podem supervisionar e ensinar uns aos outros. Por exemplo, quando o programa de aprendizado sem supervisão encontra grupos de pacientes similares, ele pode enviar os dados para um programa de aprendizado com supervisão. Esse programa pode, então, incorporar as informações em suas predições. Ou talvez múltiplos programas de aprendizagem por reforço possam simular possíveis resultados de pacientes para coletar informações sobre diferentes tratamentos.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Existem vários modos de criar sistemas com aprendizado de máquina, e talvez os modelos mais promissores sejam aqueles que imitam a relação entre os neurônios no cérebro. Essas redes neurais artificiais podem usar milhões de conexões para enfrentar tarefas difíceis como reconhecimento de imagem, de fala, e até mesmo tradução de idiomas. No entanto, quanto mais autodirigidos esses modelos se tornam, mais difícil é para os cientistas determinar como esses algoritmos chegaram às suas soluções. Pesquisadores já estão tentando encontrar formas de tornar o aprendizado de máquina mais transparente. Mas enquanto a IA se torna mais presente em nossas vidas, essas decisões enigmáticas têm impactos cada vez maiores em nosso trabalho, saúde e segurança. Enquanto as máquinas continuam aprendendo, investigando, negociando e se comunicando,

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?