Briana Brownell: How does artificial intelligence learn?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Tegenwoordig helpt AI artsen bij het diagnosticeren van patiënten, piloten bij het besturen van vliegtuigen, en stadsplanners verkeer te voorspellen. Maar wat deze AI’s ook doen, de computerwetenschappers die ze ontwerpen weten waarschijnlijk niet precies hoe ze het doen. Dit komt doordat kunstmatige intelligentie vaak autodidactisch is, uitgaand van enkele eenvoudige instructies creëert het een unieke reeks van regels en strategieën. Dus, hoe leert een machine precies?

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Er zijn verscheidene manieren om zelflerende programma’s te bouwen. Maar allemaal berusten ze op de drie basistypen van machinaal leren: onbeheerd leren, begeleid leren en versterkend leren. Om te zien hoe dit verloopt, stel je onderzoekers voor die trachten bepaalde informatie te vinden uit een reeks medische data met daarin duizenden patiëntenprofielen.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Als eerste, onbeheerd leren. Deze aanpak zou ideaal zijn om alle profielen te analyseren en zo algemene overeenkomsten en nuttige patronen te vinden. Misschien hebben sommige patiënten vergelijkbare symptomen, of misschien veroorzaakt een behandeling een stel specifieke bijwerkingen. Deze patroonzoekende aanpak kan toegepast worden om overeenkomsten te identificeren tussen patiëntenprofielen en opduikende patronen te vinden, allemaal zonder menselijke aansturing.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Maar stel je voor dat artsen op zoek zijn naar iets specifiekers. Deze medici willen een algoritme creëren om een bepaalde aandoening te diagnosticeren. Ze beginnen met het ophalen van twee datasets: medische beelden en testresultaten, zowel van gezonde patiënten als van degenen die de aandoening hebben. Vervolgens implementeren ze deze data in een programma ontworpen om symptomen te herkennen die de zieke patiënten delen, maar de gezonde patiënten niet. Gebaseerd op de frequentie van bepaalde ziekteverschijnselen, zal het programma waarden toewijzen aan het diagnostisch belang van die tekens en een algoritme genereren voor toekomstige medische diagnoses. Maar in tegenstelling tot onbeheerd leren, hebben artsen en computerwetenschappers een actieve rol in wat er daarna volgt. Artsen stellen de definitieve diagnose en toetsen de nauwkeurigheid van de prognose door het algoritme. Dan kunnen computerwetenschappers de geüpdatete datasets gebruiken om de variabelen in het programma aan te passen en nauwkeuriger te maken. Deze praktijkgerichte training noemt men begeleid leren.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Veronderstel dat deze artsen een ander algoritme willen ontwerpen om behandelplannen aan te bevelen. Doordat deze plannen stapsgewijs zullen uitgevoerd worden en kunnen veranderen naargelang de reactie van het individu op behandelingen, kiezen de artsen voor versterkend leren. Dit programma hanteert een iteratieve aanpak om feedback te verzamelen over welke medicaties, doseringen en behandelingen het doeltreffendst zijn. Daarna wordt deze data vergeleken met het profiel van elke patiënt om hun unieke, optimale behandelplan op te stellen. Naarmate de behandelingen vorderen en het programma meer feedback krijgt, kan het voortdurend het behandelplan voor elke patiënt aanpassen. Geen van deze drie technieken is inherent slimmer dan een andere. Terwijl sommige min of meer menselijke tussenkomst vereisen, hebben ze elk hun eigen sterktes en verbeterpunten die hen het meest aangewezen maken voor bepaalde taken. Maar door ze samen te gebruiken, kunnen onderzoekers complexe AI-systemen bouwen, waar individuele programma’s elkaar kunnen begeleiden en onderwijzen. Wanneer bijvoorbeeld ons onbeheerd leerprogramma vergelijkbare groepen patiënten vindt, kan het die gegevens doorsturen naar een verbonden begeleid leerprogramma. Dat programma zou dan deze informatie in zijn prognoses kunnen opnemen. Of misschien kunnen tientallen versterkende leerprogramma’s potentiële patiëntresultaten simuleren om feedback te verzamelen over verschillende behandelplannen.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Er zijn talloze manieren om deze leersystemen te ontwerpen, en misschien zijn de meest veelbelovende modellen deze die de relatie nabootsen tussen neuronen in de hersenen. Zulke kunstmatige neurale netwerken kunnen miljoenen verbindingen aanwenden om moeilijke taken aan te pakken, zoals beeldherkenning, spraakherkenning, en zelfs vertalingen. Maar, hoe autonomer deze modellen worden, des te lastiger is het voor computerwetenschappers om te bepalen hoe deze autodidactische algoritmes tot hun oplossing komen. Onderzoekers bekijken al manieren om machinaal leren transparanter te maken. Maar naarmate AI meer betrokken raakt in ons dagelijks leven, krijgen deze cryptische besluiten een steeds grotere impact op ons werk, onze gezondheid en veiligheid. Indien machines verder leren onderzoeken, onderhandelen en communiceren, moeten we overwegen hoe we hen onderwijzen

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?