Briana Brownell: How does artificial intelligence learn?

Изкуственият интелект помага на лекарите да диагностицират пациентите си, на пилотите да управяват самолети, на общината да предвиди уличното движение. Но без значение какво точно прави той, учените, които са го създали най-вероятно не разбират точно как го правят. Това е така, защото изкуственият интелект често се обучава сам и работи на основата на набор от инструкции, за да създаде уникален набор от правила и стратегии. Как точно се учи машината?

Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?

Има много начини да се направи програма, която учи сама. Но всички те разчитат на три основни типа машинно обучение: неконтролирано, контролирано обучение, и oбучение с утвърждение. За да видим как работят те на практика, нека си представим как изследователи извличат информация от набор медицински данни, съдържащи хиляди профили на пациенти.

There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.

Първо, неконтролираното обучение. Този подход би бил идеален за анализирането на всички профили, за да се намерят основните прилики и полезни модели. Възможно е някои пациенти да имат сходни симптоми или може би дадено лечение предизвиква определен набор от странични ефекти. Този широкообхватен подход може да бъде изпозлван за откриване на прилики между профилите на пациентите и за намирането на появяващи се модели, без никакво напътствие от човек.

First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.

Но нека си представим, че лекарите търсят нещо по-специфично. Те искат да създадат алгоритъм за диагностика на специфично състояние. Започват със събирането на две множества от данни: медицински изображения и изследвания както от здрави пациенти така и от диагностицираните с това състояние. След това те добавят данните в програма, предназначена да идентифицира характеристики, общи за болните, но не и за здравите пациенти. В зависимост от това колко често вижда определени характеристики програмата им възлага определени стойности спрямо значението им за диагностиката, генерирайки по този начин алгоритъм за диагностициране на бъдещи пациенти. За разлика от некотролираното обучение, лекарите и компютърните специалисти имат активна роля за това, което се случва. Лекарите ще поставят крайната диагноза и ще проверят точността на прогнозата на алгоритъма. След това компютърните специалисти използват набора от данни, за да коригират параметрите на програмата и да подобрят нейната точност. Този практически подход се нарича контролирано обучение.

But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.

Сега, нека кажем, че лекарите искат да проектират друг алгоритъм, който да предлага планове за лечение Тъй като плановете ще бъдат изпълнени поетапно и може да се променят в зависимост от реакцията на всеки индивид към лечението, лекарите решават да използват обучение чрез утвърждение. Програмата използва итеративни подходи за обратна връзка, за това кои лекарства, дози и лечения са най-ефективни. След това, тя ги сравнява с данните и профила на пациентите, за да създаде уникален, оптимален план за лечение. Когато лечението напредва и програмата получава по-добра обратна връзка, тя може постоянно да актуализира плана за всеки пациент. Нито една от тези техники не е по-умна от дугите. Докато някои изискват повече човешка намеса, те всички имат своите силни и слаби страни, които ги правят подходящи за различни задачи. Използвайки ги заедно, учените могат да построят комплексни системи, в които индивидуалните програми се контролират и учат взаимно. Например, когато некотролирана програма намира групи от сходни пациенти, тя може да изпрати данните до контролирана програма за обучение, която може да инкорпорира информацията в нейните прогнози. Или може би програми чрез утвърждение могат да симулират определени резултати, за да съберат обратна връзка за плановете за лечение.

Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.

Има много начини да се създадат системи за машинно обучение и най-обещаващите модели са тези, които имитират връзката между невроните и мозъка. Тези изкуствени невронни мрежи могат да използват милиони връзки, за да се спрвят с трудни задачи, като разпознаване на изображения и реч и дори преводи от един език на друг. Обаче, колкото по-автономни са моделите, толкова по-трудно става за специалистите да определят как тези самоуки алгоритми стигат до заключнията си. Учените търсят начини да направят машинното обучение по-прозрачно. Тъй като изкуственият интелект става по-важен в нашия живот, тези енигматияни решения имат все по-голямо влияние върху нашата работа, здраве и сигурност. Докато машините продълвата да се учат да изследват, договарят и комуникират, ние също трябва да помислим как да ги учим да се учат от една друга етично.

There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.

Briana Brownell: How does artificial intelligence learn?

Briana Brownell: How does artificial intelligence learn?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?

Related talks

José Américano N L F de Freitas: How exactly does binary code work?

Patrick Lin: The ethical dilemma of self-driving cars

David J. Malan: What's an algorithm?