Today, artificial intelligence helps doctors diagnose patients, pilots fly commercial aircraft, and city planners predict traffic. But no matter what these AIs are doing, the computer scientists who designed them likely don’t know exactly how they’re doing it. This is because artificial intelligence is often self-taught, working off a simple set of instructions to create a unique array of rules and strategies. So how exactly does a machine learn?
こんにちAI(人工知能)は 医師による患者の診断や パイロットによる商用航空機の操縦や 都市計画者による交通量予測を支援します しかしAIがどんな仕事をするにしても AIを設計するコンピュータ科学者は AIが何をしているかを 正確に把握している訳ではないようです これはAIがしばしば自己学習し 単純な一連の命令から 一連のユニークなルールと戦略を 生成するからです では実際に機械は どのように学習するのでしょうか?
There are many different ways to build self-teaching programs. But they all rely on the three basic types of machine learning: unsupervised learning, supervised learning, and reinforcement learning. To see these in action, let’s imagine researchers are trying to pull information from a set of medical data containing thousands of patient profiles.
自己学習型のプログラムを組む方法は 多くあります しかしすべての方法が 機械学習の3つの基本的な型に依存しています 教師なし学習、教師あり学習 そして強化学習の3つです これらが動作する様子を見てみましょう 数千人もの患者のプロファイルを含む 医療データから 研究者が情報を 引き出そうとしていたとします
First up, unsupervised learning. This approach would be ideal for analyzing all the profiles to find general similarities and useful patterns. Maybe certain patients have similar disease presentations, or perhaps a treatment produces specific sets of side effects. This broad pattern-seeking approach can be used to identify similarities between patient profiles and find emerging patterns, all without human guidance.
まずは教師なし学習です この手法はすべてのプロファイルを分析して 一般的な類似性や有益なパターンを 見つけるのに理想的なものです ある患者たちは似通った病状を 示しているかも知れませんし もしかすると ある治療法が一連の副作用を 引き起こしているかもしれません この大規模なパターン検索の手法は 患者のプロファイルから類似性を識別し 発病パターンの見出すのに利用できますが まったく人間の手を介しません
But let's imagine doctors are looking for something more specific. These physicians want to create an algorithm for diagnosing a particular condition. They begin by collecting two sets of data— medical images and test results from both healthy patients and those diagnosed with the condition. Then, they input this data into a program designed to identify features shared by the sick patients but not the healthy patients. Based on how frequently it sees certain features, the program will assign values to those features’ diagnostic significance, generating an algorithm for diagnosing future patients. However, unlike unsupervised learning, doctors and computer scientists have an active role in what happens next. Doctors will make the final diagnosis and check the accuracy of the algorithm’s prediction. Then computer scientists can use the updated datasets to adjust the program’s parameters and improve its accuracy. This hands-on approach is called supervised learning.
しかし医師が何かもっと具体的なことを 求めていたとしましょう その医師たちはある特定の疾患を診断する アルゴリズムを作りたいのだとします 彼らは2種類のデータを 集めることから始めます 医療用画像データと試験結果のデータを 健康な患者と 疾患があると診断された患者から集めます 健康な患者にはなく 患者に共通する特徴を 識別するように設計されたプログラムに これらのデータを入力します プログラムは各特徴量を どれくらい参照するかによって 診断における特徴量の重要度を数値化して 将来 患者を診断する際に使う アルゴリズムを生成するのです しかしながら教師なし学習とは異なり 医師とコンピュータ科学者は 次の段階で積極的な役割を担います 医師は最終的な診断を行い アルゴリズムの下した予測に対して 正確さを確認します 次にコンピュータ科学者は 更新されたデータを使って 確度を向上させるために プログラムのパラメータを修正します この実践的な手法を 教師あり学習といいます
Now, let’s say these doctors want to design another algorithm to recommend treatment plans. Since these plans will be implemented in stages, and they may change depending on each individual's response to treatments, the doctors decide to use reinforcement learning. This program uses an iterative approach to gather feedback about which medications, dosages and treatments are most effective. Then, it compares that data against each patient’s profile to create their unique, optimal treatment plan. As the treatments progress and the program receives more feedback, it can constantly update the plan for each patient. None of these three techniques are inherently smarter than any other. While some require more or less human intervention, they all have their own strengths and weaknesses which makes them best suited for certain tasks. However, by using them together, researchers can build complex AI systems, where individual programs can supervise and teach each other. For example, when our unsupervised learning program finds groups of patients that are similar, it could send that data to a connected supervised learning program. That program could then incorporate this information into its predictions. Or perhaps dozens of reinforcement learning programs might simulate potential patient outcomes to collect feedback about different treatment plans.
ここで治療計画を提案するアルゴリズムを 医師たちが求めていたとします 治療計画は段階的に導入され 治療による個々の患者の反応により 治療計画を変更する必要があるため 医師たちは強化学習を使うことにします このプログラムでは どのような処方 投薬量、治療が最も効果的かについて フィードバックを行う 反復的な手法を使います 次に 個々の患者に適した 治療計画を作成するために データを個々の患者の プロファイルと照合します 治療が進められ プログラムが フィードバックを得るごとに 個々の患者の治療計画を プログラムは継続的に更新していきます これら3つの手法はどれが一番 優れているということはありません 人間の介在をいくらか必要とする 手法もありますし いずれの手法にも それぞれ強みと弱みがあるので 各作業に対して 最善な手法を選ぶことになります しかし 3つの手法を組み合わせることで 研究者は複雑なAIシステムを 作り上げることができます これは 各プログラムが 互いに教師となり訓練することで作られます 例えば 教師なし学習のプログラムが 類似する患者の集団を見つけると これに連結した教師あり学習プログラムに その情報を送ることができて 教師あり学習プログラムは情報を 予測に取り込めるでしょう あるいは何十もの強化学習のプログラムが 異なる治療計画の フィードバックを集めるために 起こりうる治療結果を シミュレーションすることもあるでしょう
There are numerous ways to create these machine-learning systems, and perhaps the most promising models are those that mimic the relationship between neurons in the brain. These artificial neural networks can use millions of connections to tackle difficult tasks like image recognition, speech recognition, and even language translation. However, the more self-directed these models become, the harder it is for computer scientists to determine how these self-taught algorithms arrive at their solution. Researchers are already looking at ways to make machine learning more transparent. But as AI becomes more involved in our everyday lives, these enigmatic decisions have increasingly large impacts on our work, health, and safety. So as machines continue learning to investigate, negotiate and communicate, we must also consider how to teach them to teach each other to operate ethically.
機械学習のシステムを作る 様々な方法がありますが 恐らくもっとも有望なモデルは 脳内のニューロン同士の関係を 模倣したものでしょう そのような人工ニューラルネットワークは 数百万の接続を利用して 画像認識、音声認識、さらには翻訳といった 難しい作業に取り組めます でも このようなモデルが 自己学習を進めるほど コンピューター科学者が 自己学習型アルゴリズムによる 解の導出過程を特定することは難しくなります 科学者はすでに機械学習を もっと可視的にする方法を探しています AIが私たちの日々の生活に 入り込んできますが 不可解な判断が仕事や健康や安全に 与える影響が大きくなっています 機械がデータの調査、計算や通信方法を 継続的に学習している中で 機械同士が倫理的な作動方法を教えあう手段を 人間が教え込む方法も考えなければなりません