Intelligence -- what is it? If we take a look back at the history of how intelligence has been viewed, one seminal example has been Edsger Dijkstra's famous quote that "the question of whether a machine can think is about as interesting as the question of whether a submarine can swim." Now, Edsger Dijkstra, when he wrote this, intended it as a criticism of the early pioneers of computer science, like Alan Turing. However, if you take a look back and think about what have been the most empowering innovations that enabled us to build artificial machines that swim and artificial machines that [fly], you find that it was only through understanding the underlying physical mechanisms of swimming and flight that we were able to build these machines. And so, several years ago, I undertook a program to try to understand the fundamental physical mechanisms underlying intelligence.
지능이란 무엇일까요? 역사적으로 지능이 어떻게 인식되어졌는지 들 수 있는 중요한 일례로 에스커 다익스트라가 남긴 유명한 말이 있습니다. "기계가 생각할 수 있는가, 이 질문은 잠수함이 헤엄칠 수 있는가, 정도로 밖에 흥미롭지 않다." 에스커 다익스트라가 이 글귀를 쓴 것은 알란 튜링같은 전산학의 선구자들에 대한 비판의 의미였습니다. 하지만 현재의 우리가 과거를 돌아보며 우리가 어떤 혁신을 통해 헤엄치는 기계들과 하늘을 나는 기계들을 만들게 되었는지 생각해보면, 수영과 비행에 근본이 되는 물리적 원리를 이해함으로서 수영하거나 비행하는 기계를 만들 수 있었음을 깨닫게 됩니다. 비슷한 식으로, 저는 수년 전 지능에 근본이 되는 물리적 원리를 이해하기 위한 프로그램을 시작했습니다.
Let's take a step back. Let's first begin with a thought experiment. Pretend that you're an alien race that doesn't know anything about Earth biology or Earth neuroscience or Earth intelligence, but you have amazing telescopes and you're able to watch the Earth, and you have amazingly long lives, so you're able to watch the Earth over millions, even billions of years. And you observe a really strange effect. You observe that, over the course of the millennia, Earth is continually bombarded with asteroids up until a point, and that at some point, corresponding roughly to our year, 2000 AD, asteroids that are on a collision course with the Earth that otherwise would have collided mysteriously get deflected or they detonate before they can hit the Earth. Now of course, as earthlings, we know the reason would be that we're trying to save ourselves. We're trying to prevent an impact. But if you're an alien race who doesn't know any of this, doesn't have any concept of Earth intelligence, you'd be forced to put together a physical theory that explains how, up until a certain point in time, asteroids that would demolish the surface of a planet mysteriously stop doing that. And so I claim that this is the same question as understanding the physical nature of intelligence.
그러면 일단 사고 실험 하나로 시작해볼까요. 여러분이 외계인이고 지구의 생물학이나 신경학, 지능에 대해 아는 것이 전혀 없다고 상상해 보십시오. 하지만 여러분은 망원경으로 지구를 관찰할 수 있고 아주 긴 수명을 갖고 있습니다. 그래서 지구를 수백만년, 수십억만년 동안 관찰할 수 있죠. 그러다 아주 이상한 현상을 발견합니다. 수백만 년 동안 지구에는 끊임없이 소행성의 충돌이 일어나는데 어느 날, 어느 순간에, 우리 시간으로 서기 2,000년경 지구를 향해 충돌 궤도로 날아오던 소행성들이 신기하게도 방향을 바꾸거나 충돌하기 전 폭발하는 것을 보게 됩니다. 지구인인 우리는 당연히 이 현상이 생존을 위한 우리의 노력이란 것을 압니다. 재앙을 막으려는 것이죠. 하지만 외계인으로서는 이 사실이나 지구인의 지능에 대해 전혀 알 길이 없습니다. 그렇다면 외계인들은 어쩔 수 없이 이 현상을 물리적으로 설명해야 합니다. 늘 행성의 표면을 파괴해 오던 소행성 충돌이, 어떻게 신기하게도 어느 순간부터 멈추게 되었는가 하는지를요. 저는 이것이 지능을 물리적으로 이해하는 것과 같은 질문이라고 말씀드리고 싶습니다.
So in this program that I undertook several years ago, I looked at a variety of different threads across science, across a variety of disciplines, that were pointing, I think, towards a single, underlying mechanism for intelligence. In cosmology, for example, there have been a variety of different threads of evidence that our universe appears to be finely tuned for the development of intelligence, and, in particular, for the development of universal states that maximize the diversity of possible futures. In game play, for example, in Go -- everyone remembers in 1997 when IBM's Deep Blue beat Garry Kasparov at chess -- fewer people are aware that in the past 10 years or so, the game of Go, arguably a much more challenging game because it has a much higher branching factor, has also started to succumb to computer game players for the same reason: the best techniques right now for computers playing Go are techniques that try to maximize future options during game play. Finally, in robotic motion planning, there have been a variety of recent techniques that have tried to take advantage of abilities of robots to maximize future freedom of action in order to accomplish complex tasks. And so, taking all of these different threads and putting them together, I asked, starting several years ago, is there an underlying mechanism for intelligence that we can factor out of all of these different threads? Is there a single equation for intelligence?
저는 수년간 이 프로그램을 계속하며 과학의 여러 줄기, 다양한 분야들을 살펴보았는데 모든 증거가 지능은 근본적으로 단 한가지 원리에 기반한다는 것을 가리키고 있었습니다. 우주 과학을 예로 들어보지요. 여러 다양한 증거들이 우리의 우주는 지능의 발달을 위해 정교하게 조율되었음을 시사합니다. 특히 전체적인 상태가 미래의 가능성이 최대한 다양하도록 조율된 것입니다. 바둑과 같은 게임을 예로 들어보지요. 1997년 IBM의 딥 블루가 체스 경기에서 개리 카스파로프를 이긴 것을 기억하실 겁니다. 하지만 지난 10년간 체스보다 훨씬 더 많은 경우의 수가 있는, 그래서 훨씬 더 어려운 게임인 바둑에서조차 체스와 같은 이유로 인간이 컴퓨터에게 지기 시작했다는 것을 아는 분은 별로 없을겁니다. 현재 컴퓨터가 바둑을 두는 최고의 기술은 수를 둘 때, 앞으로 가능한 수의 갯수가 최대한 많도록 두는 것입니다. 마지막으로, 로봇 운동 계획에서도 최근 발달된 기술들은 로봇의 능력을 사용해 다음 순간 가능한 움직임을 최대한 다양화 하는 방식으로 복잡한 임무를 수행하게 합니다. 이런 모든 다른 분야의 결과들을 종합해보면서 수년전 저는 자문했습니다. 이런 다양한 분야의 지능에 공통적으로 존재하는 근본적인 원리가 있는가? 지능의 공통적인 방정식이 있는가?
And the answer, I believe, is yes. ["F = T ∇ Sτ"] What you're seeing is probably the closest equivalent to an E = mc² for intelligence that I've seen. So what you're seeing here is a statement of correspondence that intelligence is a force, F, that acts so as to maximize future freedom of action. It acts to maximize future freedom of action, or keep options open, with some strength T, with the diversity of possible accessible futures, S, up to some future time horizon, tau. In short, intelligence doesn't like to get trapped. Intelligence tries to maximize future freedom of action and keep options open. And so, given this one equation, it's natural to ask, so what can you do with this? How predictive is it? Does it predict human-level intelligence? Does it predict artificial intelligence? So I'm going to show you now a video that will, I think, demonstrate some of the amazing applications of just this single equation.
제가 믿기에 답은 "있다" 입니다. ["F = T ∇ Sτ"] 여기 보시는 것은 아마 제가 아는 한 E = mc² 에 가장 가까운 지능 공식입니다. 이 공식은 관계를 나타내는 명제로 지능을 F 라는 힘으로 치면, 이 힘은 미래의 행동 자유도를 최대화 하도록 작동한다는 뜻입니다. 미래의 행동 자유도를 최대화하고 최대한 다양한 옵션이 가능하게 합니다. 여기서 T는 어떤 힘이고, S는 도달 가능한 미래의 다양성, 타우는 미래의 어떤 시점을 뜻합니다. 간단히 말하자면, 지능은 제한을 싫어합니다. 지능은 미래에 가능한 행동과 선택을 최대한 다양하도록 하려는 힘입니다. 이 공식을 보면, 자연스럽게 이걸로 뭘 할 수 있을까, 하는 생각이 들죠. 이 식이 얼마나 예측성이 있을까요? 인간 수준의 지능을 예측할 수 있을까요? 인공 지능을 예측할 수 있을까요? 여기에 답하기 위해 여러분께 이 공식 하나로 얼마나 놀라운 응용이 가능한지 시범을 보일 비디오를 보여드리겠습니다.
(Video) Narrator: Recent research in cosmology has suggested that universes that produce more disorder, or "entropy," over their lifetimes should tend to have more favorable conditions for the existence of intelligent beings such as ourselves. But what if that tentative cosmological connection between entropy and intelligence hints at a deeper relationship? What if intelligent behavior doesn't just correlate with the production of long-term entropy, but actually emerges directly from it? To find out, we developed a software engine called Entropica, designed to maximize the production of long-term entropy of any system that it finds itself in. Amazingly, Entropica was able to pass multiple animal intelligence tests, play human games, and even earn money trading stocks, all without being instructed to do so. Here are some examples of Entropica in action.
(비디오) 해설자: 최근 우주학의 발달은 존재하는 동안 무질서, 혹은 엔트로피를 더 많이 만들어내는 우주일수록 우리 자신과 같은 지능체가 존재하는 데 더 호의적인 환경을 가지는 경향이 있습니다. 하지만 이 엔트로피와 지능 사이의 잠정적인 우주학적 연관 고리가 더 깊은 관계를 암시한다면 어떨까요? 지능이 장기적 엔트로피의 창조와 단지 상관 관계가 있는 것이 아니라 거기에서 직접 근원한다면 어떨까요? 이 문제를 위해 저희는 우리가 아는 어떤 계 안에서도 장기적 엔트로피의 생산을 최대화 하도록 고안된 소프트웨어 엔진, 엔트로피카를 개발했습니다. 놀랍게도 엔트로피카는 여러 동물 지능 시험을 통과하고, 인간의 게임도 하고 심지어 주식 매매로 돈도 벌었습니다. 어떤 지시도 없이요. 엔트로피카의 활약을 직접 보여드리죠.
Just like a human standing upright without falling over, here we see Entropica automatically balancing a pole using a cart. This behavior is remarkable in part because we never gave Entropica a goal. It simply decided on its own to balance the pole. This balancing ability will have appliactions for humanoid robotics and human assistive technologies. Just as some animals can use objects in their environments as tools to reach into narrow spaces, here we see that Entropica, again on its own initiative, was able to move a large disk representing an animal around so as to cause a small disk, representing a tool, to reach into a confined space holding a third disk and release the third disk from its initially fixed position. This tool use ability will have applications for smart manufacturing and agriculture. In addition, just as some other animals are able to cooperate by pulling opposite ends of a rope at the same time to release food, here we see that Entropica is able to accomplish a model version of that task. This cooperative ability has interesting implications for economic planning and a variety of other fields.
인간이 넘어지지 않고 바로 설 수 있듯이 여기있는 이 엔트로피카는 카트를 이용해 자동으로 막대의 균형을 잡고 있습니다. 놀라운 것은 이런 행위가 어떤 지시도 없이 일어났다는 겁니다. 스스로 막대기의 균형을 잡기로 결정한 것이죠. 이렇게 균형을 잡는 능력은 인간형 로봇이나 인간 보조 기술에 활용될 수 있습니다. 동물들이 주변 사물을 도구로 활용해 좁은 공간에 닿듯 이 예에서 엔트로피카는 자발적으로 행동해 동물을 상징하는 큰 원을 움직여 도구를 상징하는 작은 원을 세번째 원이 갇힌 좁은 공간으로 밀어넣어 갇힌 원이 밖으로 빠져나올 수 있게 하고 있습니다. 이런 도구 사용 능력은 스마트 제조업, 그리고 농업에 활용될 수 있습니다. 또 다른 예로 동물들이 밧줄의 양쪽을 동시에 물어 당겨 음식이 떨어지게 하듯이 여기서 엔트로피카는 그런 작업의 모델 역할을 수행하고 있습니다. 이런 협력 기능은 경제 기획과 다양한 분야에서 흥미로운 응용이 가능합니다.
Entropica is broadly applicable to a variety of domains. For example, here we see it successfully playing a game of pong against itself, illustrating its potential for gaming. Here we see Entropica orchestrating new connections on a social network where friends are constantly falling out of touch and successfully keeping the network well connected. This same network orchestration ability also has applications in health care, energy, and intelligence. Here we see Entropica directing the paths of a fleet of ships, successfully discovering and utilizing the Panama Canal to globally extend its reach from the Atlantic to the Pacific. By the same token, Entropica is broadly applicable to problems in autonomous defense, logistics and transportation.
엔트로피카는 여러 분야에 다양하게 적용될 수 있습니다. 이 예에서는 엔트로피카가 혼자서 퐁 게임을 하고 있지요. 게임 산업에서의 활용 가능성을 보여주는 것입니다. 이 예에서 엔트로피카는 또 친구들과 곧잘 멀어지게 되는 사회 네트워크에서 새로운 연결고리들을 만들고 네트워크가 서로 잘 연결되게 합니다. 이 네트워크 편성 능력은 의료 산업, 에너지, 그리고 지능에 응용 될 수 있습니다. 여기서는 엔트로피카가 선단을 지휘하고 있습니다. 파나마 운하를 성공적으로 발견하고 이용해 대서양에서 태평양으로 전진해서 세계적으로 확장해 나갈 수 있습니다. 같은 방식으로, 엔트로피카는 자동 안보, 물류, 교통에 활용될 수 있습니다.
Finally, here we see Entropica spontaneously discovering and executing a buy-low, sell-high strategy on a simulated range traded stock, successfully growing assets under management exponentially. This risk management ability will have broad applications in finance and insurance.
마지막으로, 여기서 엔트로피카는 가상 주식 매매에서 싸게 사고 비싸게 파는 전략을 스스로 발견하고 실행해 관리하던 자산을 기하급수적으로 증가시켰습니다. 이런 위험 관리 능력은 금융과 보험업계에서 여러 응용이 가능할 것입니다.
Alex Wissner-Gross: So what you've just seen is that a variety of signature human intelligent cognitive behaviors such as tool use and walking upright and social cooperation all follow from a single equation, which drives a system to maximize its future freedom of action.
알렉스 위스너-그로스: 방금 보신 것은 인간에 한다고 여겼던 여러 가지 지능적이고 인지적인 행동들, 즉 도구 사용이나 직립 보행, 사회적 협력등이 모두 다 어떤 시스템에서든 미래 행동 자유도가 최대화 되도록 하는 한가지 공식에 기반한다는 것입니다.
Now, there's a profound irony here. Going back to the beginning of the usage of the term robot, the play "RUR," there was always a concept that if we developed machine intelligence, there would be a cybernetic revolt. The machines would rise up against us. One major consequence of this work is that maybe all of these decades, we've had the whole concept of cybernetic revolt in reverse. It's not that machines first become intelligent and then megalomaniacal and try to take over the world. It's quite the opposite, that the urge to take control of all possible futures is a more fundamental principle than that of intelligence, that general intelligence may in fact emerge directly from this sort of control-grabbing, rather than vice versa.
한데 여기에는 깊은 역설이 있습니다. 로봇이라는 표현이 사용된 최초의 순간으로 돌아가 봅시다. 연극 '러(RUR)'예요. 기계 지능을 개발하면 인공 두뇌의 반란이 있을 거라는 생각은 늘 있어왔습니다. 기계들이 인간을 상대로 들고 일어난다는 것이지요. 제 강연 내용의 주요 결과 중 하나는 지난 수십년간 우리는 이 인공 지능의 반란이라는 것에 대해 정반대로 생각해 온 걸지도 모릅니다. 기계가 먼저 지능적이 되고 그 다음 과대망상에 빠져 세계 정복을 하려는 게 아닙니다. 오히려 그 정반대지요. 모든 가능한 미래를 조종하고자 하는 욕구는 지능 그 자체보다도 더 근본적인 원리입니다. 어쩌면 지능은 전반적으로 이런 통제 능력에 대한 갈망과 노력 그 자체에서 나오는 걸 수도 있습니다. 그 반대가 아니라요.
Another important consequence is goal seeking. I'm often asked, how does the ability to seek goals follow from this sort of framework? And the answer is, the ability to seek goals will follow directly from this in the following sense: just like you would travel through a tunnel, a bottleneck in your future path space, in order to achieve many other diverse objectives later on, or just like you would invest in a financial security, reducing your short-term liquidity in order to increase your wealth over the long term, goal seeking emerges directly from a long-term drive to increase future freedom of action.
또 다른 중요한 결과는 목적 추구입니다. 저는 자주, 이 관점에서 목적 추구 능력은 어떻게 설명되는지 질문 받습니다. 그 질문에 대한 답은, 목적 추구 능력은 직접적인 결과입니다. 예를 들면 앞으로 있을 수도 있는 다양한 목적들을 이룰 수 있기 위해 미래로 가는 터널이나 병목을 지나는 것과 마찬가지 입니다. 혹은 장기적인 부의 증가를 위해 단기적 유동성을 줄여 재정보증에 투자하는 것과 같은 이치지요. 목적 추구는 미래 행동의 자유도를 늘리기 위한 장기적인 욕구에서 직접적으로 비롯됩니다.
Finally, Richard Feynman, famous physicist, once wrote that if human civilization were destroyed and you could pass only a single concept on to our descendants to help them rebuild civilization, that concept should be that all matter around us is made out of tiny elements that attract each other when they're far apart but repel each other when they're close together. My equivalent of that statement to pass on to descendants to help them build artificial intelligences or to help them understand human intelligence, is the following: Intelligence should be viewed as a physical process that tries to maximize future freedom of action and avoid constraints in its own future.
마지막으로, 유명한 물리학자 리차드 파인만은 언젠가 이런 글을 썼습니다. 만약 인간 문명이 멸망하고 우리 자손들이 문명을 재건할 수 있게 단 한 가지 지식만 전수할 수 있다면 그 지식은 바로 우리 주변의 모든 것이 아주 작은 조각들로 만들어져있고 이것들은 멀리 있으면 서로 끌어당기고 가까이 있으면 밀어낸다는 것이라고요. 제 경우에는 후손들이 인공 지능을 재건하거나 인간 지능을 이해할 수 있도록 전달할 단 한가지 말은 다음과 같습니다: 지능은 미래 행동의 자유도를 최대화 하고, 스스로의 미래에 제한을 막으려는 물리적 과정이다.
Thank you very much.
감사합니다.
(Applause)
(박수)