Разумът - какво представлява той? Ако погледнем назад в историята на представите за разума, един значим пример е известният цитат от Едсхер Дейкстра, че "въпросът дали една машина може да мисли е почти толкова интересен, колкото въпроса дали една подводница може да плува". Когато е написал това, Едсхер Дейкстра е имал намерение да критикува първите пионери на компютърната наука, като Алан Тюринг. Обаче, ако погледнем назад и помислим кои са най-значителните открития, които са ни дали възможност да построим изкуствени машини, които плуват и такива които летят, ще установим, че само с разбиране на физическите механизми в основата на плуването и летенето, сме били в състояние да построим тези машини. И така, преди няколко години започнах една програма, за да се опитам да разбера основните физически механизми на разума.
Intelligence -- what is it? If we take a look back at the history of how intelligence has been viewed, one seminal example has been Edsger Dijkstra's famous quote that "the question of whether a machine can think is about as interesting as the question of whether a submarine can swim." Now, Edsger Dijkstra, when he wrote this, intended it as a criticism of the early pioneers of computer science, like Alan Turing. However, if you take a look back and think about what have been the most empowering innovations that enabled us to build artificial machines that swim and artificial machines that [fly], you find that it was only through understanding the underlying physical mechanisms of swimming and flight that we were able to build these machines. And so, several years ago, I undertook a program to try to understand the fundamental physical mechanisms underlying intelligence.
Нека да се върнем крачка назад. Първо да започнем с един мисловен експеримент. Представете си, че сте от извънземна раса, която не знае нищо за биологията на Земята, нито за земната невронаука или земния разум, но имате изумителни телескопи и можете да гледате Земята, имате и удивително дълъг живот, така че можете да наблюдавате Земята милиони, дори милиарди години. И забелязвате един наистина странен ефект. Забелязвате, че в хода на хилядолетията Земята постоянно е бомбардирана от астероиди до един момент и че в един момент, който приблизително съответства на нашата 2000 година, астероидите, чийто курс пресича този на Земята, и които иначе биха се сблъскали с нея, биват мистериозно отклонени или се взривяват преди да ударят Земята. Разбира се, като земляни, ние знаем причината - опитваме се да се спасим. Опитваме се да предотвратим сблъсъка. Но ако сте от извънземна раса, която не знае нищо за това и няма никакво понятие за разума на Земята, ще се принудите да съчините физическа теория, която обяснява как в един определен момент във времето астероиди, които биха унищожили повърхността на една планета, спират да го правят по загадъчен начин. И така, аз твърдя, че въпросът с разбирането на физическата природа на разума е същия.
Let's take a step back. Let's first begin with a thought experiment. Pretend that you're an alien race that doesn't know anything about Earth biology or Earth neuroscience or Earth intelligence, but you have amazing telescopes and you're able to watch the Earth, and you have amazingly long lives, so you're able to watch the Earth over millions, even billions of years. And you observe a really strange effect. You observe that, over the course of the millennia, Earth is continually bombarded with asteroids up until a point, and that at some point, corresponding roughly to our year, 2000 AD, asteroids that are on a collision course with the Earth that otherwise would have collided mysteriously get deflected or they detonate before they can hit the Earth. Now of course, as earthlings, we know the reason would be that we're trying to save ourselves. We're trying to prevent an impact. But if you're an alien race who doesn't know any of this, doesn't have any concept of Earth intelligence, you'd be forced to put together a physical theory that explains how, up until a certain point in time, asteroids that would demolish the surface of a planet mysteriously stop doing that. And so I claim that this is the same question as understanding the physical nature of intelligence.
Затова в програмата, която започнах преди няколко години, разгледах множество различни идеи в науката, в разнообразни други дисциплини, които, мисля, сочеха към един-единствен механизъм в основата на разума. В космологията, например, има многообразие от различни доказателства, че вселената ни e прецизно настроена за развитието на разум и особено за развитието на универсални състояния, които максимизират разнообразието от възможни бъдеща. При игрите, например при Го - всички помним 1997 г., когато Deep Blue на IBM победи Гари Каспаров на шах - по-малко хора са наясно, че през последните десет и нещо години играта Го, една, може да се каже, много по-интересна игра, защото има много по-голям фактор на клониране, също започна да отстъпва на компютрите - играчи по същата причина: най-добрите похвати в момента за компютри, играещи Го, са тези, които се опитват да максимизират бъдещите опции по време на играта. И накрая, при планирането на движенията на роботите има множество нови техники, които опитват да се възползват от способностите на роботите да максимизират бъдещата свобода на движение, за да изпълнят сложни задачи. И така, като взех предвид всички тези различни идеи и ги събрах, се запитах преди няколко години има ли някакъв механизъм в основата на разума, който можем да изведем от всички тези различни идеи? Има ли уравнение на разума?
So in this program that I undertook several years ago, I looked at a variety of different threads across science, across a variety of disciplines, that were pointing, I think, towards a single, underlying mechanism for intelligence. In cosmology, for example, there have been a variety of different threads of evidence that our universe appears to be finely tuned for the development of intelligence, and, in particular, for the development of universal states that maximize the diversity of possible futures. In game play, for example, in Go -- everyone remembers in 1997 when IBM's Deep Blue beat Garry Kasparov at chess -- fewer people are aware that in the past 10 years or so, the game of Go, arguably a much more challenging game because it has a much higher branching factor, has also started to succumb to computer game players for the same reason: the best techniques right now for computers playing Go are techniques that try to maximize future options during game play. Finally, in robotic motion planning, there have been a variety of recent techniques that have tried to take advantage of abilities of robots to maximize future freedom of action in order to accomplish complex tasks. And so, taking all of these different threads and putting them together, I asked, starting several years ago, is there an underlying mechanism for intelligence that we can factor out of all of these different threads? Is there a single equation for intelligence?
Вярвам, че отговорът е да. (F = T ∇ Sτ) Това, което виждате вероятно е най-близкият еквивалент на E = mc² за разума, който съм виждал. Това, което виждате тук е изложение на връзката на разума, който е сила, F и който действа така, че да максимизира бъдещата свобода на действие. Той работи за максимизирането на бъдещата свобода на действие или за запазването на отворени възможности с някаква сила Т, с разнообразието от възможни достижими бъдеща S, до някакъв бъдещ времеви хоризонт, тау. Накратко, разумът не обича да го хващат в капан. Разумът се опитва да максимизира бъдещата свобода на действие и да оставя възможностите отворени. И така, имайки предвид това уравнение, естествено е да се запитаме какво да правим с него. Какви са способностите му да предвижда? Предвижда ли разума на човешко ниво? Предвижда ли изкуствения интелект? Сега ще ви покажа едно видео, което, мисля, ще демонстрира някои от удивителните приложения на това единствено уравнение.
And the answer, I believe, is yes. ["F = T ∇ Sτ"] What you're seeing is probably the closest equivalent to an E = mc² for intelligence that I've seen. So what you're seeing here is a statement of correspondence that intelligence is a force, F, that acts so as to maximize future freedom of action. It acts to maximize future freedom of action, or keep options open, with some strength T, with the diversity of possible accessible futures, S, up to some future time horizon, tau. In short, intelligence doesn't like to get trapped. Intelligence tries to maximize future freedom of action and keep options open. And so, given this one equation, it's natural to ask, so what can you do with this? How predictive is it? Does it predict human-level intelligence? Does it predict artificial intelligence? So I'm going to show you now a video that will, I think, demonstrate some of the amazing applications of just this single equation.
(Видео) Говорител: Последните изследвания в космологията подсказват, че вселени, които произвеждат повече безпорядък или ентропия, в живота си би трябвало да имат по-благоприятни условия за съществуване на интелигентни същества като нас. Ами ако тази хипотетична космологична връзка между ентропията и разума намеква за по-дълбоки взаимоотношения? Aко разумното поведение не просто има връзка със създаването на дългосрочна ентропия, а всъщност произлиза директно от нея? За да разберем, разработихме софтуерен уред на име Ентропика, проектиран да максимизира производството на дългосрочна ентропия във всяка система, в която го сложим. За наше изумление, Ентропика успя да премине множество тестове с животински разум, да играе човешки игри и дори да спечели пари, търгувайки с акции - и всичко това без да е бил инструктиран. Ето няколко примера за Ентропика в действие.
(Video) Narrator: Recent research in cosmology has suggested that universes that produce more disorder, or "entropy," over their lifetimes should tend to have more favorable conditions for the existence of intelligent beings such as ourselves. But what if that tentative cosmological connection between entropy and intelligence hints at a deeper relationship? What if intelligent behavior doesn't just correlate with the production of long-term entropy, but actually emerges directly from it? To find out, we developed a software engine called Entropica, designed to maximize the production of long-term entropy of any system that it finds itself in. Amazingly, Entropica was able to pass multiple animal intelligence tests, play human games, and even earn money trading stocks, all without being instructed to do so. Here are some examples of Entropica in action.
Точно като човек - изправен и без да пада, тук виждаме Ентропика автоматично да балансира прът, използвайки количка. Това поведение е забележително, отчасти защото ние никога не сме поставяли цел на Ентропика. Той просто сам реши да балансира пръта. Това балансиране ще има приложение в хуманоидната роботика и в помощните технологии за хора. Точно както някои животни използват предмети от средата си като инструменти, за да достигнат тесни пространства, тук виждаме, че Ентропика, отново по собствена инициатива, успя да завърти голям диск, представляващ животно, така че малкият диск, представляващ инструмент, да стигне до едно ограничено пространство, придържайки трети диск и да освободи третия диск от първоначалната му неподвижна позиция. Тази способност за ползване на инструменти ще има приложение в прецизните производства и земеделието. Освен това, точно както някои други животни могат да си сътрудничат като дърпат едновременно двата края на въже, за да освободят храна, тук виждаме, че Ентропика може да изпълни приспособена версия на тази задача. Умението за сътрудничество има интересни приложения в икономическото планиране и много други области.
Just like a human standing upright without falling over, here we see Entropica automatically balancing a pole using a cart. This behavior is remarkable in part because we never gave Entropica a goal. It simply decided on its own to balance the pole. This balancing ability will have appliactions for humanoid robotics and human assistive technologies. Just as some animals can use objects in their environments as tools to reach into narrow spaces, here we see that Entropica, again on its own initiative, was able to move a large disk representing an animal around so as to cause a small disk, representing a tool, to reach into a confined space holding a third disk and release the third disk from its initially fixed position. This tool use ability will have applications for smart manufacturing and agriculture. In addition, just as some other animals are able to cooperate by pulling opposite ends of a rope at the same time to release food, here we see that Entropica is able to accomplish a model version of that task. This cooperative ability has interesting implications for economic planning and a variety of other fields.
Ентропика е широко приложима в множество сфери. Например, тук я виждаме успешно да играе понг срещу себе си, което показва потенциала ѝ за игри. Тук виждаме Ентропика да организира нови познанства в социална мрежа, където постоянно се губят приятели и успешно да поддържа мрежата с достатъчен брой контакти. Това умение за организация на мрежи има приложение в здравеопазването, енергетиката и разузнаването. Тук виждаме Ентропика да направлява курса на флотилия кораби, успешно откривайки и използвайки Панамския канал, за да разшири достъпа си глобално от Атлантическия до Тихия океан. По същия начин Ентропика е широко приложима по проблеми на самостоятелната защита, логистиката и транспорта.
Entropica is broadly applicable to a variety of domains. For example, here we see it successfully playing a game of pong against itself, illustrating its potential for gaming. Here we see Entropica orchestrating new connections on a social network where friends are constantly falling out of touch and successfully keeping the network well connected. This same network orchestration ability also has applications in health care, energy, and intelligence. Here we see Entropica directing the paths of a fleet of ships, successfully discovering and utilizing the Panama Canal to globally extend its reach from the Atlantic to the Pacific. By the same token, Entropica is broadly applicable to problems in autonomous defense, logistics and transportation.
И накрая, тук виждаме Ентропика спонтанно да открива и да прилага стратегия "купувай на ниска цена, продавай на висока" за симулиран клас търгувани акции, успешно натрупвайки управляеми активи експоненциално. Тези способности в мениджмънта на риска ще имат широко приложение във финансите и застраховането.
Finally, here we see Entropica spontaneously discovering and executing a buy-low, sell-high strategy on a simulated range traded stock, successfully growing assets under management exponentially. This risk management ability will have broad applications in finance and insurance.
Алекс Уиснър-Грос: Това, което видяхте току-що, означава, че разнообразни познавателни поведения, типични за човешкия интелект, като използването на инструменти, ходенето изправен и социалното сътрудничество, всички следват от едно уравнение, което кара една система да максимизира бъдещата си свобода на действие.
Alex Wissner-Gross: So what you've just seen is that a variety of signature human intelligent cognitive behaviors such as tool use and walking upright and social cooperation all follow from a single equation, which drives a system to maximize its future freedom of action.
В това има дълбока ирония. Ако се върнем към началото на използването на термина робот, пиесата "RUR" ("Универсалните роботи на Росум"), винаги е съществувала представата, че ако развием интелигентни машини, ще има кибернетичен бунт. Машините ще се вдигнат срещу нас. Едно важно последствие от тази творба е, че може би през всички тези десетилетия цялата ни представа за кибернетичен бунт е била обърната. Машините не стават първо интелигентни и после мегаломаниакални и опитващи се да завладеят света. Точно обратното е - стремежът за контрол върху всички възможни бъдеща е по-основен принцип от този за разума и общият разум може на практика да възникне директно от този вид грабване на контрола. Това е по-вероятно, отколкото обратното.
Now, there's a profound irony here. Going back to the beginning of the usage of the term robot, the play "RUR," there was always a concept that if we developed machine intelligence, there would be a cybernetic revolt. The machines would rise up against us. One major consequence of this work is that maybe all of these decades, we've had the whole concept of cybernetic revolt in reverse. It's not that machines first become intelligent and then megalomaniacal and try to take over the world. It's quite the opposite, that the urge to take control of all possible futures is a more fundamental principle than that of intelligence, that general intelligence may in fact emerge directly from this sort of control-grabbing, rather than vice versa.
Друга важна последица е търсенето на цел. Често ме питат как способността за търсене на цели следва от този вид разбиране. И отговорът е, че способността за търсене на цели ще следва директно от това в следния смисъл: точно както вие бихте пътували през тунел, едно стеснение в бъдещия ви път, за да постигнете много други различни цели по-късно или точно като вие бихте инвестирали в един финансовa ценна книга, намалявайки ликвидността си в краткосрочен план, за да увеличите богатството си дългосрочно, търсенето на цели възниква директно от дългосрочния импулс да бъде увеличена бъдещата свобода на действие.
Another important consequence is goal seeking. I'm often asked, how does the ability to seek goals follow from this sort of framework? And the answer is, the ability to seek goals will follow directly from this in the following sense: just like you would travel through a tunnel, a bottleneck in your future path space, in order to achieve many other diverse objectives later on, or just like you would invest in a financial security, reducing your short-term liquidity in order to increase your wealth over the long term, goal seeking emerges directly from a long-term drive to increase future freedom of action.
И накрая, Ричард Файнман, известен физик, написа някога, че ако човешката цивилизация бъде унищожена и можем да предадем една-единствена идея на нашите потомци, за да им помогнем да създадат отново цивилизация, тази идея трябва да бъде, че цялата материя около нас е построена от малки елементи, които се привличат, когато са далеч един от друг, но се отблъскват, когато са близо. Моето еквивалентно такова твърдение, което да предадем на потомците си, за да им помогнем да създадат изкуствен интелект или да разберат човешкия разум, е следното: Разумът трябва да се разглежда като физически процес, който се опитва да максимизира бъдещата свобода на действие и избягва ограничения в бъдещето си.
Finally, Richard Feynman, famous physicist, once wrote that if human civilization were destroyed and you could pass only a single concept on to our descendants to help them rebuild civilization, that concept should be that all matter around us is made out of tiny elements that attract each other when they're far apart but repel each other when they're close together. My equivalent of that statement to pass on to descendants to help them build artificial intelligences or to help them understand human intelligence, is the following: Intelligence should be viewed as a physical process that tries to maximize future freedom of action and avoid constraints in its own future.
Много ви благодаря.
Thank you very much.
(Аплодисменти)
(Applause)