My colleagues and I are fascinated by the science of moving dots. So what are these dots? Well, it's all of us. And we're moving in our homes, in our offices, as we shop and travel throughout our cities and around the world. And wouldn't it be great if we could understand all this movement? If we could find patterns and meaning and insight in it. And luckily for us, we live in a time where we're incredibly good at capturing information about ourselves. So whether it's through sensors or videos, or apps, we can track our movement with incredibly fine detail.
Ja i moi koledzy fascynujemy się nauką o punktach w ruchu. Czym są te punkty? Każdym z nas. Przemieszczamy się w domach, biurach, podczas zakupów i podróży, w miastach i dookoła świata. Czy nie byłoby świetnie zrozumieć ten ruch? Poznać jego schematy i głębszy sens? Na szczęście żyjemy w czasach, w których łatwo można rejestrować informacje o sobie. Dzięki sensorom, filmom czy aplikacjom można śledzić ruch z bardzo dużą dokładnością.
So it turns out one of the places where we have the best data about movement is sports. So whether it's basketball or baseball, or football or the other football, we're instrumenting our stadiums and our players to track their movements every fraction of a second. So what we're doing is turning our athletes into -- you probably guessed it -- moving dots.
Okazuje się, że dziedziną, w której mamy najwięcej danych o ruchu, jest sport. Czy to koszykówka, baseball, piłka nożna czy inny sport, montujemy na stadionach i graczach urządzenia do rejestracji ruchu w każdym ułamku sekundy. Zamieniamy więc sportowców w... ...już pewnie wiecie... ...ruchome punkty.
So we've got mountains of moving dots and like most raw data, it's hard to deal with and not that interesting. But there are things that, for example, basketball coaches want to know. And the problem is they can't know them because they'd have to watch every second of every game, remember it and process it. And a person can't do that, but a machine can. The problem is a machine can't see the game with the eye of a coach. At least they couldn't until now. So what have we taught the machine to see?
Mnóstwo ruchomych punktów, jak większość surowych danych, jest mało interesujące i trudno je zrozumieć. Niektóre przydałyby się na przykład trenerowi koszykówki, ale musiałby wtedy obejrzeć każdą sekundę każdej gry, zapamiętać ją i opracować. Człowiek tego nie potrafi, ale maszyna może. Niestety maszyna nie może oglądać gry okiem trenera. Przynajmniej tak było dotychczas. Jak nauczyliśmy maszynę widzieć?
So, we started simply. We taught it things like passes, shots and rebounds. Things that most casual fans would know. And then we moved on to things slightly more complicated. Events like post-ups, and pick-and-rolls, and isolations. And if you don't know them, that's okay. Most casual players probably do. Now, we've gotten to a point where today, the machine understands complex events like down screens and wide pins. Basically things only professionals know. So we have taught a machine to see with the eyes of a coach.
Zaczęliśmy banalnie. Nauczyliśmy ją podań, rzutów i zbiórek. Rzeczy, które zna większość fanów. Następnie przeszliśmy do rzeczy bardziej skomplikowanych. Podań pod kosz, zasłon i odcięć. Jeśli ich nie znasz, nie szkodzi. Większość graczy je kojarzy. Dzisiejsza maszyna rozumie złożone zagrania, na przykład szerokie zasłony przy liniach końcowych. Rzeczy znane tylko profesjonalistom. Nauczyliśmy maszynę patrzeć oczami trenera.
So how have we been able to do this? If I asked a coach to describe something like a pick-and-roll, they would give me a description, and if I encoded that as an algorithm, it would be terrible. The pick-and-roll happens to be this dance in basketball between four players, two on offense and two on defense. And here's kind of how it goes. So there's the guy on offense without the ball the ball and he goes next to the guy guarding the guy with the ball, and he kind of stays there and they both move and stuff happens, and ta-da, it's a pick-and-roll.
Jak to zrobiliśmy? Poproszony o wyjaśnienie zasłony trener podałby mi opis, z którego powstałby raczej mizerny algorytm. Zasłona w koszykówce to taniec między czterema graczami, dwoma w ataku i dwoma w obronie. Tak to mniej więcej wygląda. Mamy atakującego bez piłki, który podbiega do gracza kryjącego gracza z piłką i tam się zatrzymuje, obaj się ruszają, coś się dzieje i - ta-dam! - mamy zasłonę.
(Laughter)
(Śmiech)
So that is also an example of a terrible algorithm. So, if the player who's the interferer -- he's called the screener -- goes close by, but he doesn't stop, it's probably not a pick-and-roll. Or if he does stop, but he doesn't stop close enough, it's probably not a pick-and-roll. Or, if he does go close by and he does stop but they do it under the basket, it's probably not a pick-and-roll. Or I could be wrong, they could all be pick-and-rolls. It really depends on the exact timing, the distances, the locations, and that's what makes it hard. So, luckily, with machine learning, we can go beyond our own ability to describe the things we know.
To jest właśnie przykład mizernego algorytmu. Jeśli blokujący gracz nazywany zasłaniającym zbliża się do obrońcy, ale się nie zatrzymuje, to pewnie nie jest zasłona. Lub jeśli się zatrzymuje, ale nie dość blisko, to też może nie być zasłona. Lub jeśli zatrzymuje się blisko, ale robi to pod koszem, to raczej też nie zasłona. Albo się mylę i to wszystko są zasłony. To zależy od danego momentu w grze, odległości, pozycji graczy i dlatego jest to takie trudne. Na szczęście uczenie maszynowe pozwala lepiej opisywać znane nam rzeczy.
So how does this work? Well, it's by example. So we go to the machine and say, "Good morning, machine. Here are some pick-and-rolls, and here are some things that are not. Please find a way to tell the difference." And the key to all of this is to find features that enable it to separate. So if I was going to teach it the difference between an apple and orange, I might say, "Why don't you use color or shape?" And the problem that we're solving is, what are those things? What are the key features that let a computer navigate the world of moving dots? So figuring out all these relationships with relative and absolute location, distance, timing, velocities -- that's really the key to the science of moving dots, or as we like to call it, spatiotemporal pattern recognition, in academic vernacular. Because the first thing is, you have to make it sound hard -- because it is.
Jak to działa? Dam wam przykład. Znajdujemy maszynę i mówimy: "Dzień dobry maszyno. To są zasłony, a to nie. Naucz się je rozróżniać". Najważniejsze są tu właściwości umożliwiające rozróżnienie. Jeśli miałbym nauczyć maszynę różnicy między jabłkiem, a pomarańczą powiedziałbym: "Skup się na kolorze i kształcie". Naszym zadaniem jest odnalezienie takich właściwości. Które z nich ułatwią maszynie zrozumienie świata poruszających się punktów? Poznanie zależności między względnymi i bezwzględnymi pozycjami, odległościami, czasem i prędkością jest kluczowe w nauce o punktach w ruchu, nazywanej przez nas w języku akademickim rozpoznawaniem schematów czasoprzestrzennych. Nazwa musi być skomplikowana, bo sama dziedzina jest właśnie taka.
The key thing is, for NBA coaches, it's not that they want to know whether a pick-and-roll happened or not. It's that they want to know how it happened. And why is it so important to them? So here's a little insight. It turns out in modern basketball, this pick-and-roll is perhaps the most important play. And knowing how to run it, and knowing how to defend it, is basically a key to winning and losing most games. So it turns out that this dance has a great many variations and identifying the variations is really the thing that matters, and that's why we need this to be really, really good.
Trenerzy NBA nie chcą wiedzieć, czy dane zagranie to była zasłona czy nie. Chcą wiedzieć, jak do zagrania doszło. Dlaczego to dla nich takie ważne? Podpowiem wam. W dzisiejszej w koszykówce zasłona to jedno z najważniejszych zagrań. Wiedza, jak je wykonać i jak się przed nim bronić, decyduje w zasadzie o wygranej. Okazuje się, że ten taniec ma wiele odmian i rozróżnianie tych odmian jest bardzo istotne, dlatego musimy być bardzo dokładni.
So, here's an example. There are two offensive and two defensive players, getting ready to do the pick-and-roll dance. So the guy with ball can either take, or he can reject. His teammate can either roll or pop. The guy guarding the ball can either go over or under. His teammate can either show or play up to touch, or play soft and together they can either switch or blitz and I didn't know most of these things when I started and it would be lovely if everybody moved according to those arrows. It would make our lives a lot easier, but it turns out movement is very messy. People wiggle a lot and getting these variations identified with very high accuracy, both in precision and recall, is tough because that's what it takes to get a professional coach to believe in you. And despite all the difficulties with the right spatiotemporal features we have been able to do that.
Oto przykład. Dwóch zawodników w ataku i dwóch w obronie przygotowuje się do tańca pick-and-roll. Gracz z piłką może skorzystać z zasłony lub nie. Jego kolega może wbiec pod kosz lub rzucić z dystansu. Kryjący piłkę może ruszyć przed lub za zasłonę. Jego kolega może zachować dystans, pozostać w kontakcie lub wycofać się, a razem mogą podwoić albo zamienić się w obronie. Nie wiedziałem tego wszystkiego z początku, a byłoby świetnie, gdyby wszyscy ruszali się zgodnie ze strzałkami. Byłoby nam łatwiej, ale ruch to chaos. Ludzie wciąż się kręcą i rozróżnienie tych wszystkich odmian z zachowaniem wysokiej dokładności i możliwości odtworzenia jest trudne, ale konieczne, by przekonać trenerów. Pomimo tak wielu czasoprzestrzennych zależności udało się nam.
Coaches trust our ability of our machine to identify these variations. We're at the point where almost every single contender for an NBA championship this year is using our software, which is built on a machine that understands the moving dots of basketball. So not only that, we have given advice that has changed strategies that have helped teams win very important games, and it's very exciting because you have coaches who've been in the league for 30 years that are willing to take advice from a machine. And it's very exciting, it's much more than the pick-and-roll. Our computer started out with simple things and learned more and more complex things and now it knows so many things. Frankly, I don't understand much of what it does, and while it's not that special to be smarter than me, we were wondering, can a machine know more than a coach? Can it know more than person could know? And it turns out the answer is yes.
Trenerzy wierzą, że nasze maszyny rozróżniają wszystkie odmiany zagrań. Dzisiaj prawie każda drużyna licząca się w walce o mistrzostwo NBA używa naszych rozwiązań, opartych na maszynie rozumiejącej punkty w ruchu w koszykówce. Dzięki naszym radom drużyny zmieniają strategie gry i wygrywają ważne spotkania. Co ciekawe, nawet trenerzy, którzy są w lidze od 30 lat, są skłonni słuchać rad maszyny. To naprawdę pasjonujące i nie chodzi tylko o pick-and-roll. Nasz komputer zaczynał od rzeczy prostych i przez coraz bardziej skomplikowane nauczył się bardzo wiele. Ja sam nie bardzo to rozumiem. To żadna sztuka być mądrzejszym ode mnie, ale czy maszyna może być mądrzejsza od trenera? Wiedzieć więcej niż człowiek? Okazało się, że tak.
The coaches want players to take good shots. So if I'm standing near the basket and there's nobody near me, it's a good shot. If I'm standing far away surrounded by defenders, that's generally a bad shot. But we never knew how good "good" was, or how bad "bad" was quantitatively. Until now.
Trenerzy chcą, by gracze dobrze rzucali. Jeśli stoję pod koszem i nikt mnie nie kryje, można rzucać. Ale rzucanie z dystansu spośród obrońców to już nie najlepszy pomysł. Wcześniej nie umieliśmy wyliczyć, jak dobra, czy jak zła jest decyzja. Aż dotąd.
So what we can do, again, using spatiotemporal features, we looked at every shot. We can see: Where is the shot? What's the angle to the basket? Where are the defenders standing? What are their distances? What are their angles? For multiple defenders, we can look at how the player's moving and predict the shot type. We can look at all their velocities and we can build a model that predicts what is the likelihood that this shot would go in under these circumstances? So why is this important? We can take something that was shooting, which was one thing before, and turn it into two things: the quality of the shot and the quality of the shooter. So here's a bubble chart, because what's TED without a bubble chart?
Używając zależności czasoprzestrzennych badamy każdy rzut. Sprawdzamy, jaki to rzut, pod jakim kątem do kosza. Gdzie są obrońcy. Jak są daleko. Pod jakim kątem stoją. Przy wielu obrońcach umiemy przyjrzeć się ruchom gracza i przewidzieć rodzaj rzutu. Tworzymy model na podstawie ich prędkości, żeby w danej sytuacji przewidzieć celność rzutu. Czemu to takie ważne? Rzucanie było uważane za jedną czynność, ale dziś można je rozbić na dwie: właściwości rzutu i umiejętności rzucającego. Oto wykres bąbelkowy, bo co to za TED bez wykresu bąbelkowego?
(Laughter)
(Śmiech)
Those are NBA players. The size is the size of the player and the color is the position. On the x-axis, we have the shot probability. People on the left take difficult shots, on the right, they take easy shots. On the [y-axis] is their shooting ability. People who are good are at the top, bad at the bottom. So for example, if there was a player who generally made 47 percent of their shots, that's all you knew before. But today, I can tell you that player takes shots that an average NBA player would make 49 percent of the time, and they are two percent worse. And the reason that's important is that there are lots of 47s out there. And so it's really important to know if the 47 that you're considering giving 100 million dollars to is a good shooter who takes bad shots or a bad shooter who takes good shots. Machine understanding doesn't just change how we look at players, it changes how we look at the game.
To są gracze NBA. Rozmiar to wzrost zawodnika, kolor to pozycja. Oś X to prawdopodobieństwo rzutu. Gracze z lewej oddają trudne rzuty, ci prawej - łatwe. Oś Y przedstawia celność graczy. Najlepsi są na górze, najgorsi na dole. Dla przykładu, jeśli dawniej gracz miał 47% skuteczności rzutów, to tu się nasza wiedza kończyła. Teraz mogę stwierdzić, że oddaje on rzuty, które dla przeciętnego gracza NBA są celne w 49% przypadków i że jest on słabszy o 2%. To ważne, bo jest wielu graczy ze skutecznością 47%. Warto wiedzieć czy gracz, któremu chcemy zapłacić 100 milinów dolarów, to dobry rzucający oddający trudne rzuty, czy słaby rzucający oddający rzuty łatwe. Logika maszynowa zmienia nie tylko nasze postrzeganie graczy, ale też samej gry.
So there was this very exciting game a couple of years ago, in the NBA finals. Miami was down by three, there was 20 seconds left. They were about to lose the championship. A gentleman named LeBron James came up and he took a three to tie. He missed. His teammate Chris Bosh got a rebound, passed it to another teammate named Ray Allen. He sank a three. It went into overtime. They won the game. They won the championship. It was one of the most exciting games in basketball. And our ability to know the shot probability for every player at every second, and the likelihood of them getting a rebound at every second can illuminate this moment in a way that we never could before. Now unfortunately, I can't show you that video. But for you, we recreated that moment at our weekly basketball game about 3 weeks ago.
Dwa lata temu w finałach NBA mieliśmy bardzo ekscytujący mecz. Miami przegrywało 3 punktami, zostało 20 sekund. Byli o włos od przegrania mistrzostwa. Gracz zwany LeBron James dostał pikę i rzucił za trzy. Spudłował. Jego kolega Chris Bosh zebrał i podał do innego kolegi, Raya Allena. On trafił i potrzebna była dogrywka. Miami wygrało mecz a później mistrzostwo. Był to jeden z najbardziej pasjonujących meczów. A fakt, że znamy prawdopodobieństwo każdego rzutu, każdego gracza w każdej sekundzie i prawdopodobieństwo zbiórki w każdej sekundzie meczu, pozwala nam przeanalizować ten moment w zupełnie nowy sposób. Niestety nie mogę pokazać wam tamtego meczu. Ale odtworzyliśmy dla was tamtą chwilę podczas jednego z naszych meczów 3 tygodnie temu.
(Laughter)
(Śmiech)
And we recreated the tracking that led to the insights. So, here is us. This is Chinatown in Los Angeles, a park we play at every week, and that's us recreating the Ray Allen moment and all the tracking that's associated with it. So, here's the shot. I'm going to show you that moment and all the insights of that moment. The only difference is, instead of the professional players, it's us, and instead of a professional announcer, it's me. So, bear with me.
Odtworzyliśmy też metodę obserwacji. Oto my w Chinatown w Los Angeles, na naszym boisku. Tutaj odtwarzamy rzut Raya Allena i związane z nim obserwacje. Oto rzut. Pokażę wam tę chwilę i to, jak ją analizowaliśmy. Różni się tylko tym, że zamiast zawodowców gramy my, a ja zastępuję profesjonalnego komentatora. Zaczynamy.
Miami. Down three. Twenty seconds left. Jeff brings up the ball. Josh catches, puts up a three!
Miami. Trzy punkty straty. Zostało 20 sekund. Jeff wyrzuca piłkę. Josh łapie i rzuca za trzy!
[Calculating shot probability]
[Prawdopodobieństwo trafienia]
[Shot quality]
[Jakość rzutu]
[Rebound probability]
[Prawdopodobieństwo zbiórki]
Won't go!
Nie wejdzie!
[Rebound probability]
[Prawdopodobieństwo zbiórki]
Rebound, Noel. Back to Daria.
Zbiera Noel. Podaje Darii.
[Shot quality]
[Jakość rzutu]
Her three-pointer -- bang! Tie game with five seconds left. The crowd goes wild.
Trójka - tak jest! Remis na pięć sekund przed końcem, Tłumy szaleją.
(Laughter)
(Śmiech)
That's roughly how it happened.
Mniej więcej tak to było.
(Applause)
(Brawa)
Roughly.
Mniej więcej.
(Applause) That moment had about a nine percent chance of happening in the NBA and we know that and a great many other things. I'm not going to tell you how many times it took us to make that happen.
(Brawa) Prawdopodobieństwo tego zdarzenia w NBA wynosiło około 9%. Wiemy to i mnóstwo innych rzeczy. Nie wspomnę, ile razy próbowaliśmy odtworzyć tę scenę.
(Laughter)
(Śmiech)
Okay, I will! It was four.
Dobra, powiem wam. Cztery.
(Laughter)
(Śmiech)
Way to go, Daria.
Dobra robota, Daria.
But the important thing about that video and the insights we have for every second of every NBA game -- it's not that. It's the fact you don't have to be a professional team to track movement. You do not have to be a professional player to get insights about movement.
Ale w tym materiale i analizie każdej sekundy gry najważniejsze jest to, że nie trzeba grać zawodowo, by śledzić swoje ruchy. Nie tylko zawodowi sportowcy mogą analizować to, jak się poruszają.
In fact, it doesn't even have to be about sports because we're moving everywhere. We're moving in our homes, in our offices, as we shop and we travel throughout our cities and around our world. What will we know? What will we learn? Perhaps, instead of identifying pick-and-rolls, a machine can identify the moment and let me know when my daughter takes her first steps. Which could literally be happening any second now.
To w ogóle nie musi dotyczyć sportu, bo poruszamy się wszędzie. W domu i biurze. Robiąc zakupy i podróżując. Przemierzamy miasta i cały świat. Czego można się dowiedzieć i nauczyć? Może zamiast rozpoznawać zagrania, maszyna będzie da mi znać, kiedy moja córka postawi pierwsze kroki. A może się to stać w każdej chwili.
Perhaps we can learn to better use our buildings, better plan our cities. I believe that with the development of the science of moving dots, we will move better, we will move smarter, we will move forward.
Możemy dzięki temu poprawiać użyteczność budynków i miast. Wierzę, że rozwijając naukę o poruszających się punktach, będziemy poruszali się lepiej i mądrzej kroczyli naprzód.
Thank you very much.
Dziękuję bardzo.
(Applause)
(Brawa)