So, I have a feature on my website where every week people submit hypothetical questions for me to answer, and I try to answer them using math, science and comics.
Co tydzień ludzie zamieszczają na mojej stronie hipotetyczne pytania. Odpowiadam na nie używając matematyki, nauk przyrodniczych i komiksów.
So for example, one person asked, what would happen if you tried to hit a baseball pitched at 90 percent of the speed of light? So I did some calculations. Now, normally, when an object flies through the air, the air will flow around the object, but in this case, the ball would be going so fast that the air molecules wouldn't have time to move out of the way. The ball would smash right into and through them, and the collisions with these air molecules would knock away the nitrogen, carbon and hydrogen from the ball, fragmenting it off into tiny particles, and also triggering waves of thermonuclear fusion in the air around it. This would result in a flood of x-rays that would spread out in a bubble along with exotic particles, plasma inside, centered on the pitcher's mound, and that would move away from the pitcher's mound slightly faster than the ball. Now at this point, about 30 nanoseconds in, the home plate is far enough away that light hasn't had time to reach it, which means the batter still sees the pitcher about to throw and has no idea that anything is wrong. (Laughter) Now, after 70 nanoseconds, the ball will reach home plate, or at least the cloud of expanding plasma that used to be the ball, and it will engulf the bat and the batter and the plate and the catcher and the umpire and start disintegrating them all as it also starts to carry them backward through the backstop, which also starts to disintegrate. So if you were watching this whole thing from a hill, ideally, far away, what you'd see is a bright flash of light that would fade over a few seconds, followed by a blast wave spreading out, shredding trees and houses as it moves away from the stadium, and then eventually a mushroom cloud rising up over the ruined city. (Laughter)
Kiedyś zapytano mnie, co by się stało, gdyby spróbować odbić piłkę bejsbolową, która została rzucona z prędkością 90% prędkości światła. Wykonałem kilka obliczeń. Kiedy jakiś obiekt leci, powietrze go opływa, ale w tym wypadku piłka byłaby za szybka, żeby powietrze zdążyło się rozstąpić. Uderzyłaby w cząsteczki powietrza, a kolizja wytrąciłaby z piłki azot, węgiel i wodór, rozbijając ją na małe cząstki i inicjując fale fuzji termojądrowej. Promienie X rozchodziłyby się na zewnątrz tworząc bańkę z egzotycznymi cząstkami i plazmą wewnątrz, a metą miotacza w centrum, dużo szybciej niż piłka. W około 30 nanosekundzie ostatnia baza znajdzie się na tyle daleko, że światło nie zdąży do niej dojść, więc pałkarz nadal będzie widział miotacza przygotowującego się do rzutu, jakby wszystko było w porządku. (Śmiech) Po 70 nanosekundach piłka albo raczej rosnąca chmura plazmy, która kiedyś była piłką, znajdzie się przy ostatniej bazie i pochłonie pałkę, pałkarza, łapacza, sędziego i zacznie ich dezintegrować jednocześnie niosąc ich w tył przez dezintegrowaną obronę. Gdybyście nadal to oglądali, najlepiej daleko ze wzgórza, zobaczylibyście błysk światła, które wyblakłoby po kilku sekundach. Potem zerwałby się silny wiatr niszczący drzewa i domy na swojej drodze, aż w końcu nad zrujnowanym miastem uniósłby się grzyb dymu. (Śmiech)
So the Major League Baseball rules are a little bit hazy, but — (Laughter) — under rule 6.02 and 5.09, I think that in this situation, the batter would be considered hit by pitch and would be eligible to take first base, if it still existed.
Zasady amerykańskiej ligi bejsbolu nie są tu jednoznaczne, (Śmiech) ale zgodnie z punktami 6.02 i 5.09, myślę, że w tej sytuacji uznano by, że pałkarz uderzył w piłkę i byłby uprawniony do zdobycia pierwszej bazy, o ile nadal by istniała.
So this is the kind of question I answer, and I get people writing in with a lot of other strange questions. I've had someone write and say, scientifically speaking, what is the best and fastest way to hide a body? Can you do this one soon? And I had someone write in, I've had people write in about, can you prove whether or not you can find love again after your heart's broken? And I've had people send in what are clearly homework questions they're trying to get me to do for them.
Ludzie przysyłają wiele dziwnych pytań, a ja na nie odpowiadam. Kiedyś zapytano mnie jaki jest, z punktu widzenia nauki, najlepszy sposób na ukrycie ciała, z prośbą, żebym odpowiedział szybko. Albo na przykład dostawałem wiadomości z pytaniem, czy mogę dowieść, że po tym, jak ktoś złamie ci serce, możesz ponownie odnaleźć miłość. Niektórzy wysyłają mi też swoje zadania domowe, chcą, żebym je za nich odrabiał.
But one week, a couple months ago, I got a question that was actually about Google. If all digital data in the world were stored on punch cards, how big would Google's data warehouse be? Now, Google's pretty secretive about their operations, so no one really knows how much data Google has, and in fact, no one really knows how many data centers Google has, except people at Google itself. And I've tried, I've met them a few times, tried asking them, and they aren't revealing anything.
Kilka miesięcy temu dostałem pytanie o Google'a. "Gdyby wszystkie dane cyfrowe były przechowywane na fiszkach, jak duży byłby magazyn Google'a?" Działalność firmy Google jest dosyć tajemnicza, więc nikt oprócz pracowników nie wie, jak wiele danych ma Google. Wiele razy próbowałem jakoś ich podejść, zapytać, ale nikt niczego nie ujawnił.
So I decided to try to figure this out myself. There are a few things that I looked at here. I started with money. Google has to reveal how much they spend, in general, and that lets you put some caps on how many data centers could they be building, because a big data center costs a certain amount of money. And you can also then put a cap on how much of the world hard drive market are they taking up, which turns out, it's pretty sizable. I read a calculation at one point, I think Google has a drive failure about every minute or two, and they just throw out the hard drive and swap in a new one. So they go through a huge number of them. And so by looking at money, you can get an idea of how many of these centers they have. You can also look at power. You can look at how much electricity they need, because you need a certain amount of electricity to run the servers, and Google is more efficient than most, but they still have some basic requirements, and that lets you put a limit on the number of servers that they have. You can also look at square footage and see of the data centers that you know, how big are they? How much room is that? How many server racks could you fit in there? And for some data centers, you might get two of these pieces of information. You know how much they spent, and they also, say, because they had to contract with the local government to get the power provided, you might know what they made a deal to buy, so you know how much power it takes. Then you can look at the ratios of those numbers, and figure out for a data center where you don't have that information, you can figure out, but maybe you only have one of those, you know the square footage, then you could figure out well, maybe the power is proportional. And you can do this same thing with a lot of different quantities, you know, with guesses about the total amount of storage, the number of servers, the number of drives per server, and in each case using what you know to come up with a model that narrows down your guesses for the things that you don't know. It's sort of circling around the number you're trying to get. And this is a lot of fun. The math is not all that advanced, and really it's like nothing more than solving a sudoku puzzle.
Wtedy postanowiłem sam do tego dojść. Oto kilka rzeczy, które uwzględniłem. Przede wszystkim pieniądze. Google musi ujawniać, ile pieniędzy wydaje, a to pozwala oszacować, ile baz danych może budować, bo takie bazy mają ściśle określoną cenę. Można się też dowiedzieć, jaką część rynku dysków twardych posiada. Okazało się, że znaczną. Przeczytałem obliczenia i myślę, że w Google'u co minutę albo dwie psuje się dysk, więc wymienia się go na nowy. Google ma ich ogromną ilość. Analizując koszty otrzymamy obraz tego, jak dużo centrów może mieć. Możemy też spojrzeć na energię. Na to, jak dużo prądu wykorzystuje, bo trzeba konkretnej ilości prądu, żeby utrzymać serwery, a choć Google jest bardzo wydajny, nadal ma pewne podstawowe wymagania, co pozwala oszacować liczbę serwerów. Można też spojrzeć na metraż, na to, jak duże są centra, które znamy. Ile mają pomieszczeń, jak dużo serwerów by się tam zmieściło? W niektórych przypadkach może się udać pozyskać dwie informacje. Ile wydaje dane centrum i jaką ilość prądu zużywa, na podstawie umowy na dostawę prądu z lokalnym urzędem. Potem można przyjrzeć się stosunkowi tych danych i na ich podstawie szacować podobne wartości dla innych baz, o których nie mamy tylu informacji. Na podstawie metrażu można określić zużycie prądu, zakładając, że jest proporcjonalne. Można robić to samo z wieloma innymi wskaźnikami: powierzchnią przechowywania, ilością serwerów i dysków na serwer tak, żeby zawęzić zgadywanki tylko do tego, czego nie wiemy. To rodzaj lawirowania wokół pewnej liczby, którą chcemy uzyskać. To świetna zabawa. Nie jest to wyższa matematyka, raczej coś, jak rozwiązywanie sudoku.
So what I did, I went through all of this information, spent a day or two researching. And there are some things I didn't look at. You could always look at the Google recruitment messages that they post. That gives you an idea of where they have people. Sometimes, when people visit a data center, they'll take a cell-cam photo and post it, and they aren't supposed to, but you can learn things about their hardware that way. And in fact, you can just look at pizza delivery drivers. Turns out, they know where all the Google data centers are, at least the ones that have people in them.
Więc przekopałem się przez wszystkie informacje, spędziłem dzień lub dwa na poszukiwaniach. Kilku rzeczy nie sprawdziłem. Mogłem przejrzeć wiadomości rekrutacyjne, które zamieszcza Google. Dowiedziałbym się, gdzie mają ludzi. Czasem zwiedzający centra danych robią zdjęcia i zamieszczają w internecie, chociaż im nie wolno, ale dzięki nim można zdobyć informacje o sprzęcie takiego centrum. W sumie można też spytać dostawców pizzy. Okazuje się, że wiedzą, gdzie są wszystkie centra Google'a, przynajmniej te, w których bywają ludzie.
But I came up with my estimate, which I felt pretty good about, that was about 10 exabytes of data across all of Google's operations, and then another maybe five exabytes or so of offline storage in tape drives, which it turns out Google is about the world's largest consumer of.
Zająłem się szacowaniem, w czym czułem się całkiem pewnie i doszedłem do wniosku, że wszystkie operacje Google'a to około 10 eksabajtów, kolejne pięć to dane offline na pamięciach taśmowych, okazało się, że Google jest ich największym światowym konsumentem.
So I came up with this estimate, and this is a staggering amount of data. It's quite a bit more than any other organization in the world has, as far as we know. There's a couple of other contenders, especially everyone always thinks of the NSA. But using some of these same methods, we can look at the NSA's data centers, and figure out, you know, we don't know what's going on there, but it's pretty clear that their operation is not the size of Google's.
Oszacowałem to wszystko, ale to naprawdę zdumiewająca ilość danych. Z tego co wiadomo, to dużo więcej danych niż w innych firmach na świecie. Jest jeszcze kilku zawodników, szczególnie często mówi się o NSA. Ich centra też można sprawdzić używając tych samych metod, nie wiadomo, co się tam dokładnie dzieje, ale to całkiem jasne, że nie mają tak dużej bazy danych jak Google.
Adding all of this up, I came up with the other thing that we can answer, which is, how many punch cards would this take? And so a punch card can hold about 80 characters, and you can fit about 2,000 or so cards into a box, and you put them in, say, my home region of New England, it would cover the entire region up to a depth of a little less than five kilometers, which is about three times deeper than the glaciers during the last ice age about 20,000 years ago.
Podsumowując wszystko, byłem w stanie policzyć na ilu fiszkach można to zapisać. Jedna fiszka mieści około 80 znaków, a do pudełka można włożyć ich około 2000 i gdyby je ułożyć np w Nowej Anglii, regionie, z którego pochodzę, to stworzyłyby warstwę grubą na około pięć kilometrów. Ta warstwa byłaby trzy razy grubsza niż lodowiec podczas ostatniej epoki lodowcowej, 20 tys. lat temu.
So this is impractical, but I think that's about the best answer I could come up with. And I posted it on my website. I wrote it up. And I didn't expect to get an answer from Google, because of course they've been so secretive, they didn't answer of my questions, and so I just put it up and said, well, I guess we'll never know.
To mało praktyczna, ale najlepsza odpowiedź, jakiej mogłem udzielić. Spisałem ją i zamieściłem na stronie. Nie spodziewałem się odpowiedzi od Google, po tym jak byli tacy tajemniczy i nie odpowiadali na moje pytania, więc wstawiłem post myśląc, że tak naprawdę nigdy nie poznamy prawdy.
But then a little while later I got a message, a couple weeks later, from Google, saying, hey, someone here has an envelope for you. So I go and get it, open it up, and it's punch cards. (Laughter) Google-branded punch cards. And on these punch cards, there are a bunch of holes, and I said, thank you, thank you, okay, so what's on here? So I get some software and start reading it, and scan them, and it turns out it's a puzzle. There's a bunch of code, and I get some friends to help, and we crack the code, and then inside that is another code, and then there are some equations, and then we solve those equations, and then finally out pops a message from Google which is their official answer to my article, and it said, "No comment." (Laughter) (Applause)
Kilka tygodni później dostałem wiadomość od Google, że czeka na mnie jakaś koperta. Pojechałem ją odebrać, otworzyłem, a w środku znalazłem fiszki. (Śmiech) Fiszki z logiem Google. Na nich było mnóstwo małych dziurek, pomyślałem, że dzięki, ale co to jest? Znalazłem oprogramowanie i zacząłem je skanować i czytać. Okazało się, że to zagadka. Było tam wiele kodów, więc zebrałem do pomocy kilku przyjaciół, złamaliśmy kod, ale w tym kodzie był kolejny, w nim kilka równań, więc rozwiązaliśmy równania i w końcu odczytaliśmy wiadomość od Google, która była ich oficjalną odpowiedzią na mój artykuł, a brzmiała: "Bez komentarza". (Śmiech) (Brawa)
And I love calculating these kinds of things, and it's not that I love doing the math. I do a lot of math, but I don't really like math for its own sake. What I love is that it lets you take some things that you know, and just by moving symbols around on a piece of paper, find out something that you didn't know that's very surprising. And I have a lot of stupid questions, and I love that math gives the power to answer them sometimes.
Kocham liczyć takie rzeczy i nie chodzi mi tu o samą matematykę. Ją też kocham, ale nie lubię matematyki dla samej matematyki. Kocham to, że biorąc coś, co znam i zapisując na kartce kilka symboli mogę dowiedzieć się czegoś nowego, często bardzo zaskakującego. Mam wiele głupich pytań i to cudowne, że matematyka pozwala na nie odpowiedzieć. Czasem jednak nie.
And sometimes not. This is a question I got from a reader, an anonymous reader, and the subject line just said, "Urgent," and this was the entire email: "If people had wheels and could fly, how would we differentiate them from airplanes?" Urgent. (Laughter)
To pytanie dostałem od anonimowego czytelnika z dopiskiem "Pilne", cały email brzmiał: "Gdyby ludzie mieli skrzydła i kółka, jak odróżnialibyśmy ich od samolotów?" Rzeczywiście pilne. (Śmiech)
And I think there are some questions that math just cannot answer. Thank you. (Applause)
Myślę, że są pytania, wobec których matematyka jest bezsilna. Dziękuję. (Brawa)