So, I have a feature on my website where every week people submit hypothetical questions for me to answer, and I try to answer them using math, science and comics.
Tengo una función en mi sitio web en el que cada semana la gente envía preguntas hipotéticas para que yo las responda, y trato de hacerlo usando las matemáticas, la ciencia y las tiras cómicas.
So for example, one person asked, what would happen if you tried to hit a baseball pitched at 90 percent of the speed of light? So I did some calculations. Now, normally, when an object flies through the air, the air will flow around the object, but in this case, the ball would be going so fast that the air molecules wouldn't have time to move out of the way. The ball would smash right into and through them, and the collisions with these air molecules would knock away the nitrogen, carbon and hydrogen from the ball, fragmenting it off into tiny particles, and also triggering waves of thermonuclear fusion in the air around it. This would result in a flood of x-rays that would spread out in a bubble along with exotic particles, plasma inside, centered on the pitcher's mound, and that would move away from the pitcher's mound slightly faster than the ball. Now at this point, about 30 nanoseconds in, the home plate is far enough away that light hasn't had time to reach it, which means the batter still sees the pitcher about to throw and has no idea that anything is wrong. (Laughter) Now, after 70 nanoseconds, the ball will reach home plate, or at least the cloud of expanding plasma that used to be the ball, and it will engulf the bat and the batter and the plate and the catcher and the umpire and start disintegrating them all as it also starts to carry them backward through the backstop, which also starts to disintegrate. So if you were watching this whole thing from a hill, ideally, far away, what you'd see is a bright flash of light that would fade over a few seconds, followed by a blast wave spreading out, shredding trees and houses as it moves away from the stadium, and then eventually a mushroom cloud rising up over the ruined city. (Laughter)
Por ejemplo, una persona preguntó: ¿Qué pasaría si intentas golpear una pelota de béisbol lanzada al 90 % de la velocidad de la luz? Así que hice algunos cálculos. Normalmente, cuando un objeto vuela por el aire, el aire pasa alrededor del objeto, pero en este caso, la pelota iría tan rápido que las moléculas del aire no tendrían tiempo de quitarse del camino. La pelota las destruiría pasando a través de ellas, y la colisión con estas moléculas de aire enviaría lejos el nitrógeno, carbono e hidrógeno de la pelota fragmentándola en pequeñas partículas, y produciendo olas de fusión termonuclear en el aire a su alrededor. Esto daría lugar a una inundación de rayos X que se extendería en una burbuja junto con partículas exóticas, plasma en el interior, centrada en el montículo del lanzador, y que se moverían alejándose del montículo del lanzador ligeramente más rápido que la pelota. En este punto, en unos 30 nanosegundos, la base está lo suficientemente lejos como para que la luz no haya podido llegar a él, lo que significa que el bateador aún ve al lanzador a punto de tirar y no tiene idea de que algo anda mal. (Risas) Después de 70 nanosegundos, la pelota llegará a la base, o al menos la nube de plasma en expansión que solía ser la pelota, y se tragará el bate y al bateador y la base, el receptor y el árbitro y empezará a desintegrarlos a todos y también empezará a llevarlos hacia atrás a través del tope de retención, que también comienza a desintegrarse. Si estuvieran viendo todo esto desde una colina, idealmente, muy lejos, lo que verían sería un destello de luz desvaneciéndose en segundos, seguido de una onda expansiva, destruyendo árboles y casas a medida que se aleja del estadio, y luego, finalmente, un hongo atómico elevándose sobre la ciudad en ruinas. (Risas)
So the Major League Baseball rules are a little bit hazy, but — (Laughter) — under rule 6.02 and 5.09, I think that in this situation, the batter would be considered hit by pitch and would be eligible to take first base, if it still existed.
Las reglas de las Grandes Ligas son un poco nebulosas, pero —(Risas)— bajo la regla 6.02 y 5.09, creo que en esta situación, el bateador se consideraría golpeado por el lanzamiento y sería elegible para pasar a primera base, si todavía existiera.
So this is the kind of question I answer, and I get people writing in with a lot of other strange questions. I've had someone write and say, scientifically speaking, what is the best and fastest way to hide a body? Can you do this one soon? And I had someone write in, I've had people write in about, can you prove whether or not you can find love again after your heart's broken? And I've had people send in what are clearly homework questions they're trying to get me to do for them.
Este es el tipo de preguntas que respondo, y consigo gente que escribe muchas otras preguntas raras. Alguien escribió y dijo: Científicamente hablando, ¿cuál es la mejor y más rápida forma de esconder un cuerpo? ¿Podrías contestarla pronto? Y alguien me escribió, he tenido gente escribiéndome, ¿Puedes probar si puedes o no encontrar nuevamente el amor después de un corazón roto? Y han enviado preguntas claramente de la tarea escolar que quieren que conteste por ellos.
But one week, a couple months ago, I got a question that was actually about Google. If all digital data in the world were stored on punch cards, how big would Google's data warehouse be? Now, Google's pretty secretive about their operations, so no one really knows how much data Google has, and in fact, no one really knows how many data centers Google has, except people at Google itself. And I've tried, I've met them a few times, tried asking them, and they aren't revealing anything.
Pero una semana, hace un par de meses, recibí una pregunta acerca de Google. Si todos los datos del mundo estuvieran en tarjetas perforadas, ¿qué tan grande sería el almacén de datos de Google? Ahora, Google es bastante reservado sobre sus operaciones, así que nadie sabe realmente la cantidad de datos que tiene, y de hecho, nadie sabe realmente cuántos centros de datos tiene, excepto las personas en el propio Google. Y lo he intentado, los he visto un par de veces, intenté preguntarles, y no revelan nada.
So I decided to try to figure this out myself. There are a few things that I looked at here. I started with money. Google has to reveal how much they spend, in general, and that lets you put some caps on how many data centers could they be building, because a big data center costs a certain amount of money. And you can also then put a cap on how much of the world hard drive market are they taking up, which turns out, it's pretty sizable. I read a calculation at one point, I think Google has a drive failure about every minute or two, and they just throw out the hard drive and swap in a new one. So they go through a huge number of them. And so by looking at money, you can get an idea of how many of these centers they have. You can also look at power. You can look at how much electricity they need, because you need a certain amount of electricity to run the servers, and Google is more efficient than most, but they still have some basic requirements, and that lets you put a limit on the number of servers that they have. You can also look at square footage and see of the data centers that you know, how big are they? How much room is that? How many server racks could you fit in there? And for some data centers, you might get two of these pieces of information. You know how much they spent, and they also, say, because they had to contract with the local government to get the power provided, you might know what they made a deal to buy, so you know how much power it takes. Then you can look at the ratios of those numbers, and figure out for a data center where you don't have that information, you can figure out, but maybe you only have one of those, you know the square footage, then you could figure out well, maybe the power is proportional. And you can do this same thing with a lot of different quantities, you know, with guesses about the total amount of storage, the number of servers, the number of drives per server, and in each case using what you know to come up with a model that narrows down your guesses for the things that you don't know. It's sort of circling around the number you're trying to get. And this is a lot of fun. The math is not all that advanced, and really it's like nothing more than solving a sudoku puzzle.
Así que decidí tratar de resolver esto yo mismo. Hay algunas cosas que miré. Empecé con el dinero. Google tiene que revelar cuánto gasta, en general, y eso permite establecer la cantidad de centros de datos que podrían estar construyendo, ya que un gran centro de datos cuesta cierto dinero. Y también se puede poner un límite a qué tanto del mercado mundial de discos duros están tomando que resulta ser bastante considerable. Leí un cálculo en un momento, creo que Google tiene una falla de disco cada minuto o dos, y sencillamente desechan el disco duro y lo cambian por uno nuevo. Así que tiran un gran número de ellos. Y así, al ver el dinero, se puede tener una idea de cuántos de estos centros tienen. También se puede considerar la energía. Se puede ver cuánta electricidad necesitan, dado que los servidores necesitan cierta cantidad para funcionar, y Google es más eficiente que la mayoría, pero todavía tienen algunos requerimientos básicos, y eso permite establecer un margen en el número de servidores que tienen. También se pueden buscar los metros cuadrados y ver de los centros de datos que conoces, ¿qué tan grandes son? ¿Cuánto espacio es eso? ¿Cuántos servidores podrías encajar allí? Y para algunos centros de datos, se podrían conseguir dos de esas piezas de información. Se sabe cuánto gastaron, y también, por ejemplo, dado que tenían que contratar con el gobierno local para obtener la potencia suministrada, se podría saber que hicieron un trato para comprar, así que se sabe la energía que usan. Entonces se puede ver las proporciones de esos números, y averiguar para un centro de datos en la que no se tiene esa información, averiguar, pero tal vez solo se tenga uno de esos, digamos los metros cuadrados, entonces se puede averiguar bueno, tal vez la potencia es proporcional. Se puede hacer lo mismo con diferentes cantidades, con conjeturas de la cantidad total de almacenamiento, el número de servidores, el número de unidades por servidor, y en cada caso usando lo que se sabe para llegar a un modelo que reduzca las conjeturas sobre las cosas que no se saben. Es como girar en torno al número al que se quiere llegar. Y es muy divertido. La matemática no es tan avanzada, y realmente es nada más que como resolver un sudoku.
So what I did, I went through all of this information, spent a day or two researching. And there are some things I didn't look at. You could always look at the Google recruitment messages that they post. That gives you an idea of where they have people. Sometimes, when people visit a data center, they'll take a cell-cam photo and post it, and they aren't supposed to, but you can learn things about their hardware that way. And in fact, you can just look at pizza delivery drivers. Turns out, they know where all the Google data centers are, at least the ones that have people in them.
Así que eso hice, con toda esta información, pasé un día o dos investigando. Hay un par de cosas que no consideré. Siempre se pueden ver los mensajes de reclutamiento que Google publica. Eso da una idea de dónde tienen personal. A veces, cuando la gente los visita, toma fotografías y las publica, y se supone que no deberían de hacerlo, pero así se puede aprender cosas sobre su hardware. Y, de hecho, se pueden examinar los repartidores de pizza. Resulta que ellos saben dónde están todos los centros de datos de Google, al menos los que tienen personas en ellos.
But I came up with my estimate, which I felt pretty good about, that was about 10 exabytes of data across all of Google's operations, and then another maybe five exabytes or so of offline storage in tape drives, which it turns out Google is about the world's largest consumer of.
Pero presenté mi estimación, con la que me sentía muy bien, que había unos 10 exabytes de datos en todas las operaciones de Google, y luego otros quizás 5 exabytes o así de almacenamiento fuera de línea en cinta, donde resulta que Google es el consumidor más grande del mundo.
So I came up with this estimate, and this is a staggering amount of data. It's quite a bit more than any other organization in the world has, as far as we know. There's a couple of other contenders, especially everyone always thinks of the NSA. But using some of these same methods, we can look at the NSA's data centers, and figure out, you know, we don't know what's going on there, but it's pretty clear that their operation is not the size of Google's.
Así que presenté esta estimación, y esta es una cantidad asombrosa de datos. Es bastante más de lo que cualquier otra organización tiene en el mundo, hasta donde sabemos. Hay un par de competidores, especialmente todo el mundo siempre piensa en la NSA. Pero usando estos mismos métodos, podemos mirar a los centros de datos de la NSA, y deducir, ya saben, no sabemos lo que pasa allí, pero está bastante claro que su funcionamiento no es del tamaño de Google.
Adding all of this up, I came up with the other thing that we can answer, which is, how many punch cards would this take? And so a punch card can hold about 80 characters, and you can fit about 2,000 or so cards into a box, and you put them in, say, my home region of New England, it would cover the entire region up to a depth of a little less than five kilometers, which is about three times deeper than the glaciers during the last ice age about 20,000 years ago.
Sumando todo, propuse la otra cosa que podemos responder, que es, ¿cuántas tarjetas perforadas se necesitarían? Una tarjeta perforada puede contener alrededor de 80 caracteres, y pueden caber alrededor de más o menos 2000 tarjetas en una caja, y se ponen en, digamos, mi tierra natal, Nueva Inglaterra, cubriría la región por completo hasta una profundidad de un poco menos de cinco kilómetros, casi 3 veces más profundo que los glaciares durante la última era de hielo hace unos 20 000 años.
So this is impractical, but I think that's about the best answer I could come up with. And I posted it on my website. I wrote it up. And I didn't expect to get an answer from Google, because of course they've been so secretive, they didn't answer of my questions, and so I just put it up and said, well, I guess we'll never know.
Esto es poco práctico, pero creo esa es la mejor respuesta que podía dar. Y la publiqué en mi sitio web. Escribí al respecto. Y no esperaba una respuesta de Google, porque han sido tan reservados, no respondieron a mis preguntas, y así que solo lo puse y dije, bueno, supongo que nunca lo sabremos.
But then a little while later I got a message, a couple weeks later, from Google, saying, hey, someone here has an envelope for you. So I go and get it, open it up, and it's punch cards. (Laughter) Google-branded punch cards. And on these punch cards, there are a bunch of holes, and I said, thank you, thank you, okay, so what's on here? So I get some software and start reading it, and scan them, and it turns out it's a puzzle. There's a bunch of code, and I get some friends to help, and we crack the code, and then inside that is another code, and then there are some equations, and then we solve those equations, and then finally out pops a message from Google which is their official answer to my article, and it said, "No comment." (Laughter) (Applause)
Pero un poco más tarde recibí un mensaje de Google, diciendo, ey, alguien aquí tiene un sobre para usted. Así que voy por él, lo abro, y son tarjetas perforadas. (Risas) Tarjetas perforadas marca Google. Y en esas tarjetas perforadas, hay una serie de agujeros, y dije, gracias, gracias, bien, ¿qué hay aquí? Conseguí un software y empecé a leerlas, y analizarlas, y resulta que es un rompecabezas. Hay un montón de código, pedí ayuda a unos amigos, desciframos el código, y luego había otro código dentro, y luego algunas ecuaciones, resolvimos esas ecuaciones, finalmente, aparece un mensaje de Google que es su respuesta oficial a mi artículo, y decía, "Sin comentarios". (Risas) (Aplausos)
And I love calculating these kinds of things, and it's not that I love doing the math. I do a lot of math, but I don't really like math for its own sake. What I love is that it lets you take some things that you know, and just by moving symbols around on a piece of paper, find out something that you didn't know that's very surprising. And I have a lot of stupid questions, and I love that math gives the power to answer them sometimes.
Me encanta calcular este tipo de cosas, y no es que me encante hacer cálculos. Hago mucho de matemáticas, pero no me gustan mucho en sí mismas. Lo que me gusta es que te permiten tomar algunas cosas que sabes, y solo con mover símbolos sobre un pedazo de papel, encontrar algo que no sabías que es sorprendente. Recibo muchas preguntas estúpidas, y me encanta que las matemáticas tengan el poder para responderlas algunas veces.
And sometimes not. This is a question I got from a reader, an anonymous reader, and the subject line just said, "Urgent," and this was the entire email: "If people had wheels and could fly, how would we differentiate them from airplanes?" Urgent. (Laughter)
Y algunas veces no. Esta es una pregunta de un lector, un lector anónimo, y el asunto decía, "Urgente", y este fue todo el email: "Si la gente tuviera ruedas y pudiera volar, ¿cómo nos diferenciaríamos de los aviones?" Urgente. (Risas)
And I think there are some questions that math just cannot answer. Thank you. (Applause)
Pienso que hay algunas preguntas que las matemáticas simplemente no pueden responder. Gracias. (Aplausos)