So, I have a feature on my website where every week people submit hypothetical questions for me to answer, and I try to answer them using math, science and comics.
Alors, chaque semaine sur mon site web on peut poser des questions hypothétiques auxquelles je réponds, à l'aide des maths, de la science et de dessins.
So for example, one person asked, what would happen if you tried to hit a baseball pitched at 90 percent of the speed of light? So I did some calculations. Now, normally, when an object flies through the air, the air will flow around the object, but in this case, the ball would be going so fast that the air molecules wouldn't have time to move out of the way. The ball would smash right into and through them, and the collisions with these air molecules would knock away the nitrogen, carbon and hydrogen from the ball, fragmenting it off into tiny particles, and also triggering waves of thermonuclear fusion in the air around it. This would result in a flood of x-rays that would spread out in a bubble along with exotic particles, plasma inside, centered on the pitcher's mound, and that would move away from the pitcher's mound slightly faster than the ball. Now at this point, about 30 nanoseconds in, the home plate is far enough away that light hasn't had time to reach it, which means the batter still sees the pitcher about to throw and has no idea that anything is wrong. (Laughter) Now, after 70 nanoseconds, the ball will reach home plate, or at least the cloud of expanding plasma that used to be the ball, and it will engulf the bat and the batter and the plate and the catcher and the umpire and start disintegrating them all as it also starts to carry them backward through the backstop, which also starts to disintegrate. So if you were watching this whole thing from a hill, ideally, far away, what you'd see is a bright flash of light that would fade over a few seconds, followed by a blast wave spreading out, shredding trees and houses as it moves away from the stadium, and then eventually a mushroom cloud rising up over the ruined city. (Laughter)
Par exemple, une personne m'a demandé : Que se passerait-t-il si je frappais une balle de baseball à 90% de la vitesse lumière ? Alors j'ai fais des calculs. Normalement, lorsqu'un objet vole dans les airs, l'air « coule » autour de l'objet, dans ce cas-là, la balle irait tellement vite que les molécules de l'air n'auraient pas le temps de lui faire place. Elle s'y écraserait directement, et les collisions avec ces molécules lui arracheraient le nitrogène, carbone et hydrogène, les fragmenteraient en toutes petites particules, créant des vagues de fusion thermonucléaire dans l'air alentour. Résultat, un flot de rayons X s'étendrait formant une bulle avec des particules exotiques, du plasma à l'intérieur, le tout autour du lanceur, et qui s'éloignerait du lanceur un peu plus vite que la balle. A ce moment-là, après environ 30 nanosecondes, le marbre est assez loin, la lumière n'a pas eu le temps de l'atteindre, ce qui signifie que le batteur voit toujours le lanceur sur le point de tirer et n'imagine pas qu'il y a un problème. (Rires) Après 70 nanosecondes, la balle atteint le marbre, ou en tout cas le nuage croissant de plasma qui était la balle avant, et engloutit la batte et le batteur et le terrain et l'attrapeur et l'arbitre et commence à désintégrer le tout et les fait reculer à travers la limite du terrain qui est désintégrée aussi. Donc si vous regardiez le résultat, depuis une colline, idéalement très lointaine, vous verriez un flash de lumière qui pâlirait en quelques secondes, suivi par une vague explosive qui soufflerait les arbres et les maisons en s'éloignant du stade, finalement un nuage en forme de champignon s'élèverait au dessus de la ville en ruines.
So the Major League Baseball rules are a little bit hazy, but — (Laughter) — under rule 6.02 and 5.09, I think that in this situation, the batter would be considered hit by pitch and would be eligible to take first base, if it still existed.
Les règles de la ligue de baseball américaine sont un peu vagues. mais - (Rires) - d'après le règlement 6.02 et 5.09, je crois que dans cette situation le batteur serait considéré comme touché par le lanceur et pourrait prétendre à prendre la première base, si elle existait toujours.
So this is the kind of question I answer, and I get people writing in with a lot of other strange questions. I've had someone write and say, scientifically speaking, what is the best and fastest way to hide a body? Can you do this one soon? And I had someone write in, I've had people write in about, can you prove whether or not you can find love again after your heart's broken? And I've had people send in what are clearly homework questions they're trying to get me to do for them.
Voilà le genre de questions auxquelles je réponds, et je reçois des tas de questions souvent étonnantes. Certains écrivent pour me demander : du point de vue scientifique, quel est le meilleur et plus rapide moyen de cacher un corps ? Peux-tu me répondre rapidement ? Ou encore : Peux-tu prouver qu'on peut retrouver l'amour après un cœur brisé ? D'autres m'ont envoyé des questions qui étaient clairement des devoirs qu'ils essayaient de me faire faire à leur place.
But one week, a couple months ago, I got a question that was actually about Google. If all digital data in the world were stored on punch cards, how big would Google's data warehouse be? Now, Google's pretty secretive about their operations, so no one really knows how much data Google has, and in fact, no one really knows how many data centers Google has, except people at Google itself. And I've tried, I've met them a few times, tried asking them, and they aren't revealing anything.
Mais un jour, il y a quelques mois, j'ai reçu une question à propos de Google : Si toutes données numériques étaient sauvegardées sur des cartes perforées, de quelle taille serait l'entrepôt de Google ? Bon, Google est plutôt discret sur ses opérations, donc personne ne sait vraiment quelle quantité de données ni combien de centres de traitement des données il a, sauf le personnel de Google lui-même. J'ai donc essayé de les rencontrer, pour leur demander, mais ils ne lâchent rien.
So I decided to try to figure this out myself. There are a few things that I looked at here. I started with money. Google has to reveal how much they spend, in general, and that lets you put some caps on how many data centers could they be building, because a big data center costs a certain amount of money. And you can also then put a cap on how much of the world hard drive market are they taking up, which turns out, it's pretty sizable. I read a calculation at one point, I think Google has a drive failure about every minute or two, and they just throw out the hard drive and swap in a new one. So they go through a huge number of them. And so by looking at money, you can get an idea of how many of these centers they have. You can also look at power. You can look at how much electricity they need, because you need a certain amount of electricity to run the servers, and Google is more efficient than most, but they still have some basic requirements, and that lets you put a limit on the number of servers that they have. You can also look at square footage and see of the data centers that you know, how big are they? How much room is that? How many server racks could you fit in there? And for some data centers, you might get two of these pieces of information. You know how much they spent, and they also, say, because they had to contract with the local government to get the power provided, you might know what they made a deal to buy, so you know how much power it takes. Then you can look at the ratios of those numbers, and figure out for a data center where you don't have that information, you can figure out, but maybe you only have one of those, you know the square footage, then you could figure out well, maybe the power is proportional. And you can do this same thing with a lot of different quantities, you know, with guesses about the total amount of storage, the number of servers, the number of drives per server, and in each case using what you know to come up with a model that narrows down your guesses for the things that you don't know. It's sort of circling around the number you're trying to get. And this is a lot of fun. The math is not all that advanced, and really it's like nothing more than solving a sudoku puzzle.
J'ai donc décidé de trouver par moi-même. J'ai étudié un certain nombre de choses. J'ai commencé avec l'argent. Google doit déclarer ses dépenses, et ça nous donne un plafond sur le nombre de centres de traitement des données qu'ils peuvent construire, car ces centres ont un certain coût. On peut également mettre un plafond sur la part de marché qu'ils prennent sur les disques durs, qui est assez impressionnante. J'ai aussi lu un calcul à un moment. Je crois que Google a une faille de disque dur toutes les minutes ou deux, ils le jettent et le remplacent par un nouveau. Ils en utilisent une énorme quantité. Donc en regardant les sommes déclarées, on peut se faire l'idée du nombre de centres qu'ils ont. On peut aussi regarder du côté de l'énergie, De quelle quantité d'électricité ils ont besoin, l'on en a besoin d'une certaine pour faire fonctionner les serveurs. Google est plus efficient que la plupart, mails ils ont des nécessités de base et ça nous donne une limite au nombre de serveurs qu'ils possèdent. On peut aussi se renseigner sur le nombre de mètres carrés, comparer avec ceux que l'on connaît : De quelle taille sont-ils ? Combien de mètres carrés ? Combien d'étages de serveurs à l'intérieur ? Pour certains centres, on peut obtenir deux de ces informations. On sait combien ils dépensent, et comme ils doivent contracter avec le gouvernement local pour l'énergie fournie, on peut aussi savoir s'ils ont négocié un achat et la quantité d'énergie que ça représente. Ensuite, on peut regarder les ratios de ces chiffres, et déterminer pour un centre là où l'information manque mais peut-être que l'on n'a qu'un de ces paramètres, si l'on a le nombre de mètres carrés, l'énergie peut être proportionnelle. On peut appliquer ce procédé à différentes quantités en estimant la capacité de stockage totale, le nombre de serveurs, de disques durs par serveur. On se sert de ce que l'on sait pour formuler un modèle qui affine nos estimations pour ce que l'on ne sait pas. C'est comme tourner autour du chiffre qu'on essaie de trouver Et c'est en fait très amusant. Les maths utilisées ne sont pas si avancées et vraiment ce n'est rien de plus que de résoudre un sudoku.
So what I did, I went through all of this information, spent a day or two researching. And there are some things I didn't look at. You could always look at the Google recruitment messages that they post. That gives you an idea of where they have people. Sometimes, when people visit a data center, they'll take a cell-cam photo and post it, and they aren't supposed to, but you can learn things about their hardware that way. And in fact, you can just look at pizza delivery drivers. Turns out, they know where all the Google data centers are, at least the ones that have people in them.
Donc j'ai cherché toutes ces informations, passé un jour ou deux sur les recherches. Il y a certaines choses que je n'ai pas vérifiées. On peut toujours regarder les avis de recrutement qu'ils publient. Ce qui nous informe sur la localisation de leurs employés. Parfois, en visitant des centres, certains prennent des photos et les postent, bien qu'ils n'y soient pas autorisés, on en apprend des choses sur leur matériel informatique. On peut même juste chercher les livreurs de pizza. Ils savent où tous les centres se trouvent, en tout cas ceux avec du personnel.
But I came up with my estimate, which I felt pretty good about, that was about 10 exabytes of data across all of Google's operations, and then another maybe five exabytes or so of offline storage in tape drives, which it turns out Google is about the world's largest consumer of.
Mais j'ai trouvé mon estimation, qui me semblait pas mal, c'est-à-dire environ 10 exabytes de données à travers l'ensemble des opérations de Google, et puis 5 autres exabytes à peu près pour les stockages hors-ligne sur bandes magnétiques, dont apparemment Google est le plus gros consommateur mondial.
So I came up with this estimate, and this is a staggering amount of data. It's quite a bit more than any other organization in the world has, as far as we know. There's a couple of other contenders, especially everyone always thinks of the NSA. But using some of these same methods, we can look at the NSA's data centers, and figure out, you know, we don't know what's going on there, but it's pretty clear that their operation is not the size of Google's.
Donc j'ai trouvé cette estimation, elle représente une quantité impressionnante de données. un peu plus que n'importe quelle autre organisation, pour ce que l'on en sait. Il y a un ou deux autres concurrents, tout le monde pense à la NSA (Agence Nationale de Sécurité américaine). Avec les méthodes décrites, du côté des centres de traitement des données, on ne sait pas ce qui s'y passe mais il est clair que leurs opérations ne sont pas de la taille de celle de Google.
Adding all of this up, I came up with the other thing that we can answer, which is, how many punch cards would this take? And so a punch card can hold about 80 characters, and you can fit about 2,000 or so cards into a box, and you put them in, say, my home region of New England, it would cover the entire region up to a depth of a little less than five kilometers, which is about three times deeper than the glaciers during the last ice age about 20,000 years ago.
A l'addition, j'ai trouvé l'autre réponse que l'on peut obtenir : combien de cartes perforées ça représente ? Une carte perforée peut contenir environ 80 caractères, et on peut faire rentrer à peu près 2 000 cartes dans une boîte, si on les place, disons, dans ma région natale de Nouvelle-Angleterre, les boîtes recouvreraient la région entière sur une hauteur d'environ 5 kilomètres, ce qui est environ trois fois plus épais que les glaciers du dernier âge glaciaire, il y a 20 000 ans.
So this is impractical, but I think that's about the best answer I could come up with. And I posted it on my website. I wrote it up. And I didn't expect to get an answer from Google, because of course they've been so secretive, they didn't answer of my questions, and so I just put it up and said, well, I guess we'll never know.
C'est un peu difficile à appréhender, mais c'est la meilleure réponse que je peux trouver. Je l'ai postée sur mon site, je l'ai écrite. Je ne m'attendais pas à ce que Google réponde. Évidemment, ils ont été si discrets qu'ils n'ont pas répondu à mes questions, je l'ai donc seulement publiée et commenté : j'imagine qu'on ne le saura jamais.
But then a little while later I got a message, a couple weeks later, from Google, saying, hey, someone here has an envelope for you. So I go and get it, open it up, and it's punch cards. (Laughter) Google-branded punch cards. And on these punch cards, there are a bunch of holes, and I said, thank you, thank you, okay, so what's on here? So I get some software and start reading it, and scan them, and it turns out it's a puzzle. There's a bunch of code, and I get some friends to help, and we crack the code, and then inside that is another code, and then there are some equations, and then we solve those equations, and then finally out pops a message from Google which is their official answer to my article, and it said, "No comment." (Laughter) (Applause)
Mais peu de temps après, j'ai reçu un message de Google, disant quelqu'un a une enveloppe pour toi. Alors j'y vais, je l'ouvre, et ce sont des cartes perforées. (Rires) Des cartes perforées Google. Et sur ces cartes perforées, il y a des trous, et j'ai dit merci merci. Donc qu'est-ce qu'il se passe ? Je me suis muni d'un logiciel et commencé à les lire, les scanner en fait, c'est un puzzle. Un puzzle de codes, j'appelle des amis pour m'aider, on déchiffre le code, à l'intérieur, un autre code, puis des équations, alors on les résout, finalement sort un message de Google qui est leur réponse officielle à mon article, et qui dit « No comment » (pas de commentaires) (Rires) (Applaudissements)
And I love calculating these kinds of things, and it's not that I love doing the math. I do a lot of math, but I don't really like math for its own sake. What I love is that it lets you take some things that you know, and just by moving symbols around on a piece of paper, find out something that you didn't know that's very surprising. And I have a lot of stupid questions, and I love that math gives the power to answer them sometimes.
J'adore calculer ce genre de choses, ce n'est pas que j'adore les maths, j'en fais beaucoup, mais je n'aime pas les maths que pour les maths. Ce que j'aime, c'est qu'elles te permettent de partir de ce que tu sais en déplaçant simplement des symboles sur un bout de papier trouver quelque chose que tu ne savais pas avant qui te surprend. J'ai beaucoup de questions stupides, j'aime que les maths me donnent le pouvoir de trouver des réponses parfois. Et parfois non.
And sometimes not. This is a question I got from a reader, an anonymous reader, and the subject line just said, "Urgent," and this was the entire email: "If people had wheels and could fly, how would we differentiate them from airplanes?" Urgent. (Laughter)
J'ai reçu cette question d'un lecteur, anonyme, en objet il y avait écrit « Urgent », voici l'e-mail complet : « Si les gens avaient des roues et pouvaient voler, qu'est-ce qui les différencieraient des avions ? » Urgent. (Rires)
And I think there are some questions that math just cannot answer. Thank you. (Applause)
Je suppose qu'il y a des questions pour lesquelles les maths ne peuvent juste rien. Merci. (Applaudissements)