So, I have a feature on my website where every week people submit hypothetical questions for me to answer, and I try to answer them using math, science and comics.
제 웹사이트에는 매주 사람들이 가정적인 질문을 던지면 그에 대해 제가 대답하는 코너가 있습니다. 저는 수학이나 과학, 그리고 만화를 써서 답변을 합니다.
So for example, one person asked, what would happen if you tried to hit a baseball pitched at 90 percent of the speed of light? So I did some calculations. Now, normally, when an object flies through the air, the air will flow around the object, but in this case, the ball would be going so fast that the air molecules wouldn't have time to move out of the way. The ball would smash right into and through them, and the collisions with these air molecules would knock away the nitrogen, carbon and hydrogen from the ball, fragmenting it off into tiny particles, and also triggering waves of thermonuclear fusion in the air around it. This would result in a flood of x-rays that would spread out in a bubble along with exotic particles, plasma inside, centered on the pitcher's mound, and that would move away from the pitcher's mound slightly faster than the ball. Now at this point, about 30 nanoseconds in, the home plate is far enough away that light hasn't had time to reach it, which means the batter still sees the pitcher about to throw and has no idea that anything is wrong. (Laughter) Now, after 70 nanoseconds, the ball will reach home plate, or at least the cloud of expanding plasma that used to be the ball, and it will engulf the bat and the batter and the plate and the catcher and the umpire and start disintegrating them all as it also starts to carry them backward through the backstop, which also starts to disintegrate. So if you were watching this whole thing from a hill, ideally, far away, what you'd see is a bright flash of light that would fade over a few seconds, followed by a blast wave spreading out, shredding trees and houses as it moves away from the stadium, and then eventually a mushroom cloud rising up over the ruined city. (Laughter)
예를 들어, 누군가 이렇게 묻습니다. 빛의 속도에 90%나 되는 속도로 날아오는 야구공을 치려고 하면 어떻게 될까요? 제가 계산을 좀 해봤죠. 보통 물체가 공기 중에서 날아가면 공기가 그 주위 비껴 흐르지만 이 경우에는 공이 너무 빨리 날아가서 공기 입자가 길을 비켜줄 시간이 없을 겁니다. 공이 공기 입자를 바로 때려 발생하는 충돌로 인해 나트륨이나 탄소, 수소와 같은 분자에 충격이 가해져 이런 것들은 아주 작은 입자로 산산조각이 날 겁니다. 그 결과, 공 주변의 공기층에서는 열핵융합의 물결이 일어날 거예요. 그것은 다시 일련의 X선을 발생시켜 다른 입자와 뭉쳐 방울과 같은 형태로 퍼져나갈 것입니다. 방울의 내부는 플라스마로 채워지는데 투수 판에 몰려있던 것이죠. 그것은 공보다 약간 더 빠르게 투수판으로 부터 멀어질 겁니다. 약 30나노초가 지난 시점에 홈 플레이트는 충분히 멀리 있어서 아직 빛이 도달하지 못했을 겁니다. 그것은 바로, 타자가 투수가 이제 막 공을 던지려는 순간을 보고 있다는 것인데 아직 별 문제는 없어요. (웃음) 70나노초가 지나면 공이 홈플레이트에 다다릅니다. 아니면 적어도 공의 일부였던 플라스마의 구름이 넓어지며 다다르겠죠. 플라스마는 타자와 방망이 뿐 만 아니라 플레이트와 포수, 심판까지 집어삼켜 이들 모두를 분해하기 시작합니다. 동시에 이들을 관중석으로 옮겨 놓습니다. 그러면 관중석도 분해되죠. 이런 과정 전체를 언덕 위에서 보면, 이상적으로는, 멀리서, 여러분이 볼 수 있는 것은 밝은 섬광일 뿐인데 이것도 몇초만에 사라지고 그 뒤로 그 폭발의 잔해가 퍼져나갈 겁니다. 그 결과 나무나 집들도 관중석처럼 날려버리고 종국에는 버섯 구름이 폐허의 도시 위로 피어오르겠죠. (웃음)
So the Major League Baseball rules are a little bit hazy, but — (Laughter) — under rule 6.02 and 5.09, I think that in this situation, the batter would be considered hit by pitch and would be eligible to take first base, if it still existed.
그래서 메이져 리그 야구의 규칙은 약간 불분명합니다. 하지만 --(웃음)-- 규정 6.02와 5.09에 의하면 이런 경우에는 타자가 사구를 맞은 것으로 보고 1루로 진출할 수 있을 겁니다. 1루가 여전히 남아 있다면요.
So this is the kind of question I answer, and I get people writing in with a lot of other strange questions. I've had someone write and say, scientifically speaking, what is the best and fastest way to hide a body? Can you do this one soon? And I had someone write in, I've had people write in about, can you prove whether or not you can find love again after your heart's broken? And I've had people send in what are clearly homework questions they're trying to get me to do for them.
제 대답이란게 주로 이런 식이에요. 저는 사람들에게 이상한 질문을 많이 하도록 합니다. 어떤 사람은 이렇게 쓴 경우도 있어요. 과학적으로 볼 때, 몸을 가장 완벽하고 빠르게 숨길 수 있는 방법은 무엇인가요? 였어요. 빨리 답하실 수 있으세요? 어떤 분이 이렇게 쓰셨던데, 이런 질문을 하는 분도 계세요. 실연을 당한 후에, 다시 사랑할 수 있는지 없는지 증명할 수 있습니까? 이런 질문을 하는 분도 계시죠. 이건 분명히 학교 숙제 문제인데 제가 대신 해주기를 바라는거죠.
But one week, a couple months ago, I got a question that was actually about Google. If all digital data in the world were stored on punch cards, how big would Google's data warehouse be? Now, Google's pretty secretive about their operations, so no one really knows how much data Google has, and in fact, no one really knows how many data centers Google has, except people at Google itself. And I've tried, I've met them a few times, tried asking them, and they aren't revealing anything.
그런데 몇 달전 어느 날, 저는 구글에 대한 질문을 받았어요. 새상에 있는 숫자로 된 정보를 모두 천공 카드에 저장하면 구글의 자료 보관소가 얼마나 커야하죠? 라는 질문이었습니다. 이 부분은 상당히 비밀스런 내용이어서 사실 구글이 얼마나 많은 정보를 보유하고 있는지 아무도 모릅니다. 사실, 구글이 정보 보관소 몇군데나 있는지 아무도 정확하게 알지 못해요. 구글에 있는 사람들 말고는요. 제가 그런 시도를 하면서 몇 사람을 만나 물어봤지만 아무 것도 알려주지 않았습니다.
So I decided to try to figure this out myself. There are a few things that I looked at here. I started with money. Google has to reveal how much they spend, in general, and that lets you put some caps on how many data centers could they be building, because a big data center costs a certain amount of money. And you can also then put a cap on how much of the world hard drive market are they taking up, which turns out, it's pretty sizable. I read a calculation at one point, I think Google has a drive failure about every minute or two, and they just throw out the hard drive and swap in a new one. So they go through a huge number of them. And so by looking at money, you can get an idea of how many of these centers they have. You can also look at power. You can look at how much electricity they need, because you need a certain amount of electricity to run the servers, and Google is more efficient than most, but they still have some basic requirements, and that lets you put a limit on the number of servers that they have. You can also look at square footage and see of the data centers that you know, how big are they? How much room is that? How many server racks could you fit in there? And for some data centers, you might get two of these pieces of information. You know how much they spent, and they also, say, because they had to contract with the local government to get the power provided, you might know what they made a deal to buy, so you know how much power it takes. Then you can look at the ratios of those numbers, and figure out for a data center where you don't have that information, you can figure out, but maybe you only have one of those, you know the square footage, then you could figure out well, maybe the power is proportional. And you can do this same thing with a lot of different quantities, you know, with guesses about the total amount of storage, the number of servers, the number of drives per server, and in each case using what you know to come up with a model that narrows down your guesses for the things that you don't know. It's sort of circling around the number you're trying to get. And this is a lot of fun. The math is not all that advanced, and really it's like nothing more than solving a sudoku puzzle.
그래서 제 스스로 생각해보기로 했죠. 여기서 제가 눈여겨 본게 몇가지 있습니다. 저는 돈으로 먼저 생각해봤는데요. 구글이 보통 얼마나 돈을 지출했는지 밝힐 수 밖에 없거든요. 그러면 그 돈으로 자료 보관소를 몇 개나 지을 수 있을지 생각해 볼 수 있습니다. 왜냐하면 대형 자료 보관소를 짓는 데 상당한 돈이 들거든요. 게다가 하드 드라이브 시장에서 구글이 차지하는 최대 추정치를 만들어 볼 수도 있죠. 나타난 바로는 이게 상당히 큰 값입니다. 언젠가는 어떤 계산도 봤는데요. 구들은 1~2분 마다 하드 드리이브에 고장이 납니다. 그러면 그걸 그냥 내버리고 새 것으로 교체하죠. 그러니 상당히 많은 하드 드라이브를 사용하게 됩니다. 돈의 규모로만 보면 이런 자료 보관소가 몇개나 있는지 대충 짐작할 수 있죠. 전기 사용량으로 볼 수도 있습니다. 구글에서 사용하는 전력량을 알아볼 수 있죠. 서버를 운영하려면 일정량의 전기가 필요하니까요. 구글은 다른 어떤 회사보다 효율이 좋지만 여전히 기본적인 사용량은 있게 마련이니까요. 그래서 숫자를 보면 구글이 보유할 수 있는 서버의 숫자를 가늠할 수 있습니다. 사용하는 토지의 넓이를 보고 자료 보관소가 얼마나 큰지 가늠해 볼 수도 있습니다. 공간은 얼마나 확보가 되는지, 그 안에 서버를 몇개나 설치할 수 있는지를 보는거죠. 어떤 자료 보관소에는 이런 정보 더미를 두 개씩 두었을수도 있어요. 예산을 얼마나 쓰는지 알고 있거든요. 전력을 공급 받으려면 지방 정부와 계약을 맺어야 하고 또 구매 계약 규모가 얼마나 큰지 알 수 있으니까 전력이 얼마나 필요할지 알 수 있겠죠. 그 다음에는 이런 숫자들의 비율을 보고 자료 보관소에 대한 숫자를 알아낼 수 있는거죠. 자료 보관소에 대한 정보가 없어도 추측해낼 수 있습니다. 하지만 어디까지 추정값이에요. 부지의 넓이를 아니까 전력량은 아마 비례하겠지요. 여러 가지 자료를 가지고 그런 계산을 거치면 전체 보관량을 추정해 낼 수 있습니다. 서버의 숫자라든가, 서버당 사용하는 드라이브의 수도 추정이 가능해서, 알고 있는 자료를 사용하면 알 수 없던 것에 대한 추정값을 좁힐 수 있고 그것으로 모델을 알아 낼 수 있어요. 거의 얻어내려는 숫자에 거의 근접합니다. 이건 상당히 재미있어요. 여기 사용하는 수학은 그리 어려운 것이 아니고 실제로 수도쿠 문제 정도입니다.
So what I did, I went through all of this information, spent a day or two researching. And there are some things I didn't look at. You could always look at the Google recruitment messages that they post. That gives you an idea of where they have people. Sometimes, when people visit a data center, they'll take a cell-cam photo and post it, and they aren't supposed to, but you can learn things about their hardware that way. And in fact, you can just look at pizza delivery drivers. Turns out, they know where all the Google data centers are, at least the ones that have people in them.
제가 한 일은 이런 모든 정보를 가지고 하루 이틀 정도 리서치를 하는 겁니다. 또, 제가 들여다 보지 않은 몇가지가 있는데요. 언제든 구글이 내놓은 구인 광고를 볼 수도 있어요. 그걸보면 그들의 인적 자원이 어느 정도 되는지 알 수 있죠. 어떤 경우에는, 자료 보관소를 방문하는 사람이 있는데 원래는 그러면 안돼지만 그 사람들이 휴대 전화로 사진을 찍어 올리면 구글의 하드웨어에 대해 알아낼 수도 있습니다. 사실은 피자 배달원만 알아봐도 됩니다. 사실 그들은 구글의 자료 보관소가 어디에 있는지 알아요. 최소한 그 안에 있는 사람들은 알고 있죠.
But I came up with my estimate, which I felt pretty good about, that was about 10 exabytes of data across all of Google's operations, and then another maybe five exabytes or so of offline storage in tape drives, which it turns out Google is about the world's largest consumer of.
어쨌든 제가 추측이 도달한 바로는, 사실 전 그 숫자에 대해 자신감이 있는데요, 구글 전체를 볼 때, 약 10 엑사바이트의 자료를 보유하고 있습니다. 거기에다 약 5 엑사바이트 정도의 오프라인 자료를 테잎에 저장해 두었을 겁니다. 사실 구글은 테잎 저장 장치 시장에서 최고의 고객임이 알려져 있어요.
So I came up with this estimate, and this is a staggering amount of data. It's quite a bit more than any other organization in the world has, as far as we know. There's a couple of other contenders, especially everyone always thinks of the NSA. But using some of these same methods, we can look at the NSA's data centers, and figure out, you know, we don't know what's going on there, but it's pretty clear that their operation is not the size of Google's.
그래서 제가 얻어낸 추측으로 이건 정말 엄청난 양의 자료입니다. 이것은 제가 아는 한 지구상의 다른 어떤 단체보다 더 많은 양을 가지도 있는거죠. 두어개 정도 대적할만한 곳이 있긴한데, 아마 누구나 NSA 를 떠 올리겠죠. 하지만 비숫한 방법을 써서 NSA 자료 센터를 볼 수도 있는데 추산으로 정확하게 알 수는 없지만 제가 가진 확인은 NSA 가 보유한 자료의 양은 구글에 미치지 못합니다.
Adding all of this up, I came up with the other thing that we can answer, which is, how many punch cards would this take? And so a punch card can hold about 80 characters, and you can fit about 2,000 or so cards into a box, and you put them in, say, my home region of New England, it would cover the entire region up to a depth of a little less than five kilometers, which is about three times deeper than the glaciers during the last ice age about 20,000 years ago.
이런 모든 사실을 종합하여 저는 우리가 답할 수 있는 또 다른 사실을 이끌어냈습니다. 이 정보를 천공 카드에 담으려면 몇 장이나 필요할까라는거죠. 천공 카드에는 약 80자를 기록할 수 있습니다. 그리고 한 상자에는 약 2,000장의 카드가 들어갑니다. 그 상자들을 예를 들어, 제 고향인 뉴잉글랜드 지역에 쌓으면 전체 지역을 다 차지할 겁니다. 높이를 약 5km 정도로 해도 말이죠. 이런 높이는 약 2만 년전 마지막 빙하기에 쌓였던 빙하 두께의 약 3배가 됩니다.
So this is impractical, but I think that's about the best answer I could come up with. And I posted it on my website. I wrote it up. And I didn't expect to get an answer from Google, because of course they've been so secretive, they didn't answer of my questions, and so I just put it up and said, well, I guess we'll never know.
현실성이 없는 이야기지만 제가 표현할 수 있는 최상의 대답입니다. 이런 사실을 제 웹사이트에 썼습니다. 저는 구글에서 어떤 반응이 있으리라고 기대도 하지 않았습니다. 왜냐하면 그들은 이런 것들에 대해 상당히 비밀스러워해서 제 질문에 대답도 하지 않았으니까요. 그래서 저는 이걸 게시해놓고 누가 알겠어?라는 생각을 했어요.
But then a little while later I got a message, a couple weeks later, from Google, saying, hey, someone here has an envelope for you. So I go and get it, open it up, and it's punch cards. (Laughter) Google-branded punch cards. And on these punch cards, there are a bunch of holes, and I said, thank you, thank you, okay, so what's on here? So I get some software and start reading it, and scan them, and it turns out it's a puzzle. There's a bunch of code, and I get some friends to help, and we crack the code, and then inside that is another code, and then there are some equations, and then we solve those equations, and then finally out pops a message from Google which is their official answer to my article, and it said, "No comment." (Laughter) (Applause)
그런데 얼마의 시간이 지나고나서 2주쯤 후엔가 구글로부터 메시지를 받았습니다. "당신에게 연락드릴게 있습니다." 라고요. 연락온 봉투를 받아 열어보니 천공 카드였어요. (웃음) 구글 이름으로 제품화된 천공 카드였죠. 천공 카드에는 구멍이 많이 나 있습니다. 저는 고맙다고 했죠. 그런데 거기에 뭐가 있었을까요? 뭔가 소프트웨어가 있었고 저는 그걸 읽어내려갔습니다. 스캔을 해보니 그것은 수수께끼였어요. 수많은 코드가 적혀있어서 친구들에게 도움을 청했죠. 코드를 풀자 그안에는 또 다른 코드가 있었습니다. 방정식도 몇개 있었는데 그걸 풀어보니 마침내 구글에서 보내준 메시지가 들어있었습니다. 그것은 바로 제 글에 대한 구글의 공식적인 답변이었습니다. 뭐라고 했냐하면 "의견없음(노 코멘트)" (웃음) (박수)
And I love calculating these kinds of things, and it's not that I love doing the math. I do a lot of math, but I don't really like math for its own sake. What I love is that it lets you take some things that you know, and just by moving symbols around on a piece of paper, find out something that you didn't know that's very surprising. And I have a lot of stupid questions, and I love that math gives the power to answer them sometimes.
저는 이런 걸 계산하기 아주 좋아합니다. 제가 수학을 좋아해서가 아니라 수학을 많이 하기는 하지만 수학을 위한 수학은 별로 좋아하지 않거든요. 제가 좋아하는 것은 수학을 이용하면 뭔가 알아낼 수 있다는 겁니다. 종이 위에서 기호 몇개만 움직여보면 모르던 것을 알아낼 수 있잖아요. 그런건 의외의 것이죠. 제게는 우스꽝스런 의문이 많은데 수학은 이따금 그런 의문에 답할 수 있는 능력을 가져다 줍니다.
And sometimes not. This is a question I got from a reader, an anonymous reader, and the subject line just said, "Urgent," and this was the entire email: "If people had wheels and could fly, how would we differentiate them from airplanes?" Urgent. (Laughter)
그러지 못할 때도 있지만요. 이건 제 독자로 부터 받은 질문인데요. 익명의 독자예요. 제목에는 "급함"이라고 쓰여있었어요. 이게 메일의 전부인데요. "사람도 날개있어서 날 수 있다면 사람과 비행기를 어떻게 구별할까요?" 급합니다. (웃음)
And I think there are some questions that math just cannot answer. Thank you. (Applause)
수학이 답할 수 없는 질문들이 있습니다. 감사합니다. (박수)