For the next 16 minutes, I'm going to take you on a journey that is probably the biggest dream of humanity: to understand the code of life.
In de volgende 16 minuten zal ik jullie laten kennismaken met wat waarschijnlijk de grootste droom van de mensheid is: de code van het leven begrijpen.
So for me, everything started many, many years ago when I met the first 3D printer. The concept was fascinating. A 3D printer needs three elements: a bit of information, some raw material, some energy, and it can produce any object that was not there before.
Voor mij begon alles heel lang geleden, toen ik kennismaakte met de eerste 3D-printer. Het concept was fascinerend. Een 3D-printer heeft drie dingen nodig: met een beetje informatie, enkele grondstoffen en wat energie kan de printer uit het niets een totaal nieuw object produceren.
I was doing physics, I was coming back home and I realized that I actually always knew a 3D printer. And everyone does. It was my mom.
Ik studeerde fysica en was op weg naar huis toen ik besefte dat ik al heel mijn leven een 3D-printer kende. En iedereen kent er één. Het was mijn ma.
(Laughter)
(Gelach)
My mom takes three elements: a bit of information, which is between my father and my mom in this case, raw elements and energy in the same media, that is food, and after several months, produces me. And I was not existent before.
Mijn ma neemt 3 elementen: een beetje informatie, in dit geval van mijn vader en mijn moeder, grondstoffen en energie onder dezelfde vorm, voedsel, en na enkele maanden produceert ze mij. Daarvoor bestond ik gewoon niet.
So apart from the shock of my mom discovering that she was a 3D printer, I immediately got mesmerized by that piece, the first one, the information. What amount of information does it take to build and assemble a human? Is it much? Is it little? How many thumb drives can you fill?
Dus, afgezien van mijn ma's schok toen ze ontdekte dat ze een 3D-printer is, raakte ik gefascineerd door dat ene onderdeel, het eerste, de informatie. Hoeveel informatie heb je nodig om een mens ineen te knutselen? Is dat veel? Of niet veel? Hoeveel USB-sticks kan je ermee vullen?
Well, I was studying physics at the beginning and I took this approximation of a human as a gigantic Lego piece. So, imagine that the building blocks are little atoms and there is a hydrogen here, a carbon here, a nitrogen here. So in the first approximation, if I can list the number of atoms that compose a human being, I can build it. Now, you can run some numbers and that happens to be quite an astonishing number. So the number of atoms, the file that I will save in my thumb drive to assemble a little baby, will actually fill an entire Titanic of thumb drives -- multiplied 2,000 times. This is the miracle of life. Every time you see from now on a pregnant lady, she's assembling the biggest amount of information that you will ever encounter. Forget big data, forget anything you heard of. This is the biggest amount of information that exists.
Ik was fysica aan het studeren en ik besloot dat de beste invalshoek was de mens als een enorme legoblok te bezien. Beeld je in dat de blokjes kleine atoompjes zijn en dat er hier waterstof is, en hier koolstof, en verder nog stikstof. Mijn eerste inschatting was: als ik de lijst kan opstellen van het aantal atomen dat een mens bevat, dan kan ik er ook één bouwen. Nu kan je beginnen rekenen, en het resultaat is onwaarschijnlijk. Het aantal atomen, de file die ik op mijn USB-stick zal opslaan om een baby in elkaar te steken, zal een hele Titanic vol USB-sticks vullen - vermenigvuldigd met 2000. Dit is het wonder van het leven. Denk eraan elke keer je nu een zwangere vrouw ziet: zij is de grootste hoeveelheid informatie aan het verzamelen die je je kan inbeelden. Vergeet 'big data', vergeet alles wat je ooit gehoord hebt. Dit is de grootste hoeveelheid informatie die er bestaat.
(Applause)
(Applaus)
But nature, fortunately, is much smarter than a young physicist, and in four billion years, managed to pack this information in a small crystal we call DNA. We met it for the first time in 1950 when Rosalind Franklin, an amazing scientist, a woman, took a picture of it. But it took us more than 40 years to finally poke inside a human cell, take out this crystal, unroll it, and read it for the first time. The code comes out to be a fairly simple alphabet, four letters: A, T, C and G. And to build a human, you need three billion of them. Three billion. How many are three billion? It doesn't really make any sense as a number, right?
Gelukkig is de natuur veel slimmer dan een jonge natuurkundige, en is ze er in 4 miljard jaar in geslaagd deze informatie samen te pakken in een klein kristal dat DNA heet. We zagen het voor het eerst in 1950 toen Rosalind Franklin, een ongelooflijke wetenschapper, een vrouw, het vastlegde op foto. Maar we hadden meer dan 40 jaar nodig om in een menselijke cel binnen te geraken, het kristal te isoleren, het af te wikkelen en voor het eerst te lezen. De code die dan verschijnt, is een zeer eenvoudig alfabet met vier letters: A, T, C en G. Om een mens te bouwen, heb je er drie miljard van nodig. Drie miljard. Hoeveel is drie miljard? Het is een getal dat eigenlijk weinig zin heeft.
So I was thinking how I could explain myself better about how big and enormous this code is. But there is -- I mean, I'm going to have some help, and the best person to help me introduce the code is actually the first man to sequence it, Dr. Craig Venter. So welcome onstage, Dr. Craig Venter.
Dus dacht ik: hoe kan ik nu echt duidelijk maken hoe reusachtig groot deze code wel is? Nu heb je wel - ik bedoel ik heb nu wel even hulp nodig. De persoon die mij het best kan helpen om de code voor te stellen, is Dr. Craig Venter, de eerste man die de volgorde ervan heeft bepaald. Welkom, Dr. Craig Venter.
(Applause)
(Applaus)
Not the man in the flesh, but for the first time in history, this is the genome of a specific human, printed page-by-page, letter-by-letter: 262,000 pages of information, 450 kilograms, shipped from the United States to Canada thanks to Bruno Bowden, Lulu.com, a start-up, did everything. It was an amazing feat.
Dit is natuurlijk niet de man in vlees en bloed, maar, voor de eerste keer in de geschiedenis, is het genoom van een bepaald individu uitgeschreven, pagina na pagina, letter na letter: 260.000 bladzijden aan informatie, 450 kilo die van de VS naar Canada verzonden zijn dankzij Bruno Bowden, van start-up Lulu.com. Een geweldige prestatie.
But this is the visual perception of what is the code of life. And now, for the first time, I can do something fun. I can actually poke inside it and read. So let me take an interesting book ... like this one. I have an annotation; it's a fairly big book. So just to let you see what is the code of life. Thousands and thousands and thousands and millions of letters. And they apparently make sense. Let's get to a specific part. Let me read it to you:
Dit is dus de visuele weergave van de code van het leven. En nu kan ik voor de eerste keer iets leuks doen. Ik kan de code nu inkijken en lezen. Nu zal ik eens een interessant boek nemen ... zoals dat hier. Hier is mijn aantekening; het is een enorm boek. Nu kan je echt wel zien wat de code van het leven is. Duizenden en duizenden en duizenden en miljoenen letters. En blijkbaar wil dat allemaal iets zeggen. Laten we eens een fragment nemen. Ik zal het even voorlezen:
(Laughter)
(Gelach)
"AAG, AAT, ATA."
"AAG, AAT, ATA."
To you it sounds like mute letters, but this sequence gives the color of the eyes to Craig. I'll show you another part of the book. This is actually a little more complicated.
Voor jullie zijn dat gewoon zinloze letters, maar deze sequentie bepaalt de kleur van Craigs ogen. Nu een ander fragment van het boek. Dit is wel een beetje moeilijker.
Chromosome 14, book 132:
Chromosoom 14, boek 132:
(Laughter)
(Gelach)
As you might expect.
Dacht ik het niet.
(Laughter)
(Gelach)
"ATT, CTT, GATT."
"ATT, CTT, GATT".
This human is lucky, because if you miss just two letters in this position -- two letters of our three billion -- he will be condemned to a terrible disease: cystic fibrosis. We have no cure for it, we don't know how to solve it, and it's just two letters of difference from what we are.
Deze mens heeft geluk, want als je twee letters te kort schiet in deze combinatie - twee letters van onze drie miljard - dan zal je aan een vreselijke ziekte lijden: taaislijmziekte. Dit is een ongeneeslijke ziekte, daar bestaat geen medicatie voor, en het is een verschil van twee lettertjes ten opzichte van ons.
A wonderful book, a mighty book, a mighty book that helped me understand and show you something quite remarkable. Every one of you -- what makes me, me and you, you -- is just about five million of these, half a book. For the rest, we are all absolutely identical. Five hundred pages is the miracle of life that you are. The rest, we all share it. So think about that again when we think that we are different. This is the amount that we share.
Een fantastisch boek, een grandioos boek, een boek dat mij geholpen heeft iets te begrijpen dat echt fenomenaal is. Elk van jullie - wat mij en jou van elkaar onderscheidt is ongeveer vijf miljoen van deze, een half boek. Voor de rest zijn we allemaal volledig identiek. Die vijfhonderd pagina's zijn het mirakel van het leven voor elk van jullie. Al de rest hebben we gemeenschappelijk. Dus denk eraan wanneer je denkt dat we verschillend zijn. Zoveel hebben we dus gemeenschappelijk.
So now that I have your attention, the next question is: How do I read it? How do I make sense out of it? Well, for however good you can be at assembling Swedish furniture, this instruction manual is nothing you can crack in your life.
Nu ik dus jullie aandacht heb, wil ik nog een vraag stellen hoe kan je dat nu lezen? Hoe kan dat nu zinvol zijn? Je mag nog een kei zijn in het ineenknutselen van Zweedse meubels, maar deze handleiding zal je nooit kunnen gebruiken.
(Laughter)
(Gelach)
And so, in 2014, two famous TEDsters, Peter Diamandis and Craig Venter himself, decided to assemble a new company. Human Longevity was born, with one mission: trying everything we can try and learning everything we can learn from these books, with one target -- making real the dream of personalized medicine, understanding what things should be done to have better health and what are the secrets in these books.
En zo besloten twee bekende TED-ers, Peter Diamandis en Craig Venter zelf, in 2014 een nieuw bedrijf op te starten. Hier kwam Human Longevity, met één missie: alles proberen en alles leren uit deze boeken, met één doel - de droom waarmaken van gepersonaliseerde geneeskunde, begrijpen wat we moeten doen om een betere gezondheid te hebben en wat voor geheimen deze boeken omvatten.
An amazing team, 40 data scientists and many, many more people, a pleasure to work with. The concept is actually very simple. We're going to use a technology called machine learning. On one side, we have genomes -- thousands of them. On the other side, we collected the biggest database of human beings: phenotypes, 3D scan, NMR -- everything you can think of. Inside there, on these two opposite sides, there is the secret of translation. And in the middle, we build a machine. We build a machine and we train a machine -- well, not exactly one machine, many, many machines -- to try to understand and translate the genome in a phenotype. What are those letters, and what do they do? It's an approach that can be used for everything, but using it in genomics is particularly complicated. Little by little we grew and we wanted to build different challenges. We started from the beginning, from common traits. Common traits are comfortable because they are common, everyone has them.
Een fantastisch team met 40 wetenschappers en veel, veel andere mensen, een plezier om mee te werken. Het concept is heel eenvoudig. We gebruiken de technologie van 'machine learning'. Aan de ene kant hebben we duizenden genomen. Aan de andere kant hebben we de grootste database van de mens bijeengebracht: fenotypes, 3D-scans, kernspinresonantie - je noemt het maar. En daar, aan deze twee overstaande kanten vind je het geheim van de vertaling. Tussen de twee bouwen we een machine. We bouwen een machine en we programeren die - om precies te zijn, niet één machine, maar veel, veel machines - om te proberen het genoom in een fenotype te begrijpen en te vertalen. Welke zijn die letters en wat doen ze? Deze methodologie kan voor alles gebruikt worden, maar het is een hele opdracht om die te gebruiken in genomica. We zijn langzaamaan gegroeid en we hadden verschillende projecten. We begonnen met het begin, met gemeenschappelijke kenmerken. Gemeenschappelijke kenmerken zijn de gemakkelijkste, omdat iedereen ze heeft.
So we started to ask our questions: Can we predict height? Can we read the books and predict your height? Well, we actually can, with five centimeters of precision. BMI is fairly connected to your lifestyle, but we still can, we get in the ballpark, eight kilograms of precision. Can we predict eye color? Yeah, we can. Eighty percent accuracy. Can we predict skin color? Yeah we can, 80 percent accuracy. Can we predict age? We can, because apparently, the code changes during your life. It gets shorter, you lose pieces, it gets insertions. We read the signals, and we make a model.
Dus hebben we ons afgevraagd: kan lengte voorspeld worden? Kunnen we uit de boeken je lengte afleiden? Wel ja, we kunnen dat, met een precisie van vijf centimeter. Je BMI-index is gekoppeld aan je levensstijl maar we kunnen toch je gewicht schatten met een precisie van 8 kilo. De kleur van je ogen? Die kunnen we ook raden. Met 80% zekerheid. Kunnen we je huidskleur raden? Ja - met 80% zekerheid. Kunnen we je leeftijd raden? Dat kunnen we, omdat de code blijkbaar in de loop van de jaren verandert. Ze wordt korter, je verliest stukjes, ander stukken worden bijgevoegd. We lezen de signalen en we maken een model.
Now, an interesting challenge: Can we predict a human face? It's a little complicated, because a human face is scattered among millions of these letters. And a human face is not a very well-defined object. So, we had to build an entire tier of it to learn and teach a machine what a face is, and embed and compress it. And if you're comfortable with machine learning, you understand what the challenge is here.
Nu is er wel een interessante uitdaging Kunnen we een gezicht voorspellen? Dat is een beetje moeilijk omdat een menselijk gezicht bestaat uit miljoenen letters En een gezicht is nu ook niet een welomschreven object. Dus moesten we er een hele reeks van bouwen om te leren en aan een machine te leren wat een gezicht is en dan moet je het nog integreren. Als je iets van machine learning kent, dan weet je ook wat voor een uitdaging dit is.
Now, after 15 years -- 15 years after we read the first sequence -- this October, we started to see some signals. And it was a very emotional moment. What you see here is a subject coming in our lab. This is a face for us. So we take the real face of a subject, we reduce the complexity, because not everything is in your face -- lots of features and defects and asymmetries come from your life. We symmetrize the face, and we run our algorithm. The results that I show you right now, this is the prediction we have from the blood.
En nu, na 15 jaar - 15 jaar nadat we de eerste sequentie gelezen hebben - in oktober, hebben we de eerste signalen gezien. Dat was een zeer ontroerend moment. Je ziet dus een persoon ons lab binnenwandelen. Voor ons is het een gezicht. We nemen iemands reële gezicht, verminderen de complexiteit, omdat niet alles van je gezicht komt, veel kenmerken en imperfecties en onregelmatigheden komen van ons leven. We maken het gezicht symmetrisch en we voeren ons algoritme uit. Hier zijn de resultaten. Dit is de voorspelling die berekend wordt op basis van het bloed.
(Applause)
(Applaus)
Wait a second. In these seconds, your eyes are watching, left and right, left and right, and your brain wants those pictures to be identical. So I ask you to do another exercise, to be honest. Please search for the differences, which are many. The biggest amount of signal comes from gender, then there is age, BMI, the ethnicity component of a human. And scaling up over that signal is much more complicated. But what you see here, even in the differences, lets you understand that we are in the right ballpark, that we are getting closer. And it's already giving you some emotions.
Wacht eens even. Voor het ogenblik zijn jullie ogen aan het kijken, links en rechts, links en rechts, en jullie hersenen willen gewoon dat die foto's identiek zijn. Dus moeten jullie nu even eerlijk zijn. Probeer de verschillen na te sporen, en die zijn er! De grootste hoeveelheid signalen komt van het geslacht, dan heb je leeftijd, BMI, het ethnische aspect van een mens. Wanneer je een stap verder zet, dan wordt het pas echt ingewikkeld. Maar wat je hier kan zien, zelfs de verschillen, dat maakt ons duidelijk dat we in de goede richting aan het gaan zijn, dat we dichterbij komen. En je voelt de emoties al opkomen.
This is another subject that comes in place, and this is a prediction. A little smaller face, we didn't get the complete cranial structure, but still, it's in the ballpark. This is a subject that comes in our lab, and this is the prediction. So these people have never been seen in the training of the machine. These are the so-called "held-out" set. But these are people that you will probably never believe. We're publishing everything in a scientific publication, you can read it.
Dit is een andere persoon die het lab binnenkomt, en dit is de voorspelling. Een kleiner gezicht, de vorm van de schedel was niet volledig, maar je kan toch zien dat we er niet ver van af zijn. Dit is nog een andere persoon in ons lab, met de voorspelling. Maar deze mensen zul je nooit zien in de training van de machine. Ze zijn de zogenaamde validatieset. Maar deze mensen zal je waarschijnlijk nooit geloven. Ons werk wordt uitgegeven in een wetenschappelijk blad, je kan het lezen.
But since we are onstage, Chris challenged me. I probably exposed myself and tried to predict someone that you might recognize. So, in this vial of blood -- and believe me, you have no idea what we had to do to have this blood now, here -- in this vial of blood is the amount of biological information that we need to do a full genome sequence. We just need this amount. We ran this sequence, and I'm going to do it with you. And we start to layer up all the understanding we have. In the vial of blood, we predicted he's a male. And the subject is a male. We predict that he's a meter and 76 cm. The subject is a meter and 77 cm. So, we predicted that he's 76; the subject is 82. We predict his age, 38. The subject is 35. We predict his eye color. Too dark. We predict his skin color. We are almost there. That's his face.
Maar we zijn op het podium en Chris heeft me uitgedaagd. Ik heb een risico genomen en geprobeerd iemand te raden die jullie misschien zullen herkennen. Hier heb je een bloedbuisje -- en, geloof me, jullie heb geen idee wat we wel hebben moeten doen om dit bloed te bemachtigen -- hier in dit bloedbuisje hebben we genoeg biologische informatie om een volledige genoom te sequencen. Meer hebben we niet nodig. We hebben deze sequence uitgevoerd, en we zullen dit nu samen doen. Laag na laag brengen we alle informatie bij elkaar die we hebben. Via dit bloedbuisje hebben we voorspeld dat het gaat over een man. En inderdaad, het is een man. We voorspellen dat hij 1,76 m groot is. Onze persoon is 1,77 cm groot. We mikken op 76 kg, en hij weegt 82 kg. We voorspellen zijn leeftijd, 38 jaar. Onze persoon is er 35. Wij denken dat hij donkere ogen heeft. Te donker. Zijn huidskleur. We zijn er nu bijna. Dit is zijn gezicht.
Now, the reveal moment: the subject is this person.
En nu DE revelatie: hier is onze persoon.
(Laughter)
(Gelach)
And I did it intentionally. I am a very particular and peculiar ethnicity. Southern European, Italians -- they never fit in models. And it's particular -- that ethnicity is a complex corner case for our model. But there is another point. So, one of the things that we use a lot to recognize people will never be written in the genome. It's our free will, it's how I look. Not my haircut in this case, but my beard cut. So I'm going to show you, I'm going to, in this case, transfer it -- and this is nothing more than Photoshop, no modeling -- the beard on the subject. And immediately, we get much, much better in the feeling.
Ik heb dit met opzet gedaan. Ik heb een heel vreemde ethnische oorsprong. Zuid-Europees, Italiaans - die moeten altijd alles anders doen. En dat is speciaal - ethnische oorsprong is een ingewikkelde test voor ons model. Maar er is nog iets anders. Eén van de elementen die we veel gebruiken om mensen te herkennen zal je nooit in het genoom vinden. Het is onze vrije wil, hoe je eruit ziet. In mijn geval niet mijn haarsnit, maar mijn baard. Ik zal hier nu een baard toevoegen, en dat is niets anders dan Photoshop en zeker geen modellering. En nu krijgen we onmiddellijk iets totaal, maar dan ook totaal anders.
So, why do we do this? We certainly don't do it for predicting height or taking a beautiful picture out of your blood. We do it because the same technology and the same approach, the machine learning of this code, is helping us to understand how we work, how your body works, how your body ages, how disease generates in your body, how your cancer grows and develops, how drugs work and if they work on your body.
Waarom doen we dit dus? We doen het zeker niet om te voorspellen hoe groot iemand wordt of om een mooi plaatje te vormen vanaf je bloed. We doen dit omdat dezelfde technologie, en dezelfde methode, de machine learning van deze code, ons kan helpen te begrijpen hoe ons lichaam werkt, hoe je lichaam in elkaar zit, hoe je lichaam veroudert, hoe ziekte ontstaat in je lichaam, hoe kanker ontstaat en zich ontwikkelt, hoe drugs werken en wat het effect ervan is op je lichaam.
This is a huge challenge. This is a challenge that we share with thousands of other researchers around the world. It's called personalized medicine. It's the ability to move from a statistical approach where you're a dot in the ocean, to a personalized approach, where we read all these books and we get an understanding of exactly how you are. But it is a particularly complicated challenge, because of all these books, as of today, we just know probably two percent: four books of more than 175.
Dit is een ongelooflijke uitdaging. En deze uitdaging gaan we aan tezamen met duizenden wetenschappers overal ter wereld. Dat is nu gepersonaliseerde geneeskunde. In plaats van een statistische methode, waar je slechts een nummer bent, gebruiken we een gepersonaliseerde methode, waar we al die boeken lezen en we zo te weten komen hoe je precies in elkaar zit. Maar dit is een uiterst complexe uitdaging, omdat we, vandaag, van al die boeken, maar ongeveer twee procent kennen: vier boeken uit een totaal van meer dan 175.
And this is not the topic of my talk, because we will learn more. There are the best minds in the world on this topic. The prediction will get better, the model will get more precise. And the more we learn, the more we will be confronted with decisions that we never had to face before about life, about death, about parenting.
Dit is ook niet het onderwerp van mijn uiteenzetting, want we zullen zeker meer en meer leren. De beste breinen van de wereld zwoegen op deze topic. De berekening zal verbeteren, het model zal preciezer worden. Hoe meer we leren, hoe meer we zullen geconfronteerd worden met keuzes die we nooit eerder gezien hebben over het leven, over de dood, over het ouderschap.
So, we are touching the very inner detail on how life works. And it's a revolution that cannot be confined in the domain of science or technology. This must be a global conversation. We must start to think of the future we're building as a humanity. We need to interact with creatives, with artists, with philosophers, with politicians. Everyone is involved, because it's the future of our species. Without fear, but with the understanding that the decisions that we make in the next year will change the course of history forever.
We raken nu dus de echte essentie van hoe het leven werkt. En dit is een revolutie die we niet kunnen reduceren tot het domein van wetenschap of technologie. Dit moet een globaal debat zijn. We moeten nadenken over de toekomst van de mensheid die we aan het bouwen zijn. Daarbij moeten we samenwerken met artiesten, met filosofen, met de politieke wereld. Iedereen moet helpen, omdat het gaat over de toekomst van onze soort. Zonder angst, maar met het besef dat de beslissingen die we volgend jaar zullen nemen voorgoed de loop van geschiedenis zullen veranderen.
Thank you.
Hartelijk bedankt.
(Applause)
(Applaus)