What I want to talk to you about is what we can learn from studying the genomes of living people and extinct humans. But before doing that, I just briefly want to remind you about what you already know: that our genomes, our genetic material, are stored in almost all cells in our bodies in chromosomes in the form of DNA, which is this famous double-helical molecule. And the genetic information is contained in the form of a sequence of four bases abbreviated with the letters A, T, C and G. And the information is there twice -- one on each strand -- which is important, because when new cells are formed, these strands come apart, new strands are synthesized with the old ones as templates in an almost perfect process.
O que eu gostaria de falar a vocês é sobre o que podemos aprender ao estudar genomas de pessoas vivas e humanos extintos. Mas antes de fazer isso, eu só gostaria de lembrá-los sobre o que já sabemos: que nossos genomas, nosso material genético, estão armazenados em quase todas as células de nossos corpos em cromossomos na forma de DNA, que é essa famosa molécula de dupla-hélice. E a informação genética está contida na forma de uma sequência de quatro bases abreviadas pelas letras A, T, C e G. E a informação está lá duas vezes -- uma em cada fita -- o que é importante, pois quando novas células são formadas, essas fitas se separam, novas fitas são sintetizadas com as antigas como moldes em um processo quase perfeito.
But nothing, of course, in nature is totally perfect, so sometimes an error is made and a wrong letter is built in. And we can then see the result of such mutations when we compare DNA sequences among us here in the room, for example. If we compare my genome to the genome of you, approximately every 1,200, 1,300 letters will differ between us. And these mutations accumulate approximately as a function of time. So if we add in a chimpanzee here, we will see more differences. Approximately one letter in a hundred will differ from a chimpanzee.
Mas, é claro, nada na natureza é totalmente perfeito, então às vezes um erro é feito e uma letra errada é inserida. E nós podemos observar o resultado dessas mutações quando comparamos sequências de DNA entre nós aqui nessa sala, por exemplo. Se compararmos meu genoma com o genoma de vocês, aproximadamente uma letra a cada 1.200, 1.300 será diferente entre nós. E essas mutações se acumulam aproximadamente como uma função de tempo. Então se incluimos um chimpanzé aqui, nós veremos ainda mais diferenças. Aproximadamente uma letra a cada centena será diferente de um chimpanzé.
And if you're then interested in the history of a piece of DNA, or the whole genome, you can reconstruct the history of the DNA with those differences you observe. And generally we depict our ideas about this history in the form of trees like this. In this case, it's very simple. The two human DNA sequences go back to a common ancestor quite recently. Farther back is there one shared with chimpanzees. And because these mutations happen approximately as a function of time, you can transform these differences to estimates of time, where the two humans, typically, will share a common ancestor about half a million years ago, and with the chimpanzees, it will be in the order of five million years ago.
E se você estiver interessado na história de um pedaço de DNA, ou de todo o genoma, você pode reconstruir a história do DNA com essas diferenças que você observa. E geralmente nós descrevemos nossas ideias sobre essa história na forma de árvores como essa. Nesse caso, é muito simples. As duas sequências de DNA humano descendem de um ancestral comum muito recente. Mais para trás há um ancestral compartilhado com os chimpanzés. E por essas mutações ocorrerem aproximadamente como uma função de tempo, você pode transformar essas diferenças em estimativas de tempo, onde os dois humanos, tipicamente, irão compartilhar um ancestral comum de cerca de meio milhão de anos atrás, e com os chimpanzés, ele será da ordem de cinco milhões de anos atrás.
So what has now happened in the last few years is that there are account technologies around that allow you to see many, many pieces of DNA very quickly. So we can now, in a matter of hours, determine a whole human genome. Each of us, of course, contains two human genomes -- one from our mothers and one from our fathers. And they are around three billion such letters long. And we will find that the two genomes in me, or one genome of mine we want to use, will have about three million differences in the order of that. And what you can then also begin to do is to say, "How are these genetic differences distributed across the world?" And if you do that, you find a certain amount of genetic variation in Africa. And if you look outside Africa, you actually find less genetic variation. This is surprising, of course, because in the order of six to eight times fewer people live in Africa than outside Africa. Yet the people inside Africa have more genetic variation.
Então o que aconteceu agora nos últimos anos foi o surgimento de tecnologias que permitem observar muitos fragmentos de DNA rapidamente. Então em questão de horas podemos determinar um genoma humano completo. Cada um de nós, é claro, contém dois genomas humanos -- um de sua mãe e outro de seu pai. E eles têm cerca de 3 bilhões de letras. E veremos que os meus dois genomas, ou um dos meus genomas que vamos usar, terá cerca de 3 milhões de diferenças nessa ordem. Então o que você pode começar a fazer é dizer como essas diferenças genéticas estão distribuídas no mundo. E se você fizer isso, você encontrará uma certa quantia de variação genética na África. E ao olhar fora da África, você encontrará menos variação genética. Isso é surpreendente, é claro, pois na ordem de 6 a 8 vezes menos pessoas vivem na África do que fora dela. Mesmo assim as pessoas na África têm mais variação genética.
Moreover, almost all these genetic variants we see outside Africa have closely related DNA sequences that you find inside Africa. But if you look in Africa, there is a component of the genetic variation that has no close relatives outside. So a model to explain this is that a part of the African variation, but not all of it, [has] gone out and colonized the rest of the world. And together with the methods to date these genetic differences, this has led to the insight that modern humans -- humans that are essentially indistinguishable from you and me -- evolved in Africa, quite recently, between 100 and 200,000 years ago. And later, between 100 and 50,000 years ago or so, went out of Africa to colonize the rest of the world.
Além disso, quase todas as variantes genéticas que vemos fora da África têm sequências de DNA muito mais próximas do que as encontradas dentro da África. Mas se você olhar dentro da África, há um componente de variação genética que não possui parentesco fora do continente. Então o modelo para explicar isso é que uma parte da variação africana, mas não toda, migrou e colonizou o resto do mundo. E com os métodos para datar essas diferenças genéticas, isso levou à reflexão de que humanos modernos -- humanos que são essencialmente idênticos a você e eu -- evoluíram na África há muito pouco tempo, entre 100 a 200 mil anos atrás. E mais tarde, entre 100 a 50 mil anos atrás, saíram da África para colonizar o resto do mundo.
So what I often like to say is that, from a genomic perspective, we are all Africans. We either live inside Africa today, or in quite recent exile. Another consequence of this recent origin of modern humans is that genetic variants are generally distributed widely in the world, in many places, and they tend to vary as gradients, from a bird's-eye perspective at least. And since there are many genetic variants, and they have different such gradients, this means that if we determine a DNA sequence -- a genome from one individual -- we can quite accurately estimate where that person comes from, provided that its parents or grandparents haven't moved around too much.
Então o que gosto de dizer com frequência é que, de uma perspectiva genômica, nós todos somos africanos. Ou vivemos dentro da África hoje, ou vivemos um exílio muito recente. Outra consequência dessa origem recente dos humanos modernos é que as variantes genéticas estão distribuídas pelo mundo, em muitos lugares, e eles tendem a variar como gradientes, ao menos numa perspectiva ampla. E por haver tantas variantes genéticas, e terem esses gradientes diferentes, isso significa que se determinarmos uma sequência de DNA -- um genoma de um indivíduo -- nós podemos estimar com precisão de onde essa pessoa veio, desde que seus pais ou avós não tenham se mudado muito.
But does this then mean, as many people tend to think, that there are huge genetic differences between groups of people -- on different continents, for example? Well we can begin to ask those questions also. There is, for example, a project that's underway to sequence a thousand individuals -- their genomes -- from different parts of the world. They've sequenced 185 Africans from two populations in Africa. [They've] sequenced approximately equally [as] many people in Europe and in China. And we can begin to say how much variance do we find, how many letters that vary in at least one of those individual sequences. And it's a lot: 38 million variable positions.
Mas será que isso quer dizer, como muitas pessoas pensam, que há grandes diferenças genéticas entre grupos de pessoas -- em continentes diferentes, por exemplo? Nós podemos começar a responder essas questões também. Por exemplo, há um projeto que está em andamento para sequenciar uma centena de indivíduos -- seus genomas -- de diferentes partes do mundo. Eles sequenciaram 185 africanos de duas populações na África. Eles sequenciaram mais ou menos o mesmo número de pessoas na Europa e na China. E podemos começar a dizer quanta variância encontramos, quantas letras que variam em ao menos uma dessas sequências individuais. E são muitas: 38 milhões de posições variáveis.
But we can then ask: Are there any absolute differences between Africans and non-Africans? Perhaps the biggest difference most of us would imagine existed. And with absolute difference -- and I mean a difference where people inside Africa at a certain position, where all individuals -- 100 percent -- have one letter, and everybody outside Africa has another letter. And the answer to that, among those millions of differences, is that there is not a single such position. This may be surprising. Maybe a single individual is misclassified or so. So we can relax the criterion a bit and say: How many positions do we find where 95 percent of people in Africa have one variant, 95 percent another variant, and the number of that is 12.
Mas podemos questionar: há alguma diferença absoluta entre africanos e não-africanos? Talvez a maior diferença que muitos de nós imaginamos exista. E com essa diferença absoluta -- e quero dizer uma diferença em que as pessoas na África tem num certa posição, onde todos os indivíduos -- 100 % -- têm uma letra, e todo mundo fora da África tem outra letra. E a resposta para isso entre milhões de diferenças é que não existe essa posição. Isso pode ser surpreendente. Talvez um indivíduo esteja mal classificado. Então podemos relaxar o critério um pouco e dizer: quantas posições encontramos onde 95% das pessoas na África têm uma variante, as outras 95% fora da África outra variante, e o número disso é 12.
So this is very surprising. It means that when we look at people and see a person from Africa and a person from Europe or Asia, we cannot, for a single position in the genome with 100 percent accuracy, predict what the person would carry. And only for 12 positions can we hope to be 95 percent right. This may be surprising, because we can, of course, look at these people and quite easily say where they or their ancestors came from. So what this means now is that those traits we then look at and so readily see -- facial features, skin color, hair structure -- are not determined by single genes with big effects, but are determined by many different genetic variants that seem to vary in frequency between different parts of the world.
Então isso é muito surpreendente. Isso significa que quando observamos pessoas e vemos uma pessoa da África e uma pessoa da Europa ou Ásia, não podemos, para uma única posição do genoma com 100% de precisão, predizer o que essa pessoa carrega. E apenas para 12 posições podemos estimar estarmos 95% corretos. Isso pode ser surpreendente, porque podemos, é claro, observar essas mesmas pessoas e afimar com facilidade de onde elas ou seus ancestrais vieram. Então o que isso significa agora é que essas características que observamos e vemos de imediato -- traços faciais, cor da pele, tipo de cabelo -- não são determinadas por genes únicos com grande influência, mas são determinadas por muitas variantes genéticas diferentes que parecem variar em frequência entre diferentes partes do mundo.
There is another thing with those traits that we so easily observe in each other that I think is worthwhile to consider, and that is that, in a very literal sense, they're really on the surface of our bodies. They are what we just said -- facial features, hair structure, skin color. There are also a number of features that vary between continents like that that have to do with how we metabolize food that we ingest, or that have to do with how our immune systems deal with microbes that try to invade our bodies. But so those are all parts of our bodies where we very directly interact with our environment, in a direct confrontation, if you like. It's easy to imagine how particularly those parts of our bodies were quickly influenced by selection from the environment and shifted frequencies of genes that are involved in them. But if we look on other parts of our bodies where we don't directly interact with the environment -- our kidneys, our livers, our hearts -- there is no way to say, by just looking at these organs, where in the world they would come from.
Há uma outra coisa sobre essas características que facilmente observamos entre nós que eu acho que vale a pena considerar, e que é, num sentido muito literal, que elas estão na superfície de nossos corpos. Elas são apenas o que disse antes -- traços faciais, tipo de cabelo, cor da pele. Há muitas características que variam entre continentes assim, que têm relação com como metabolizamos a comida que ingerimos, ou têm relação com como nosso sistema imune lida com micróbios que invadem nossos corpos. Mas essas são todas partes de nossos corpos que interagem diretamente com nosso meio, em um confronto direto, se preferir. É fácil imaginar como essas partes de nossos corpos foram rapidamente influenciadas pela seleção do ambiente e mudaram a frequência de genes que estão envolvidos nelas. Mas se olharmos para outras partes de nossos corpos por onde não interagimos diretamente com o ambiente -- nossos rins, nossos fígados, nossos corações -- não há como afirmar, apenas olhando nesses orgãos, de onde eles vieram no mundo.
So there's another interesting thing that comes from this realization that humans have a recent common origin in Africa, and that is that when those humans emerged around 100,000 years ago or so, they were not alone on the planet. There were other forms of humans around, most famously perhaps, Neanderthals -- these robust forms of humans, compared to the left here with a modern human skeleton on the right -- that existed in Western Asia and Europe since several hundreds of thousands of years. So an interesting question is, what happened when we met? What happened to the Neanderthals?
Então há uma outra coisa intessante que deriva dessa percepção de que humanos têm uma origem comum e recente na África, e que é que quando esses humanos surgiram a cerca de 100 mil anos atrás, eles não estavam sozinhos no planeta. Havia outros tipos de humanos nas redondezas, os mais famosos talvez fossem os Neandertais -- esse tipo robusto de humanos, comparados ao da esquerda aqui com um esqueleto humano moderno à direita -- que existiu na Ásia Ocidental e Europa há muitas centenas de milhares de anos. Então uma questão interessante é o que aconteceu quando nos encontramos? O que aconteceu com os Neandertais?
And to begin to answer such questions, my research group -- since over 25 years now -- works on methods to extract DNA from remains of Neanderthals and extinct animals that are tens of thousands of years old. So this involves a lot of technical issues in how you extract the DNA, how you convert it to a form you can sequence. You have to work very carefully to avoid contamination of experiments with DNA from yourself. And this then, in conjunction with these methods that allow very many DNA molecules to be sequenced very rapidly, allowed us last year to present the first version of the Neanderthal genome, so that any one of you can now look on the Internet, on the Neanderthal genome, or at least on the 55 percent of it that we've been able to reconstruct so far. And you can begin to compare it to the genomes of people who live today.
E para começar a responder essas perguntas, meu grupo de pesquisa -- há mais de 25 anos agora -- trabalha com métodos de extração de DNA de restos de Neandertais e animais extintos que têm dezenas de milhares de anos de idade. Então isso envolve um monte de questões técnicas sobre como se extrai o DNA, como se converte isso numa forma que se pode sequenciar. É preciso trabalhar com muito cuidade para evitar contaminação de experimentos com seu próprio DNA. E então, com esse conjunto de métodos que permitem que muitas moléculas de DNA sejam sequenciadas com rapidez, nos foi possível apresentar a primeira versão do genoma Neandertal, para que qualquer um de vocês possa olhar agora na Internet, para o genoma Neandertal, ou ao menos para 55% do que pudemos reconstruir até então. E você pode começar a compará-lo com os genomas de pessoas que vivem atualmente.
And one question that you may then want to ask is, what happened when we met? Did we mix or not? And the way to ask that question is to look at the Neanderthal that comes from Southern Europe and compare it to genomes of people who live today. So we then look to do this with pairs of individuals, starting with two Africans, looking at the two African genomes, finding places where they differ from each other, and in each case ask: What is a Neanderthal like? Does it match one African or the other African? We would expect there to be no difference, because Neanderthals were never in Africa. They should be equal, have no reason to be closer to one African than another African. And that's indeed the case. Statistically speaking, there is no difference in how often the Neanderthal matches one African or the other. But this is different if we now look at the European individual and an African. Then, significantly more often, does a Neanderthal match the European rather than the African. The same is true if we look at a Chinese individual versus an African, the Neanderthal will match the Chinese individual more often. This may also be surprising because the Neanderthals were never in China.
E uma questão que vocês podem querer perguntar é o que aconteceu quando nos encontramos? Nós nos misturamos ou não? E a forma para responder essa questão é observar os Neandertais que vieram da Europa Austral e compará-los com genomas de pessoas que vivem atualmente. Então nós procuramos fazer isso com pares de indivíduos, começando com dois africanos, olhando para os dois genomas africanos, encontrando lugares onde eles diferiam entre si, e em cada caso perguntamos: com quem o Neandertal se parece? Isso é idêntico com o desse africano ou do outro? Nós não esperávamos encontrar nenhuma diferença, porque os Neandertais nunca estiveram na África. Eles deveriam ser iguais, sem razão para ser mais próximos de um africano do que de outro. E esse é o caso de fato. Estatisticamente falando, não há nenhuma diferença em quanto um Neandertal é mais parecido com um africano do que do outro. Mas isso é diferente se nós olharmos para um indivíduo europeu e um africano. Então, com significativamente mais frequência, um Neandertal é mais parecido com o europeu do que com o africano. O mesmo é verdade se olharmos para um indivíduo chinês contra um africano: o Neandertal vai ser mais parecido com o chinês com mais frequência. Isso pode também ser surpreendente porque os Neandertaus nunca foram à China.
So the model we've proposed to explain this is that when modern humans came out of Africa sometime after 100,000 years ago, they met Neanderthals. Presumably, they did so first in the Middle East, where there were Neanderthals living. If they then mixed with each other there, then those modern humans that became the ancestors of everyone outside Africa carried with them this Neanderthal component in their genome to the rest of the world. So that today, the people living outside Africa have about two and a half percent of their DNA from Neanderthals.
Então o modelo que propusemos para explicar isso é que quando os humanos modernos vieram da África há cerca de 100 mil anos atrás, eles encontraram os Neandertais. Supostamente, eles se encontraram primeiro no Oriente Médio onde havia Neandertais. Se eles se misturaram entre si ali, então esses humanos modernos que se tornaram os ancestrais de todo mundo fora da África levou com eles esse componente Neandertal em seu genoma para o resto do mundo. De forma que hoje, as pessoas que vivem fora da África têm cerca de 2,5% de seu DNA vindo dos Neandertais.
So having now a Neanderthal genome on hand as a reference point and having the technologies to look at ancient remains and extract the DNA, we can begin to apply them elsewhere in the world. And the first place we've done that is in Southern Siberia in the Altai Mountains at a place called Denisova, a cave site in this mountain here, where archeologists in 2008 found a tiny little piece of bone -- this is a copy of it -- that they realized came from the last phalanx of a little finger of a pinky of a human. And it was well enough preserved so we could determine the DNA from this individual, even to a greater extent than for the Neanderthals actually, and start relating it to the Neanderthal genome and to people today. And we found that this individual shared a common origin for his DNA sequences with Neanderthals around 640,000 years ago. And further back, 800,000 years ago is there a common origin with present day humans.
Agora que temos um genoma Neandertal disponível como um ponto de referência e temos as tecnologias para observar restos ancestrais e extrair seu DNA, nós podemos começar a aplicá-las em qualquer lugar no mundo. E o primeiro lugar que fizemos isso foi no sul da Sibéria nas Montanhas Altai num lugar chamado Denisova. Há uma caverna nessa montanha, onde os arqueólogos encontraram em 2008 um pedacinho de osso -- essa é uma cópia dele -- e eles descobriram que isso veio da última falange de um dedo mínimo de um humano. E ele estava muito bem preservado de forma que pudemos determinar o DNA desse indivíduo, numa extensão maior do que dos Neandertais, e começamos a relacioná-lo com o genoma Neandertal e com o genoma de pessoas de hoje. E descobrimos que esse indivíduo compartilha uma origem comum com os Neandertais a cerca de 640 mil anos atrás. E mais além, há 800 mil anos atrás há uma origem comum com os humanos atuais.
So this individual comes from a population that shares an origin with Neanderthals, but far back and then have a long independent history. We call this group of humans, that we then described for the first time from this tiny, tiny little piece of bone, the Denisovans, after this place where they were first described. So we can then ask for Denisovans the same things as for the Neanderthals: Did they mix with ancestors of present day people? If we ask that question, and compare the Denisovan genome to people around the world, we surprisingly find no evidence of Denisovan DNA in any people living even close to Siberia today. But we do find it in Papua New Guinea and in other islands in Melanesia and the Pacific. So this presumably means that these Denisovans had been more widespread in the past, since we don't think that the ancestors of Melanesians were ever in Siberia.
Então esse indivíduo vem de uma população que compartilha uma origem com Neandertais, mas mais além tem uma longa história independente. Nós chamamos esse grupo de humanos, que descrevemos pela primeira vez a partir desse pequeno pedacinho de osso, de Denisovanos, a partir do lugar onde foram descobertos. Então nós podemos questionar dos Denisovanos as mesmas coisas que fizemos dos Neandertais: Eles se misturaram com ancestrais das pessoas de hoje? Nós perguntamos essa questão, e comparamos o genoma Denisovano com de pessoas ao redor do mundo. Nós descobrimos de forma surpreendente que não há evidência de DNA Denisovano em nenhuma pessoa que vive perto da Sibéria hoje. Mas a encontramos em Papua-Nova Guiné e em outras ilhas na Melanésia e no Pacífico. Então isso supostamente significa que esses Denisovanos foram mais distribuídos no passado, pois não nós não acreditamos que os ancestrais dos Melanésios estiveram na Sibéria.
So from studying these genomes of extinct humans, we're beginning to arrive at a picture of what the world looked like when modern humans started coming out of Africa. In the West, there were Neanderthals; in the East, there were Denisovans -- maybe other forms of humans too that we've not yet described. We don't know quite where the borders between these people were, but we know that in Southern Siberia, there were both Neanderthals and Denisovans at least at some time in the past. Then modern humans emerged somewhere in Africa, came out of Africa, presumably in the Middle East. They meet Neanderthals, mix with them, continue to spread over the world, and somewhere in Southeast Asia, they meet Denisovans and mix with them and continue on out into the Pacific. And then these earlier forms of humans disappear, but they live on a little bit today in some of us -- in that people outside of Africa have two and a half percent of their DNA from Neanderthals, and people in Melanesia actually have an additional five percent approximately from the Denisovans.
Então a partir do estudo desses genomas de humanos extintos, estamos começando a chegar numa imagem de como o mundo se parecia quando humanos modernos começaram a sair da África. No Ocidente, onde havia Neandertais, no Oriente, onde havia Denisovanos -- talvez outros tipos de humanos também que nós não descrevemos ainda. Nós não sabemos exatamente onde estavam as fronteiras entre esses povos, mas sabemos que no sul da Sibéria havia tanto Neandertais como Denisovanos em algum ponto no passado. Então os humanos modernos surgiram em algum lugar da África, e saíram da África, supostamente para o Oriente Médio. Eles encontraram os Neandertais, se misturaram com eles, continuaram a se espalhar pelo mundo, e em algum lugar no sudeste da Ásia, eles encontraram Denisovanos e se misturaram com eles e continuaram para o Pacífico. E então esses tipos ancestrais de humanos desapareceram, mas eles vivem em uma parte hoje em alguns de nós -- nas pessoas fora da África que têm 2,5% de seu DNA dos Neandertais, e as pessoas na Melanésia têm cerca de mais 5% dos Denisovanos.
Does this then mean that there is after all some absolute difference between people outside Africa and inside Africa in that people outside Africa have this old component in their genome from these extinct forms of humans, whereas Africans do not? Well I don't think that is the case. Presumably, modern humans emerged somewhere in Africa. They spread across Africa also, of course, and there were older, earlier forms of humans there. And since we mixed elsewhere, I'm pretty sure that one day, when we will perhaps have a genome of also these earlier forms in Africa, we will find that they have also mixed with early modern humans in Africa.
Isso significa que há portanto alguma diferença absoluta entre pessoas fora da África e dentro da África? Dentro das pessoas fora da África há esse componente ancestral em seu genoma desses tipos de humanos extintos, enquanto os africanos não têm? Bem, não acho que seja o caso. Supostamente, os humanos modernos surgiram de algum lugar da África. Eles se distribuiram pela África, é claro, e havia tipos mais antigos de humanos ali. E como nós nos misturamos em outros lugares, eu tenho certeza de que um dia, quando nós teremos talvez um genoma desses tipos antigos na África também, nós descobriremos que eles também se misturaram com os primeiros humanos modernos.
So to sum up, what have we learned from studying genomes of present day humans and extinct humans? We learn perhaps many things, but one thing that I find sort of important to mention is that I think the lesson is that we have always mixed. We mixed with these earlier forms of humans, wherever we met them, and we mixed with each other ever since.
Então para resumir, o que nós aprendemos com o estudo de genomas dos humanos de hoje em dia e humanos extintos? Nós aprendemos talvez muitas coisas, mas uma coisa que eu acho que é importante mencionar é que eu penso que a lição é que sempre nos misturamos. Nós nos misturamos com os tipos antigos de humanos, em todos os lugares que nos encontramos, e nós nos misturamos entre nós desde então.
Thank you for your attention.
Obrigado pela sua atenção.
(Applause)
(Aplausos)