What I want to talk to you about is what we can learn from studying the genomes of living people and extinct humans. But before doing that, I just briefly want to remind you about what you already know: that our genomes, our genetic material, are stored in almost all cells in our bodies in chromosomes in the form of DNA, which is this famous double-helical molecule. And the genetic information is contained in the form of a sequence of four bases abbreviated with the letters A, T, C and G. And the information is there twice -- one on each strand -- which is important, because when new cells are formed, these strands come apart, new strands are synthesized with the old ones as templates in an almost perfect process.
O que vos quero contar é o que podemos aprender com o estudo dos genomas de pessoas vivas e humanos extintos. Mas antes de o fazer, quero apenas lembrar-vos do que já vocês sabem: que os nossos genomas, o nosso material genético, são armazenados em quase todas as células do nosso corpo em cromossomas na forma de ADN, que é a famosa molécula de dupla hélice. E a informação genética está contida sob a forma de sequência de quatro bases abreviadas com as letras A, T, C e G. A informação está lá duas vezes - uma em cada uma das fitas - o que é importante, porque quando são formadas novas células, estas fitas separam-se, e novas fitas são sintetizadas usando as velhas como modelo, num processo quase perfeito.
But nothing, of course, in nature is totally perfect, so sometimes an error is made and a wrong letter is built in. And we can then see the result of such mutations when we compare DNA sequences among us here in the room, for example. If we compare my genome to the genome of you, approximately every 1,200, 1,300 letters will differ between us. And these mutations accumulate approximately as a function of time. So if we add in a chimpanzee here, we will see more differences. Approximately one letter in a hundred will differ from a chimpanzee.
Mas, claro, nada na natureza é totalmente perfeito, e por vezes é cometido um erro e é criada uma letra errada. Podemos ver o resultado de tais mutações quando comparamos sequências de ADN entre as pessoas que estão aqui na sala, por exemplo. Se compararmos o meu genoma aos vossos, aproximadamente cada 1200, 1300 letras irão variar entre nós. E estas mutações acumulam-se aproximadamente em função do tempo. Portanto se juntarmos aqui um chimpanzé, veremos mais diferenças. Cerca de uma em cada 100 letras vai divergir da letra de um chimpanzé.
And if you're then interested in the history of a piece of DNA, or the whole genome, you can reconstruct the history of the DNA with those differences you observe. And generally we depict our ideas about this history in the form of trees like this. In this case, it's very simple. The two human DNA sequences go back to a common ancestor quite recently. Farther back is there one shared with chimpanzees. And because these mutations happen approximately as a function of time, you can transform these differences to estimates of time, where the two humans, typically, will share a common ancestor about half a million years ago, and with the chimpanzees, it will be in the order of five million years ago.
E se estivermos interessados na história de um fragmento de ADN, ou de todo o genoma, podemos reconstruir a história do ADN com estas diferenças que observamos. Geralmente retratamos as nossas ideias sobre essa história sob a forma de árvores como esta. Neste caso, é muito simples. As duas sequências humanas de ADN vão ter a um antepassado comum bastante recente. Mais atrás existe um partilhado com chimpanzés. E uma vez que estas mutações acontecem aproximadamente em função do tempo, podemos transformar estas diferenças em estimativas temporais, em que estes dois humanos, tipicamente, terão partilhado um antepassado comum há cerca de um milhão de anos, e com os chimpanzés será na ordem dos cinco milhões de anos.
So what has now happened in the last few years is that there are account technologies around that allow you to see many, many pieces of DNA very quickly. So we can now, in a matter of hours, determine a whole human genome. Each of us, of course, contains two human genomes -- one from our mothers and one from our fathers. And they are around three billion such letters long. And we will find that the two genomes in me, or one genome of mine we want to use, will have about three million differences in the order of that. And what you can then also begin to do is to say, "How are these genetic differences distributed across the world?" And if you do that, you find a certain amount of genetic variation in Africa. And if you look outside Africa, you actually find less genetic variation. This is surprising, of course, because in the order of six to eight times fewer people live in Africa than outside Africa. Yet the people inside Africa have more genetic variation.
O que aconteceu nos últimos anos é que surgiram tecnologias que nos permitem ver muitos fragmentos de ADN muito rapidamente. Então podemos agora, numa questão de horas, determinar um genoma humano inteiro. Cada um de nós, claro, contém dois genomas humanos - um das nossas mães e um dos nossos pais. E cada um tem cerca de três mil milhões de letras destas. E veremos que os meus dois genomas, ou um deles que queiramos usar, terá por volta de três milhões de diferenças, nessa ordem. A seguir podemos também começar a dizer como essas diferenças genéticas se distribuem pelo mundo. Se o fizermos, encontraremos uma certa quantidade de variação genética em África. Se olharmos para fora de África, encontramos menor variação genética. Isto é surpreendente, claro, porque cerca de seis a oito vezes menos pessoas vivem dentro do que fora de África. E no entanto as pessoas de África tem maior variação genética.
Moreover, almost all these genetic variants we see outside Africa have closely related DNA sequences that you find inside Africa. But if you look in Africa, there is a component of the genetic variation that has no close relatives outside. So a model to explain this is that a part of the African variation, but not all of it, [has] gone out and colonized the rest of the world. And together with the methods to date these genetic differences, this has led to the insight that modern humans -- humans that are essentially indistinguishable from you and me -- evolved in Africa, quite recently, between 100 and 200,000 years ago. And later, between 100 and 50,000 years ago or so, went out of Africa to colonize the rest of the world.
Além disso, quase todas as variantes genéticas que encontramos fora de África têm sequências de ADN mais estreitamente relacionadas do que as observadas dentro de África. Mas se olharmos para África, existe uma componente da variação genética que não tem familiares próximos fora. O modelo que explica isto diz que parte da variação africana, mas não toda, saiu a colonizar o resto do mundo. E, juntamente com os métodos de datação destas diferenças genéticas, isto levou à percepção que os humanos modernos - humanos essencialmente indistinguíveis de nós - evoluíram em África bastante recentemente, há cerca de 100 a 200 mil anos. E depois, há cerca de 100 a 50 mil anos, saíram de África e foram colonizar o resto do mundo.
So what I often like to say is that, from a genomic perspective, we are all Africans. We either live inside Africa today, or in quite recent exile. Another consequence of this recent origin of modern humans is that genetic variants are generally distributed widely in the world, in many places, and they tend to vary as gradients, from a bird's-eye perspective at least. And since there are many genetic variants, and they have different such gradients, this means that if we determine a DNA sequence -- a genome from one individual -- we can quite accurately estimate where that person comes from, provided that its parents or grandparents haven't moved around too much.
Então o que costumo dizer é que, numa perspectiva genómica, somos todos africanos. Ou vivemos em África nos dias de hoje, ou num exílio muito recente. Outra consequência desta origem recente dos humanos modernos é que as variantes genéticas estão de um modo geral distribuídas amplamente pelo mundo, por muitos lugares, e tendem a variar como gradientes, pelo menos numa perspectiva geral. E uma vez que há muitas variantes genéticas, e têm diferentes gradientes, isto significa que se determinarmos uma sequência de ADN - um genoma de um indivíduo - podemos estimar de forma bastante exacta de onde vem essa pessoa, desde que os seus pais ou avós não se tenham deslocado muito.
But does this then mean, as many people tend to think, that there are huge genetic differences between groups of people -- on different continents, for example? Well we can begin to ask those questions also. There is, for example, a project that's underway to sequence a thousand individuals -- their genomes -- from different parts of the world. They've sequenced 185 Africans from two populations in Africa. [They've] sequenced approximately equally [as] many people in Europe and in China. And we can begin to say how much variance do we find, how many letters that vary in at least one of those individual sequences. And it's a lot: 38 million variable positions.
Mas será que isto quer dizer, como muitos tendem a pensar, que existem enormes diferenças genéticas entre grupos de pessoas - de diferentes continentes, por exemplo? Bem, podemos também começar a perguntar-nos isso. Existe, por exemplo, um projecto em curso para sequenciar mil indivíduos - os seus genomas - de diferentes partes do mundo. Já mapearam 185 africanos de duas populações de África. Sequenciaram aproximadamente o mesmo número de pessoas na Europa e na China. E podemos começar a dizer quanta variação encontramos, quantas letras variam em pelo menos uma dessas sequências individuais. E é muito: 38 milhões de posições variáveis.
But we can then ask: Are there any absolute differences between Africans and non-Africans? Perhaps the biggest difference most of us would imagine existed. And with absolute difference -- and I mean a difference where people inside Africa at a certain position, where all individuals -- 100 percent -- have one letter, and everybody outside Africa has another letter. And the answer to that, among those millions of differences, is that there is not a single such position. This may be surprising. Maybe a single individual is misclassified or so. So we can relax the criterion a bit and say: How many positions do we find where 95 percent of people in Africa have one variant, 95 percent another variant, and the number of that is 12.
Mas podemos perguntar: será que há muitas diferenças absolutas entre africanos e não-africanos? Talvez a maior diferença que muitos de nós pudéssemos imaginar. E por diferença absoluta quero dizer uma diferença em que, onde as pessoas em África, numa certa posição, 100 por cento dos indivíduos, têm uma letra, toda a gente fora de África tem outra letra. E a resposta para isso entre todos esses milhões de diferenças é que essa tal certa posição não existe. Isto pode ser surpreendente. Talvez um único indivíduo esteja mal classificado, ou qualquer coisa. Então podemos relaxar um pouco o critério e dizer: quantas posições encontramos em que 95 por cento das pessoas em África têm uma variante, 95 por cento outra variante? E esse número é 12.
So this is very surprising. It means that when we look at people and see a person from Africa and a person from Europe or Asia, we cannot, for a single position in the genome with 100 percent accuracy, predict what the person would carry. And only for 12 positions can we hope to be 95 percent right. This may be surprising, because we can, of course, look at these people and quite easily say where they or their ancestors came from. So what this means now is that those traits we then look at and so readily see -- facial features, skin color, hair structure -- are not determined by single genes with big effects, but are determined by many different genetic variants that seem to vary in frequency between different parts of the world.
Isto é muito surpreendente. Significa que quando olhamos para as pessoas e vemos uma pessoa de África e outra da Europa ou da Ásia, não podemos, para uma única posição no genoma, com 100 por cento de exactidão prever o mapa genético dessa pessoa. E apenas para 12 posições podemos esperar ter 95 por cento de precisão. Isto pode ser surpreendente porque podemos, claro, olhar para estas pessoas e dizer com facilidade de onde eles ou os seus antepassados vieram. O que isto significa agora é que aqueles traços que observamos e tão prontamente vemos - traços faciais, cor da pele, estrutura capilar - não são determinados por genes únicos com grandes impactos, mas sim por muitas diferentes variantes genéticas que parecem variar em frequência em diferentes partes do mundo.
There is another thing with those traits that we so easily observe in each other that I think is worthwhile to consider, and that is that, in a very literal sense, they're really on the surface of our bodies. They are what we just said -- facial features, hair structure, skin color. There are also a number of features that vary between continents like that that have to do with how we metabolize food that we ingest, or that have to do with how our immune systems deal with microbes that try to invade our bodies. But so those are all parts of our bodies where we very directly interact with our environment, in a direct confrontation, if you like. It's easy to imagine how particularly those parts of our bodies were quickly influenced by selection from the environment and shifted frequencies of genes that are involved in them. But if we look on other parts of our bodies where we don't directly interact with the environment -- our kidneys, our livers, our hearts -- there is no way to say, by just looking at these organs, where in the world they would come from.
Há outra coisa sobre estes traços que tão facilmente observamos uns nos outros que penso que importa considerar: é que, de forma bastante literal, estão à superfície dos nossos corpos. Eles são o que acabámos de dizer - traços faciais, estrutura do cabelo, cor da pele. Há também um número de características como essas que variam entre continentes e que têm que ver com o modo como metabolizamos a comida que ingerimos, ou que têm que ver com o modo com que os nossos sistemas imunitários lidam com micróbios que tentam invadir os nossos corpos. Mas tudo isso são partes do nosso corpo que interagem directamente com o nosso ambiente, em confronto directo, digamos. É fácil imaginar a rapidez particular com que essas partes do corpo foram influenciadas por selecção pelo ambiente e alteraram frequências de genes nelas envolvidas. Mas se olharmos para outras partes do nosso corpo que não interagem directamente com o ambiente - os nossos rins, o fígado, o coração - não há como dizer, apenas olhando para estes órgãos, de que parte do mundo vêm.
So there's another interesting thing that comes from this realization that humans have a recent common origin in Africa, and that is that when those humans emerged around 100,000 years ago or so, they were not alone on the planet. There were other forms of humans around, most famously perhaps, Neanderthals -- these robust forms of humans, compared to the left here with a modern human skeleton on the right -- that existed in Western Asia and Europe since several hundreds of thousands of years. So an interesting question is, what happened when we met? What happened to the Neanderthals?
Há outra coisa interessante que vem desta descoberta que os humanos têm uma origem comum recente em África: é que quando esses humanos surgiram, há cerca de cem mil anos, não estavam sozinhos no planeta. Existiam outros tipos de humanos a rondar - talvez os mais famosos destes sejam os Neandertais - este género robusto de ser humano, comparado aqui à esquerda com um esqueleto de humano moderno à direita - que existiam na Ásia Ocidental e Europa há várias centenas de milhares de anos. Então uma pergunta interessante é: o que aconteceu quando nos encontrámos? O que aconteceu aos Neandertais?
And to begin to answer such questions, my research group -- since over 25 years now -- works on methods to extract DNA from remains of Neanderthals and extinct animals that are tens of thousands of years old. So this involves a lot of technical issues in how you extract the DNA, how you convert it to a form you can sequence. You have to work very carefully to avoid contamination of experiments with DNA from yourself. And this then, in conjunction with these methods that allow very many DNA molecules to be sequenced very rapidly, allowed us last year to present the first version of the Neanderthal genome, so that any one of you can now look on the Internet, on the Neanderthal genome, or at least on the 55 percent of it that we've been able to reconstruct so far. And you can begin to compare it to the genomes of people who live today.
E para começar a responder a essas perguntas, o meu grupo de investigação - há mais de 25 anos - trabalha em métodos de extracção de ADN de vestígios de Neandertais e animais extintos que têm dezenas de milhares de anos. Isto implica uma série de questões técnicas sobre como extrair o ADN, como transformá-lo de modo a que o possamos sequenciar. Temos de trabalhar muito cuidadosamente para evitar contaminação de experiências com o nosso próprio ADN. E isto, em conjunto com aqueles métodos que permitem o sequenciamento muito rápido de numerosas moléculas de ADN, permitiu-nos o ano passado apresentar a primeira versão do genoma Neandertal, de modo que qualquer um de vós pode agora consultar na internet o genoma Neandertal, ou pelo menos os 55 por cento que conseguimos reconstruir até agora. E podem começar a compará-lo aos genomas de pessoas que estão vivas hoje.
And one question that you may then want to ask is, what happened when we met? Did we mix or not? And the way to ask that question is to look at the Neanderthal that comes from Southern Europe and compare it to genomes of people who live today. So we then look to do this with pairs of individuals, starting with two Africans, looking at the two African genomes, finding places where they differ from each other, and in each case ask: What is a Neanderthal like? Does it match one African or the other African? We would expect there to be no difference, because Neanderthals were never in Africa. They should be equal, have no reason to be closer to one African than another African. And that's indeed the case. Statistically speaking, there is no difference in how often the Neanderthal matches one African or the other. But this is different if we now look at the European individual and an African. Then, significantly more often, does a Neanderthal match the European rather than the African. The same is true if we look at a Chinese individual versus an African, the Neanderthal will match the Chinese individual more often. This may also be surprising because the Neanderthals were never in China.
E uma pergunta que podem querer fazer é: o que aconteceu quando nos encontrámos? Misturámo-nos ou não? E para fazer essa pergunta devemos olhar para o Neandertal que vem do sul da Europa e compará-lo aos genomas de pessoas que estão hoje vivas. Então tentamos fazer isso com pares de indivíduos, a começar com dois africanos, olhamos para os dois genomas africanos, encontramos partes em que diferem um do outro, e em cada caso perguntamos: como é um Neandertal? Corresponde a um africano ou ao outro? Seria de esperar que fosse indiferente, porque os Neandertais nunca estiveram em África. Deveriam ser iguais, não haveria motivo para que se assemelhassem mais a um africano do que a outro. E é de facto o que acontece. Estatisticamente falando, não existe diferença na frequência com que o Neandertal coincide com um africano ou o outro. Mas já é diferente se olharmos para um indivíduo europeu e um africano. Aí, com bastante mais frequência, um Neandertal assemelha-se a um europeu e não a um africano. O mesmo acontece se observarmos um indivíduo chinês face a um africano, o Neandertal vai coincidir mais frequentemente com o indivíduo chinês. Isto também pode ser surpreendente porque os Neandertais nunca estiveram na China.
So the model we've proposed to explain this is that when modern humans came out of Africa sometime after 100,000 years ago, they met Neanderthals. Presumably, they did so first in the Middle East, where there were Neanderthals living. If they then mixed with each other there, then those modern humans that became the ancestors of everyone outside Africa carried with them this Neanderthal component in their genome to the rest of the world. So that today, the people living outside Africa have about two and a half percent of their DNA from Neanderthals.
O modelo que propusemos para explicar isto diz que quando os humanos modernos saíram de África há uns 100 mil anos, encontraram Neandertais. Presumivelmente, primeiro no Médio Oriente, onde viviam Neandertais. Se nessa ocasião se misturaram entre si, então esses humanos modernos, que se tornaram nos antepassados de toda a gente fora de África, transportaram no seu genoma esta componente Neandertal para o resto do mundo. Assim, as pessoas que vivem hoje fora de África têm cerca de 2,5 por cento de ADN de Neandertais.
So having now a Neanderthal genome on hand as a reference point and having the technologies to look at ancient remains and extract the DNA, we can begin to apply them elsewhere in the world. And the first place we've done that is in Southern Siberia in the Altai Mountains at a place called Denisova, a cave site in this mountain here, where archeologists in 2008 found a tiny little piece of bone -- this is a copy of it -- that they realized came from the last phalanx of a little finger of a pinky of a human. And it was well enough preserved so we could determine the DNA from this individual, even to a greater extent than for the Neanderthals actually, and start relating it to the Neanderthal genome and to people today. And we found that this individual shared a common origin for his DNA sequences with Neanderthals around 640,000 years ago. And further back, 800,000 years ago is there a common origin with present day humans.
Portanto uma vez que temos hoje o genoma Neandertal à mão como ponto de referência e temos a tecnologia para olharmos para vestígios remotos e extraírmos o seu ADN, podemos começar a aplicá-los noutras partes do mundo. Primeiro fizemos isso no sul da Sibéria, nos Montes Altai, num lugar chamado Denisova, uma caverna nesta montanha, onde os arquéologos encontraram em 2008 um pequeno pedaço de osso - isto é uma cópia dele - e aperceberam-se que fazia parte da última falange de um dedo mínimo humano. E estava tão bem preservado que pudemos determinar o ADN daquele indivíduo, até em maior grau do que para os Neandertais, e começámos a compará-lo ao genoma Neandertal e às pessoas de hoje em dia. E descobrimos que este indivíduo partilhava nas suas sequências de ADN uma origem comum com Neandertais há cerca de 640 mil anos. E mais atrás ainda, há 800 mil anos existe uma origem comum com os humanos dos dias de hoje.
So this individual comes from a population that shares an origin with Neanderthals, but far back and then have a long independent history. We call this group of humans, that we then described for the first time from this tiny, tiny little piece of bone, the Denisovans, after this place where they were first described. So we can then ask for Denisovans the same things as for the Neanderthals: Did they mix with ancestors of present day people? If we ask that question, and compare the Denisovan genome to people around the world, we surprisingly find no evidence of Denisovan DNA in any people living even close to Siberia today. But we do find it in Papua New Guinea and in other islands in Melanesia and the Pacific. So this presumably means that these Denisovans had been more widespread in the past, since we don't think that the ancestors of Melanesians were ever in Siberia.
Portanto este indivíduo vem de uma população que partilha uma origem com Neandertais, mas muito antes e depois tem uma longa história independente. Chamamos a este grupo de humanos, que descrevemos então pela primeira vez a partir deste pequeno pedacinho de osso, Hominídeos de Denisova, a partir do local onde foram identificados. Podemos então perguntar para os Denisovanos o que perguntámos para os Neandertais: Será que se misturaram com antepassados das pessoas actuais? Se fizermos essa pergunta, e compararmos o genoma Denisovano com pessoas de todo o mundo, surpreendentemente descobrimos que não há vestígios de ADN Denisovano nem em pessoas que vivem remotamente perto da Sibéria de hoje. Mas encontramo-los sim na Papua Nova Guiné e em outras ilhas da Melanésia e do Pacífico. Isto quer presumivelmente dizer que estes Hominídeos de Denisova foram mais disseminados no passado, uma vez que não achamos que os antepassados dos melanésios tenham alguma vez estado na Sibéria.
So from studying these genomes of extinct humans, we're beginning to arrive at a picture of what the world looked like when modern humans started coming out of Africa. In the West, there were Neanderthals; in the East, there were Denisovans -- maybe other forms of humans too that we've not yet described. We don't know quite where the borders between these people were, but we know that in Southern Siberia, there were both Neanderthals and Denisovans at least at some time in the past. Then modern humans emerged somewhere in Africa, came out of Africa, presumably in the Middle East. They meet Neanderthals, mix with them, continue to spread over the world, and somewhere in Southeast Asia, they meet Denisovans and mix with them and continue on out into the Pacific. And then these earlier forms of humans disappear, but they live on a little bit today in some of us -- in that people outside of Africa have two and a half percent of their DNA from Neanderthals, and people in Melanesia actually have an additional five percent approximately from the Denisovans.
Então ao estudar estes genomas de humanos extintos, começamos a aproximar-nos do aspecto que o mundo tinha quando os humanos modernos começaram a sair de África. No Ocidente, existiam Neandertais; no Oriente, Denisovanos - talvez outros tipos de humanos também que ainda não descrevemos. Não sabemos bem quais eram as fronteiras entre estes povos, mas sabemos que no sul da Sibéria existiam tanto Neandertais como Denisovanos, pelo menos a determinada altura. Então surgiram os humanos modernos algures em África, saíram de África, provavelmente no Médio Oriente. Encontram Neandertais, misturam-se com eles, continuam a espalhar-se pelo mundo, e algures no Sudeste Asiático encontram Denisovanos e misturam-se com eles e continuam em direcção ao Pacífico. E então estas primeiras formas de humanos desaparecem, mas subsistem hoje ainda um pouco em alguns de nós - na medida em que os povos fora de África têm 2,5 por cento de ADN de Neandertal, e as pessoas da Melanésia têm aproximadamente mais 5 por cento de Denisovanos.
Does this then mean that there is after all some absolute difference between people outside Africa and inside Africa in that people outside Africa have this old component in their genome from these extinct forms of humans, whereas Africans do not? Well I don't think that is the case. Presumably, modern humans emerged somewhere in Africa. They spread across Africa also, of course, and there were older, earlier forms of humans there. And since we mixed elsewhere, I'm pretty sure that one day, when we will perhaps have a genome of also these earlier forms in Africa, we will find that they have also mixed with early modern humans in Africa.
Quer isto dizer que existe apesar de tudo alguma diferença absoluta entre os povos fora e dentro de África, na medida em que os povos fora de África têm no seu genoma um antigo componente destes extintos hominídeos, enquanto os africanos não têm? Não creio que seja assim. Presumivelmente, os humanos modernos surgiram algures em África. Também se espalharam por África, claro, e existiam por lá formas anteriores de humanos. E uma vez que nos misturámos noutro sítio, estou certo que um dia, quando tenhamos talvez o genoma de algumas dessas formas anteriores de África, descobriremos que também eles se misturaram com os primeiros humanos modernos de África.
So to sum up, what have we learned from studying genomes of present day humans and extinct humans? We learn perhaps many things, but one thing that I find sort of important to mention is that I think the lesson is that we have always mixed. We mixed with these earlier forms of humans, wherever we met them, and we mixed with each other ever since.
Portanto, em suma, o que aprendemos com o estudo dos genomas dos humanos actuais e dos humanos extintos? Aprendemos talvez muitas coisas, mas uma que penso que é digna de menção é a lição de que sempre nos misturámos. Misturámo-nos com estas antigas formas de humanos, onde quer que os tenhamos encontrado, e misturamo-nos uns com os outros desde então.
Thank you for your attention.
Obrigado pela vossa atenção.
(Applause)
(Aplausos)