At the break, I was asked by several people about my comments about the aging debate. And this will be my only comment on it. And that is, I understand that optimists greatly outlive pessimists. (Laughter)
В перерыве, меня спросили, о моем отношении к дебатам о старении. У меня есть только один комментарий по этому поводу — насколько я знаю — оптимисты живут намного дольше пессимистов. (Смех)
What I'm going to tell you about in my 18 minutes is how we're about to switch from reading the genetic code to the first stages of beginning to write the code ourselves. It's only 10 years ago this month when we published the first sequence of a free-living organism, that of haemophilus influenzae. That took a genome project from 13 years down to four months. We can now do that same genome project in the order of two to eight hours. So in the last decade, a large number of genomes have been added: most human pathogens, a couple of plants, several insects and several mammals, including the human genome. Genomics at this stage of the thinking from a little over 10 years ago was, by the end of this year, we might have between three and five genomes sequenced; it's on the order of several hundred. We just got a grant from the Gordon and Betty Moore Foundation to sequence 130 genomes this year, as a side project from environmental organisms. So the rate of reading the genetic code has changed.
В последующие 18 минут, я расскажу вам, как мы переходим от считывания генетического кода к начальным стадиям возможности писать этот код самим. Ровно 10 лет назад, мы опубликовали первую нуклеотидную последовательность свободноживущего организма, а именно, гемофильной палочки. Мы сократили расшифровку генома с 13 лет до четырёх месяцев. Сейчас, тот же самый проект по расшифровке займёт примерно от двух до восьми часов. Поэтому, за последнее десятилетие, были расшифрованы многие геномы: большинство человеческих патогенов, пару растений, несколько насекомых и млекопитающих, включая геном человека. Геномика, как она существовала чуть больше 10 лет назад, предполагала, что, к концу этого года, у нас могло бы быть расшифровано от трёх до пяти геномов; их же примерно несколько сотен. Мы только что получили грант от фонда Гордона и Бетти Мур на расшифровку 130 геномов в этом году, в свободное время от организмов, присутствующий в окружающей среде. Темп расшифровки генетического кода изменился.
But as we look, what's out there, we've barely scratched the surface on what is available on this planet. Most people don't realize it, because they're invisible, but microbes make up about a half of the Earth's biomass, whereas all animals only make up about one one-thousandth of all the biomass. And maybe it's something that people in Oxford don't do very often, but if you ever make it to the sea, and you swallow a mouthful of seawater, keep in mind that each milliliter has about a million bacteria and on the order of 10 million viruses.
Но, если посмотреть вокруг, мы лишь поверхностно изучили, что ещё есть на этой планете. Большинство даже не представляет, потому как они невидимы, но микробы составляют почти половину биомассы Земли, а все животные лишь одну однотысячную. Возможно, люди из Оксфорда делают это очень редко, но если вы всё же доберётесь до моря и проглотите полный рот морской воды, не забывайте, что каждый миллилитр содержит миллион бактерий и почти 10 миллионов вирусов.
Less than 5,000 microbial species have been characterized as of two years ago, and so we decided to do something about it. And we started the Sorcerer II Expedition, where we were, as with great oceanographic expeditions, trying to sample the ocean every 200 miles. We started in Bermuda for our test project, then moved up to Halifax, working down the U.S. East Coast, the Caribbean Sea, the Panama Canal, through to the Galapagos, then across the Pacific, and we're in the process now of working our way across the Indian Ocean. It's very tough duty; we're doing this on a sailing vessel, in part to help excite young people about going into science. The experiments are incredibly simple. We just take seawater and we filter it, and we collect different size organisms on different filters, and then take their DNA back to our lab in Rockville, where we can sequence a hundred million letters of the genetic code every 24 hours. And with doing this, we've made some amazing discoveries.
Менее чем 5 000 разновидностей микробов были изучены лишь два года назад, и мы решили это изменить. Мы запустили экспедицию Сорсерер II, где мы, как и в других океанографических экспедициях, планировали брать образцы океана каждые 200 миль. Мы начали с испытательного проекта на Бермудских островах, а потом поплыли на Галифакс вниз до Восточного побережья США, Карибского моря, Панамского канала, через Галапагоские острова, пересекли Тихий океан и в данный момент мы пересекаем Индийский океан. Это очень тяжёлая работа; мы путешествуем на парусном судне, частично чтобы заинтересовать молодёжь заниматься наукой. Сами эксперименты невероятно простые. Мы просто фильтруем морскую воду, и отбираем организмы на мембранах разного размера, затем мы пересылаем их ДНК в нашу лабораторию в Роквиле, где мы можем считывать сотни миллионов букв генетического кода каждые 24 часа. В результате этого процесса, мы сделали несколько удивительных открытий.
For example, it was thought that the visual pigments that are in our eyes -- there was only one or two organisms in the environment that had these same pigments. It turns out, almost every species in the upper parts of the ocean in warm parts of the world have these same photoreceptors, and use sunlight as the source of their energy and communication. From one site, from one barrel of seawater, we discovered 1.3 million new genes and as many as 50,000 new species.
К примеру, считалось, что визуальные пигменты нашего глаза есть ещё лишь у одного или двух организмов в среде, где так же присутствовали эти пигменты. А оказалось, что почти у всех существ в верхних слоях океана в тёплых частях мира так же есть эти фоторецепторы, и они используют солнечный свет для энергии и коммуникаций. Из одного участка, из одной бочки морской воды, мы открыли 1,3 миллионов новых генов и почти 50 000 новых организмов.
We've extended this to the air now with a grant from the Sloan Foundation. We're measuring how many viruses and bacteria all of us are breathing in and out every day, particularly on airplanes or closed auditoriums. (Laughter) We filter through some simple apparatuses; we collect on the order of a billion microbes from just a day filtering on top of a building in New York City. And we're in the process of sequencing all that at the present time.
Мы так же занялись и воздухом при поддержке гранта от фонда Слоуна. Мы измеряем, сколько вирусов и бактерий все мы вдыхаем и выдыхаем каждый день, в частности в самолётах или в закрытых аудиториях. (Смех) Фильтруя через простые аппараты; мы собираем почти миллиард микробов каждый день, фильтруя на крыше здания в Нью-Йорке. В данный момент, мы занимаемся расшифровкой всего этого.
Just on the data collection side, just where we are through the Galapagos, we're finding that almost every 200 miles, we see tremendous diversity in the samples in the ocean. Some of these make logical sense, in terms of different temperature gradients. So this is a satellite photograph based on temperatures -- red being warm, blue being cold -- and we found there's a tremendous difference between the warm water samples and the cold water samples, in terms of abundant species. The other thing that surprised us quite a bit is these photoreceptors detect different wavelengths of light, and we can predict that based on their amino acid sequence. And these vary tremendously from region to region. Maybe not surprisingly, in the deep ocean, where it's mostly blue, the photoreceptors tend to see blue light. When there's a lot of chlorophyll around, they see a lot of green light. But they vary even more, possibly moving towards infrared and ultraviolet in the extremes.
С точки зрения сбора данных, к моменту прохождения Галапагосских островов, мы открыли, что каждые 200 миль, мы видим невероятное разнообразие в образцах собранных в океане. Многое вполне объяснимо логически, ввиду градиента температур. Это спутниковая фотография отражающая температуры — красное где тепло, голубое где холодно — мы узнали, что существует огромная разница между тепловодным образцами и холодноводными, в плане количества видов организмов. Нас так же удивило, что эти рецепторы регистрируют разные длины световой волны, и теперь мы можем предсказать это, используя их аминокислотную последовательность. Они сильно отличаются друг от друга в зависимости от региона. Может быть это неудивительно, но в глубоких водах океана, где почти всё синее, фоторецепторы чаще всего регистрируют синий цвет. Там где много хлорофилла, они регистрируют много зелёного света. Они различаются ещё больше, иногда отклоняясь до инфракрасного или ультрафиолетового спектра, в неких исключительных случаях.
Just to try and get an assessment of what our gene repertoire was, we assembled all the data -- including all of ours thus far from the expedition, which represents more than half of all the gene data on the planet -- and it totaled around 29 million genes. And we tried to put these into gene families to see what these discoveries are: Are we just discovering new members of known families, or are we discovering new families? And it turns out we have about 50,000 major gene families, but every new sample we take in the environment adds in a linear fashion to these new families. So we're at the earliest stages of discovery about basic genes, components and life on this planet.
Чтобы попытаться оценить полный состав генов у нас в наличии, мы собрали все данные — включая наши на данный момент в экспедиции, что кстати является больше чем половиной всей геномной информации на планете — и получили 29 миллионов генов. Мы пробовали распределить их по семействам генов чтобы понять, какие именно открытия мы осуществили: находим ли мы новые члены существующих семейств или же мы открываем новые семейства? Оказывается, мы знаем примерно 50 000 крупных генных семейств, и каждый новый образец, собранный нами в окружающей среде линейно расширяет эти семейства. Значит, мы находимся лишь на начальной стадии открытия простых генов, компонентов жизни на этой планете.
When we look at the so-called evolutionary tree, we're up on the upper right-hand corner with the animals. Of those roughly 29 million genes, we only have around 24,000 in our genome. And if you take all animals together, we probably share less than 30,000 and probably maybe a dozen or more thousand different gene families. I view that these genes are now not only the design components of evolution. And we think in a gene-centric view -- maybe going back to Richard Dawkins' ideas -- than in a genome-centric view, which are different constructs of these gene components.
Когда мы посмотрим на пресловутое эволюционное дерево, мы находимся в правом верхнем углу, вместе с животными. Из примерно 29 миллионов генов, у нас есть около 24 000 в нашем геноме. Если собрать всех животных, наша доля возросла до 30 000 и скорее всего, может быть десять или больше тысяч разных семейств генов. Я считаю, что теперь эти гены не только составляющие компоненты эволюции. И мы мыслим в рамках гено-центричного взгляда — быть может, возвращаясь к идеям Ричарда Докинза — нежели чем в геномо-центричном взгляде, которые являются разными комбинациями этих генных компонентов.
Synthetic DNA, the ability to synthesize DNA, has changed at sort of the same pace that DNA sequencing has over the last decade or two, and is getting very rapid and very cheap. Our first thought about synthetic genomics came when we sequenced the second genome back in 1995, and that from mycoplasma genitalium. And we have really nice T-shirts that say, you know, "I heart my genitalium." This is actually just a microorganism. But it has roughly 500 genes. Haemophilus had 1,800 genes. And we simply asked the question, if one species needs 800, another 500, is there a smaller set of genes that might comprise a minimal operating system?
Синтетическое ДНК, возможность синтезировать ДНК, так же изменилось в похожем темпе как и секвенирование ДНК за последнее декаду или две, оно становится очень быстрым и очень дешёвым. Мы впервые задумались о синтетическом геноме когда расшифровали второй геном в 1995 году, это был геном mycoplasma genitalium. Теперь у нас есть хорошие футболки с надписью — «Я люблю свой гениталиум». Это всего лишь микроорганизм, но в нем порядка 500 генов. В гемофилюсе 1 800 генов. Мы задали себе вопрос — если одному организму нужно 800, а другому 500, существует ли наименьший набор генов, составляющий минимальный работающий механизм?
So we started doing transposon mutagenesis. Transposons are just small pieces of DNA that randomly insert in the genetic code. And if they insert in the middle of the gene, they disrupt its function. So we made a map of all the genes that could take transposon insertions and we called those "non-essential genes." But it turns out the environment is very critical for this, and you can only define an essential or non-essential gene based on exactly what's in the environment. We also tried to take a more directly intellectual approach with the genomes of 13 related organisms, and we tried to compare all of those, to see what they had in common. And we got these overlapping circles. And we found only 173 genes common to all 13 organisms. The pool expanded a little bit if we ignored one intracellular parasite; it expanded even more when we looked at core sets of genes of around 310 or so. So we think that we can expand or contract genomes, depending on your point of view here, to maybe 300 to 400 genes from the minimal of 500.
Мы стали работать с мутагенезом транспозонов. Транспозоны — маленькие кусочки ДНК перемещающиеся внутри хромосомы. Попадая на середину гена, они нарушают его функцию. Мы создали карту всех генов где присутствуют транспозоны и назвали их «второстепенным генами». Среда обитания оказалась очень важным фактором. Категоризовать ген как существенный или второстепенный можно только по составу его среды. Мы так же пробовали более структурированный анализ сравнивая геномы 13 родственных организмов в поиске общих элементов. Мы нашли эти общие элементы, их было лишь 173 гена в 13 родственных организмах. Эта группа расширялась, если исключить одного внутриклеточного паразита. и ещё шире, если рассматривать основной набор генов их примерно 310. Число генов в геноме меняется, смотря как считать, от 300 до 400 генов от минимума 500.
The only way to prove these ideas was to construct an artificial chromosome with those genes in them, and we had to do this in a cassette-based fashion. We found that synthesizing accurate DNA in large pieces was extremely difficult. Ham Smith and Clyde Hutchison, my colleagues on this, developed an exciting new method that allowed us to synthesize a 5,000-base pair virus in only a two-week period that was 100 percent accurate, in terms of its sequence and its biology. It was a quite exciting experiment -- when we just took the synthetic piece of DNA, injected it in the bacteria and all of a sudden, that DNA started driving the production of the virus particles that turned around and then killed the bacteria. This was not the first synthetic virus -- a polio virus had been made a year before -- but it was only one ten-thousandth as active and it took three years to do. This is a cartoon of the structure of phi X 174. This is a case where the software now builds its own hardware, and that's the notions that we have with biology.
Единственный способ доказать эти теории это создать искусственную хромосому с этим набором генов при помощи генных кассет. Оказалось, что синтезировать ДНК большими кусками, без ошибок, очень сложно. Мои коллеги, Хэм Смит и Клайд Хатчисон, разработали новый метод позволяющий синтезировать 5 000 геном вируса, в течение двух недель, без ошибок в последовательности и биологических характеристиках. Это был очень волнующий эксперимент — мы внедрили кусок синтетического ДНК в бактерию и они начали производить вирусные частицы, которые, в конце концов, её же и погубили. Это не первый синтетический вирус, за год до этого был создан полиовирус, на это потребовалось три года, и его активность не составляла и одной десятитысячной части. Это схема структуры phi X 174. В этом случае программное обеспечение создаёт своё собственное аппаратное обеспечение, как и бывает в природе.
People immediately jump to concerns about biological warfare, and I had recent testimony before a Senate committee, and a special committee the U.S. government has set up to review this area. And I think it's important to keep reality in mind, versus what happens with people's imaginations. Basically, any virus that's been sequenced today -- that genome can be made. And people immediately freak out about things about Ebola or smallpox, but the DNA from this organism is not infective. So even if somebody made the smallpox genome, that DNA itself would not cause infections. The real concern that security departments have is designer viruses. And there's only two countries, the U.S. and the former Soviet Union, that had major efforts on trying to create biological warfare agents. If that research is truly discontinued, there should be very little activity on the know-how to make designer viruses in the future.
Многие волнуются о биологическом оружии. Совсем недавно я отвечал на вопросы специальной правительственной комиссии по этому вопросу. Я считаю, что надо быть реалистичнее, нежели поддаваться воображению. Мы можем создать любой из вирусов, чей геном был расшифрован. Все начинают вопить об Эболе и оспе, но само по себе ДНК не заразно. И даже если кто-нибудь сможет синтезировать геном оспы, это ДНК заразить никого не сможет. Органы безопасности на самом деле больше озабочены спроектированными вирусами. США и бывший Советский Союз, единственные страны, с серьёзными разработками в области биологического оружия. Если эти исследования и правда прекращены, то мы не должны ожидать прогресса в навыках производства спроектированных вирусов в будущем.
I think single-cell organisms are possible within two years. And possibly eukaryotic cells, those that we have, are possible within a decade. So we're now making several dozen different constructs, because we can vary the cassettes and the genes that go into this artificial chromosome. The key is, how do you put all of the others? We start with these fragments, and then we have a homologous recombination system that reassembles those into a chromosome.
Я считаю, что одноклеточные организмы появятся в ближайшие два года. Возможно и эукариоты, о которых мы знаем, появятся в следующем десятилетии. Сейчас мы создаём несколько десятков разных геномов, потому как мы можем контролировать состав генов в искусственной хромосоме при помощи генных кассет. Самый важный вопрос — «Как внедрить все остальные?». Эти обрезки, благодаря гомологической рекомбинации, соединяются в единую хромосому.
This is derived from an organism, deinococcus radiodurans, that can take three million rads of radiation and not be killed. It reassembles its genome after this radiation burst in about 12 to 24 hours, after its chromosomes are literally blown apart. This organism is ubiquitous on the planet, and exists perhaps now in outer space due to all our travel there. This is a glass beaker after about half a million rads of radiation. The glass started to burn and crack, while the microbes sitting in the bottom just got happier and happier. Here's an actual picture of what happens: the top of this shows the genome after 1.7 million rads of radiation. The chromosome is literally blown apart. And here's that same DNA automatically reassembled 24 hours later. It's truly stunning that these organisms can do that, and we probably have thousands, if not tens of thousands, of different species on this planet that are capable of doing that. After these genomes are synthesized, the first step is just transplanting them into a cell without a genome.
Это получено из организма deinococcus radiodurans. Оно не умирает даже при радиации в три миллиона рад. Ему требуется от 12 до 24 часов, чтобы произвести собственный геном после облучения радиацией, раздирающей хромосомы на части. Это организм существует повсеместно на нашей планете и скорее всего теперь есть и в космосе, благодаря нашим полётам туда. Это стеклянная мензурка после полмиллиона рад облучения. Стекло обожжено и потрескалось, а вот микробы живут припеваючи. Вот схема того, что произошло: в верхней части вы видите геном после облучения в 1,7 миллионов рад. Хромосому разорвало на части. Спустя 24 часа тот же самый ДНК автоматически восстановился. Это невероятно, что есть организмы способные на это и скорее всего, есть тысячи если не десятки тысяч разных организмов на этой планете, которые способны на это. Как только эти геномы синтезированы нужно переселить их в клетку без собственного генома.
So we think synthetic cells are going to have tremendous potential, not only for understanding the basis of biology but for hopefully environmental and society issues. For example, from the third organism we sequenced, Methanococcus jannaschii -- it lives in boiling water temperatures; its energy source is hydrogen and all its carbon comes from CO2 it captures back from the environment. So we know lots of different pathways, thousands of different organisms now that live off of CO2, and can capture that back. So instead of using carbon from oil for synthetic processes, we have the chance of using carbon and capturing it back from the atmosphere, converting that into biopolymers or other products. We have one organism that lives off of carbon monoxide, and we use as a reducing power to split water to produce hydrogen and oxygen. Also, there's numerous pathways that can be engineered metabolizing methane. And DuPont has a major program with Statoil in Norway to capture and convert the methane from the gas fields there into useful products.
Поэтому, мы считаем, что синтетические клетки очень важны не только для биологических задач, но и для проблем окружающей среды и общества. Например, третий секвенированный организм, был methanococcus jannaschii, процветающий даже в кипящей воде. Этот организм растёт на водороде, а весь требуемый углерод он получает из углекислого газа в окружающей среде. Мы знаем много разных процессов и тысячи организмов, потребляющих углекислый газ. Мы можем делать тоже самое. И вместо потребления углерода из нефти для синтетических процессов, мы могли бы использовать углерод из нашей атмосферы перерабатывая его в биополимеры или иные продукты. Есть организм, потребляющий монооксид углерода и при помощи окислительных процессов мы расщепляем воду для производства водорода или кислорода. Есть несколько процессов, которые могут быть адаптированы для усвоения метана. DuPont и Statoil запустили крупную программу в Норвегии по переработки метана на газовых месторождениях в полезные продукты.
Within a short while, I think there's going to be a new field called "Combinatorial Genomics," because with these new synthesis capabilities, these vast gene array repertoires and the homologous recombination, we think we can design a robot to make maybe a million different chromosomes a day. And therefore, as with all biology, you get selection through screening, whether you're screening for hydrogen production, or chemical production, or just viability. To understand the role of these genes is going to be well within reach.
Я уверен, что скоро появится новая наука — «Комбинаторная Геномика», благодаря современному синтезу, множеству генов и гомологической рекомбинации. Мы надеемся спроектировать робота, способного синтезировать миллион хромосом за один день. Следовательно, как и во всей биологии, нам будет доступно обнаружение благодаря отбору. Не важно, какие качества вас интересуют — производство водорода, иных химикатов или просто жизнеспособность. Так же мы сможем узнать о роли каждого из этих генов.
We're trying to modify photosynthesis to produce hydrogen directly from sunlight. Photosynthesis is modulated by oxygen, and we have an oxygen-insensitive hydrogenase that we think will totally change this process. We're also combining cellulases, the enzymes that break down complex sugars into simple sugars and fermentation in the same cell for producing ethanol. Pharmaceutical production is already under way in major laboratories using microbes. The chemistry from compounds in the environment is orders of magnitude more complex than our best chemists can produce. I think future engineered species could be the source of food, hopefully a source of energy, environmental remediation and perhaps replacing the petrochemical industry.
Мы хотим изменить фотосинтез на производство водорода, используя солнечный свет. Фотосинтез контролируется кислородом, но у нас теперь есть гидрогеназа, не требующая кислорода. Это полностью изменит весь процесс! Мы соединили целлюлазы, энзимы, расщепляющие олигосахариды, и ферментацию в единой клетке для производства этанола. Несколько крупных лабораторий уже занимаются производством этих клеток в микробах. Производство химических соединений в окружающей среде на порядок сложнее, чем любой синтез в руках наших лучших химиков. Искусственные организмы могут стать источником еды, и я надеюсь, энергии восстановления природы и возможно, заменят нефтехимическую индустрию.
Let me just close with ethical and policy studies. We delayed the start of our experiments in 1999 until we completed a year-and-a-half bioethical review as to whether we should try and make an artificial species. Every major religion participated in this. It was actually a very strange study, because the various religious leaders were using their scriptures as law books, and they couldn't find anything in them prohibiting making life, so it must be OK. The only ultimate concerns were biological warfare aspects of this, but gave us the go ahead to start these experiments for the reasons we were doing them.
Позвольте закончить моё выступление обзором этических и политических исследований. В 1999, мы задержали свои эксперименты на полтора года, пока мы не прошли биоэтическую экспертизу, которая пыталась решить, стоит ли нам пытаться создать искусственный организм. В этом участвовали представители всех крупных религий. Это был очень странный процесс, все религиозные деятели применяли священные писания для консультации по юридическим вопросам, но так и не нашли запрета на создание жизни. Основное опасение чаще всего было по поводу биологического оружия, но нам всё же разрешили продолжить эксперименты, основываясь на наших заявленных целях.
Right now the Sloan Foundation has just funded a multi-institutional study on this, to work out what the risk and benefits to society are, and the rules that scientific teams such as my own should be using in this area, and we're trying to set good examples as we go forward. These are complex issues. Except for the threat of bio-terrorism, they're very simple issues in terms of, can we design things to produce clean energy, perhaps revolutionizing what developing countries can do and provide through various simple processes. Thank you very much.
Фонд Слоуна спонсирует исследования в нескольких организациях с целью понять и оценить риск и пользу для общества, а так же установить правила для исследователей в этой области. Мы пытаемся показать правильный пример подражания. Это всё очень сложные вопросы. Естественно за исключением биотерроризма, всё очень просто, учитывая, что у нас есть шанс радикально изменить происходящее в развивающихся странах путём элементарных процессов для производства экологически чистой энергии. Спасибо!