Directed Evolution

Selection with a Goal

Carrots weren’t always orange. The vividly-colored vegetable we know today was developed by gardeners in the Netherlands in the 16th century. A keen observer of Dutch paintings of market stalls and kitchen scenes will notice orange carrots in 16th century paintings and paler, yellow carrots in paintings from before that time [1]. The wild mustard plant is a weed-like plant with long stems and small yellow flowers. Over the course of centuries, farmers cultivated different vegetables from the mustard plant by modifying its traits; for instance, suppressing flower development eventually led to the broccoli plant. Kohlrabi, kale, cabbage, cauliflower and brussel sprouts are also descendants of the wild mustard plant [2]. If you look at an equivalent process in animal domestication, it took thousands of years for coarse-haired mountain sheep to become fluffy white bundles that dot green meadows [3]. These examples of plant cultivation and animal breeding are known as artificial selection. Natural selection is the process of adaptation caused by the environment, artificial selection is under human control. The plants and animals with the desired traits – crunchier stalks, uniform hair fibers – were allowed to reproduce, accelerating evolution for human purposes [4]. In his lecture on genetically modified organisms, the Nobel Laureate Sir Richard Roberts noted that with the exception of fish, everything we eat today has been genetically modified in this manner.

Richard Roberts notes that with the exception of fish, everything we eat today has been genetically modified.
(00:04:00 - 00:05:35)

The complete video is available here.

Julia Jansing, a post-doc who participated in the panel on gene editing during the 70th Lindau Nobel Laureate Meeting, further explained problems with public awareness with what she called, “the false dichotomy between natural and modern agriculture”:

Julia Jansing addressing "the false dichotomy between natural and modern agriculture".
(00:46:11 - 00:49:58)

The complete video is available here.

Evolution Under the Microscope

The processes of natural or artificial selection are not linear. It is very much a “trial and error” method, with many dead-ends as a result. In 1986, the Nobel Laureate Konrad Bloch mentioned the term “biological tinkering”, which was first used by another Nobel Laureate, the biologist François Jacob.

Konrad Bloch mentioned on “biological tinkering”.
(00:17:08 - 00:18:05)

The complete video is available here.

With the development of molecular biology, “tinkering” became achievable at the molecular scale, leading the way to genetic engineering. The new technologies of the last several decades have made it possible to modify the sequence of specific proteins – evolution in a test tube, but with the advantage of gaining a new function or purpose of the protein. Directed evolution uses genetic change and selection to create proteins that may have very useful applications [5]. The first experiments demonstrating that directed evolution was feasible were carried out by Frances Arnold in 1993. Arnold and her team worked on enzymes, which are proteins that catalyze biochemical reactions, or in the words of Arnold, “molecular machines that perform chemistry no human has matched or mastered.” [6] Arnold won half of the Nobel Prize in Chemistry in 2018, “for the directed evolution of enzymes.” In this lecture fragment, she explains why enzymes are so fascinating and how the impressive abilities of evolution can be put to use:

Frances H. Arnold on fascinating enzymes and how the impressive abilities of evolution can be put to use.
(00:03:14 - 00:05:27)

The complete video is available here.

The Search for the Substance Responsible for Catalysis

“For close to five thousand years we have made use of microbial enzymes to brew beer and leaven bread,” wrote Frances Arnold in her Nobel lecture. However, it wasn’t until the 1830s that the concept of catalysts, substances that can speed up chemical reactions, was perceived. In 1833, Anselme Payen and Jean-François Persoz discovered what they called diastase but is now known as amylase – the enzyme that breaks starch down into sugar [7]. Two years later, the Swedish chemist Jöns Jacob Berzelius came up with the term “catalysis”, but the term “enzyme” was first used in 1877 by Wilhelm Kühne, who had also isolated the pancreatic enzyme trypsin, which facilitates the hydrolysis of proteins [8, 9]. The Nobel Laureate Emil Fischer introduced the lock-and-key model in 1894, where the enzyme (lock) and the substrate (key) have the appropriate geometry to bind together and carry out the reaction. Despite these advances, nobody knew what an enzyme actually was from a biochemical standpoint. The puzzle was solved by James B. Sumner in 1926, who crystallized urease and demonstrated that it was a protein. “All enzymes are proteins but not all proteins are enzymes”, said Sumner in his Nobel lecture, “Chemical Nature of Enzymes” [10]. Fischer’s lock-and-key theory was altered by the time Sumner received his Nobel Prize in 1946. William Lipscomb explained in Lindau in 1980, that “enzymes are not just inert templates on which the reaction occurs (...), enzymes do chemistry.”

William Lipscomb on the functions of enzyme action.
(00:30:43 - 00:31:44)

The complete video is available here.

Lipscomb concluded his lecture by saying that, “Enzyme-catalyzed reactions proceed very rapidly compared with most of the models. Enzymes do indeed use ordinary chemical mechanisms, but they use the specific binding interactions to help speed up reactions (...).”

The regulatory mechanisms of enzymes, in this case proteases (enzymes that catalyze the degradation of proteins), were explained by Nobel Laureate Robert Huber in Lindau in 2019. Huber presented the diversity of these enzymes and the clever control methods they employ, which prevent them from destroying our own bodies.

Robert Huber on the regulatory mechanisms of enzymes.
(00:27:07 - 00:32:13)

The complete video is available here.

“I strongly believe that, through the products of organic synthesis, it will be possible to gain influence over the development of organisms and to produce changes that surpass all that can be achieved by conventional breeding.” – Emil Fischer, 1917, Nobel Prize in Chemistry 1902 [11]

In the 1940s and 1950s, there were numerous discoveries of individual proteins, their structures and mechanisms. But at around the same time, a new molecule arrived at the scene; once the structure of DNA was revealed in 1953, the fields of protein and DNA chemistry developed in parallel [12]. Tellingly, the Nobel Prize in Chemistry in 1958 was awarded to Frederick Sanger for deciphering the amino acid sequence in the hormone insulin, the first protein to be sequenced, and in the same year, half of the Nobel Prize in Physiology or Medicine went to George W. Beadle and Edward L. Tatum for proposing the “one gene – one enzyme” theory. They carried out experiments where the Neurospora fungi was treated with x-rays, creating mutants that were unable to synthesize vitamin B6. “Inability to synthesize vitamin B6 is apparently differentiated by a single gene from the ability of the organism to elaborate this essential growth substance,” concluded Beadle and Tatum in their research paper; consequently, changing a specific gene determines whether an enzyme is produced by an organism or not [13]. Astonishingly, these experiments on genes were carried out in 1941, a few years before it was established that DNA was the carrier of genetic information.

The biochemistry of nucleic acids spurred the interest of enzymologists and biochemists, as described here by Michael Smith in Lindau in 1995. Smith’s mentor and 1968 Nobel Laureate H. Gobind Khorana, used enzymes to build short DNA molecules, a discovery that led to the first synthesis of a gene [11]. Further discoveries, namely, of restriction enzymes, which can cut out specific sections of DNA; DNA-ligases, responsible for joining or repairing DNA fragments; or DNA polymerases, which duplicate a cell’s DNA before replication, changed not only the perception of enzymology, but formed the basis of recombinant technology and genetic engineering.

The extract of Michael Smith' lecture “Synthetic DNA and Biology” (1995), that is relevant for this paragraph, goes from 6:00 – 7:11. The complete audio of the lecture is available here.

It now became possible to insert DNA from one organism to another, for example to produce human proteins in bacterial cells. This had an enormous impact on the production of pharmaceuticals. The first recombinant protein to be used commercially was insulin, grown in E. coli cells. Since 1982, this technology has been used to produce human insulin, widely replacing animal-sourced insulin from pigs and cows [12]. The growing market of the industrial application of enzymes was mentioned by Nobel Laureate Christian B. Anfinsen in 1989:

Christian Anfinsen on the growing market of the industrial application of enzymes.
(00:08:08 - 00:09:25)

The complete video is available here.

The Path Towards Directed Evolution

The widespread synthesis and use of existing enzymes for various purposes is in itself remarkable but finding new proteins as a result of artificial mutations in genetic material significantly expands the possibilities for discovery.

Werner Arber, who was awarded the Nobel Prize in Physiology or Medicine in 1978 for the discovery of restriction enzymes, gave an overview of the types of mutations during a lecture in Lindau in 2009:

Werner Arber (2009) - Molecular Darwinism

The name of Charles Darwin was mentioned earlier this morning and I think it is good to devote one lecture to Charles Darwin’s ideas on evolution, biological evolution. I will do that. Please do not expect that I explain you the origin of life, nor the very early evolution when life just started. But however, what we can do scientifically is look at the living beings among us today and try to understand how evolution works at the level of molecules. And I think in this audience of chemists I do not need to explain what I mean with molecules. Darwin, it’s 150 years ago that he published his important book in which he explained his ideas on how evolution works in the living world. It was, one can say, a theory of natural selection and he of course also realised that within a species of a given kind of organism not all individuals are alike. They show some phenotypic variations and he called that variance. And this mixture of variance are steadily submitted to natural selection. Nature prefers some of these variants and in fact inhibits some other variants. I will throughout my talk take that as the basic knowledge. It’s only a few years later that Gregor Mendel introduced genetics, this however took quite some time until about the beginning of the 20th century that classic genetics took really its start mainly with higher organisms. And around 1940 there was the so-called modern evolutionary synthesis stating that spontaneous mutants occurring in the genetic information of these living beings were actually the reason for the appearance of phenotypic variance. At that moment the gene was an abstract concept, no one had any answer what the gene is. And one felt at that moment still near the middle of last century that one knew that probably chromosomes are the carrier of genetic information. Chromosomes being composed of nucleic acids on the one hand and a lot of different proteins on the other and some matter substances. Since proteins are much more complex one felt that the genes are probably the protein components of the chromosomes, rather than the nucleic acids. An answer to that question came in then by microbial genetics, I will outline that just in a small moment. And I just wanted to make clear that Friedrich Miescher another few years later in the 19th century described for the first time nucleic acids and, as we know, DNA is the carrier of genetic information, will then be described later on, I come back to that. And together with our knowledge from microbial genetics with nucleic acid biochemistry that the molecular genetics have developed, and at that moment it is the time to make another synthesis between molecular genetics and evolutionary biologies and I called that either molecular evolution or molecular Darwinism. Actually, it’s not only that we know that gene activities are the substrate for natural selection but that mechanisms of genetic variation have now become known and this is the main content of my talk of today. So let’s have a view at the early times of microbial genetics. It’s relatively late that people have identified that not only higher organisms but also bacteria and their viruses have genes and can mutate. So one could do genetic investigations with these relatively simply micro organisms. There were three principle fundamental experiments of microbial genetics which were rather rapidly then described. First of all by Avery, MacLeod and McCarty, the transformation, this is taking from one kind of bacterial strains the DNA out and mixing it with other bacterial, perhaps which are related to those, and DNA can penetrate and give some properties which actually were the properties of the donor strain. In conjugation it's two bacterial cells which mate with each other, this is a kind of sexual mating and a part or sometimes even all of the chromosome can be transferred from one cell to another. Here a plasmid serves as gene vector, I mentioned that just for those of you who are familiar with these nomenclatures. In transduction you grow a virus in one of the strains, here the blue strains, and with low frequency rather than to build into the viral particles of the progeny, one can see that sometimes a small fragment of the genome of the host cell becomes integrated and upon infection that DNA fragment gets inside. So here obviously the gene vector is a virus. In conjugation, one has seen, looking at various markers on that genome, genetic mutants are serving as markers, that the DNA gets transferred linearly. You can interrupt a mating every few minutes and see which markers have already entered the cell. Therefore from these experiments it looked as if the genes would be on a long filamentous molecule. That was also obvious here. And what these authors did in transformation, they cleaned the bacterial DNA from the blue strain very carefully, from any proteins which are usually attached to the DNA, also in bacteria. Proteins and any other molecules which were attached were cleaned away and it could be shown that this highly purified DNA was actually giving properties from the blue strain to the green one while all the other fractions like proteins and so on didn’t give anything. So in 1944 it was clearly shown that DNA is the carrier of genetic information. You can imagine that the biologists didn’t pay much attention to that, most of evolutionary biologists anyhow at that moment were interested to study the evolution from higher animals to human beings. Or perhaps some of the plants also, but not for bacteria. So then Watson and Crick published a few years later, 1953, the structure of this DNA molecule which was a double helix. And they could explain by the linear arrangement of nucleotides that that might be the letters, as in our written language, putting just one letter behind another, could be the genetic message. That, later on, turned out to be indeed so. So let’s go further, for those of you who are not so familiar with microbial genetics, E.coli bacteria have just one circle molecule, symbolically drawn here, of nearly five million base pairs. And symbolically I draw a gene here with the reading frame which encodes for mostly a protein, sometimes it’s also an RNA molecule and of course at various sides there are expression control signals on which other proteins interact to have the gene expressed whenever the product is needed and the right amount. And now, if you define in this view a mutation as an alteration of the nucleotide sequence, which symbolically I put here flat. If you change this 8p base pair by a CG, that’s already a local mutation and if this is in the middle of the reading frame, it may or may not affect the gene product. If you may put that in an expression control sequence, it may increase or decrease the amount of products brought or it could inactivate completely the gene. So you see how particular mutations can have direct effects on the product side. Now, you may have been surprised in my definition of a mutation. We have to be aware that in the biological literature one uses two types of definitions for the word mutation. In classical genetics I mentioned these people did not know what a gene is and that there are genes on DNA. So they could see phenotypes and the definition for a mutation was an altered phenotype that is transmitted into the progeny. Not only in the first progeny, second, third, and so on. One has to be careful here, because there are epigenetic phenomena which also affect the transmission and sometimes fade away rapidly after one or two generations. So these are not real genetic mutations. In molecular or reversed genetics one defines an altered nucleotide sequence as a mutation. So there is this distinction, of course I should explain to you that if you take this mutation, alteration of the sequence of nucleotides that only rarely mutation is favourable or useful and gives selective advantage. Much more often a mutation is unfavourable, gives selective disadvantage. That means that at the longer term these mutants are eliminated again from the population. Some are immediately eliminated because some of these mutations are lethal. But also very many mutants are without immediate effect on the life processes and these are called silence and neutral mutations. There are several reasons. I have no time to explain you, one knows why this is so. So if you see this general knowledge, there is no good evidence that any novel mutation would be directed by some need. For example bacteria: I know that bacteria have no senses to know when they come into completely different environment to change a particular gene in a particular way, in order to facilitate the life under these novel environmental conditions. Many investigations have to be done to see whether there is this possibility. And all these experiments finally turned out to be not really meaningful, they could explain if effects were seen, some effects could be explained just by other reasons which were behind. So this is a general thing that none of these mutations are really a response to an identified need to have a particular gene function available. Now, also just for this reason, because many mutants are unfavourable, tolerable mutation rates have to be kept very low. So mutation cannot be tolerated at occurring at high rates in living beings. Now, this is neo-Darwinian evolution, I call this ‘the three pillars’. I mentioned genetic variation, that’s a mutation. And this is the driving force of evolution. If the genome would be entirely stable from generation to generation, there wouldn't be any possibility to evolve. Then the availability of variants together with its parents, non mutant, are steadily submitted to natural selection. And this directs where evolution goes on the tree of evolution, which I show you a little bit later. The third pillar is isolation, either by reproductive isolation, particularly in sexual organisms, one cannot get progeny with widely diverse living beings. And geographic, Charles Darwin has learned a lot for example on Galapagos Islands, where these living beings were separated from the mainland and have particular other phenotypic variations. So that modulates the evolution. This is a general view and I like to explain you now the basis of genetic variation. How does one do experiments? Nowadays it’s quite nice. Since ten, twenty years one can compare nucleotide sequences from a particular gene, even from a part of a gene which we call a functional domain. Groups of genes or the entire genome. And from that, where there are always some differences, the further apart evolutionary relatedness is one can conclude on what may have happened in the relatively recent past. Since the separation of these two kinds of living beings. However, that is unfortunately not yet a proof, we would like to see individual mechanisms on work on how the processes actually to generate the genetic variant goes case by case studies. This can most easily be done with the most simple living beings, that is bacterial cells and also bacterial viruses or other viruses. The outcome is that there are more than one specific process and I mentioned in particular specific process, you will see, I will explain you - without going into any detail because time is short. But I will explain you what I mean with that. Now, with bacteria, bacteria are haploid, unicellular organisms. Haploid means they have only one of these chromosomes. Of course there will be, before cell division occurs, two identical chromosomes as produced by replication. And one goes into each daughter cell. That takes about half an hour for E.coli bacteria, with which we usually work, under the appropriate growth conditions. And then after an hour we have four and so on. Now, once in a while there is a spontaneous mutation occurring this one is not little, it has progeny and this is little and has no progeny and so on. Now, the drawing is a bit misleading. Don’t believe that once you have four cells, the first mutation occurs. It’s once, about 300 identical cells are here, that the first mutation appears. So spontaneous mutagenesis is a rare event, must be a rare event. The nice thing of haploidy is that the phenotype is fast expressed, so you can see the effect of the mutation quite rapidly. All of these mutations express their phenotypes and you will have sooner or later mixed population, as drawn here, which are of course parental mutant forms and steadily submitted to natural selection. This is a summary of what we microbiologists know today. There are, you see again on the left side that genetic variation or mutagenesis. On the right side I have natural selection and isolation up here. So let’s concentrate on the left side. I mentioned that a number of different specific sources of mutagenesis are known and what I write here is just simplifying replication in infidelities. That includes several known forms of infidelities in the replication. Some of the mutagens are in the living cell, already in the body, some others are environmental radiation, for example, or chemical substances. And another source of mutagenesis is a combination of reshuffling within the genome. Then there is also a phenomenon of horizontal transfer, I have shown that already in the bacterial genetics explanation, I will come back to that later on. And when one realises that of course these are not specific, these are groups of specific processes and I like to explain a little bit what's behind. Now, before I go to that let’s just see, many of these replications infidelities are just local sequence changes. A substitution by one nucleotide by another, a deletion of one nucleotide, an insertion of a adjacent nucleotide upon replication and similar things perhaps mingling up a few adjacent nucleotides, very local. The rearrangement concerns fragments of the size of a gene or a very few genes in general. And I will explain you that this is often by the recombinational, reshuffling processes. By horizontal gene transfer I call this DNA acquisition, acquisition of genetic information from another kind of living being. So I just like, many of you are really chemists and you will like that. You will understand that. One source of replication infidelity, probably a quite important source, is that adenine when it normally pairs with thymine gives the space pairing and this is of course when DNA replicates, the base pairing opens. The DNA polymerase fills in the partner nucleotide and to adenine it should always be a thymine. But if that hydrogen atom is down here for a short period of time in an isomeric tautomeric form of adenine, thymine doesn’t make correct base pairing. It so happens that cytosine can base pair with this tautomeric form relatively good. And when after a fraction of a second the normal form is coming back, either it is up here, we have a mispairing. So that’s a potential source of nucleotide substitution. Now, I think, as far as we know, all studied living beings have enzymatic repair systems to identify such mispairings in the status of genesis of these mispairings very rapidly, and put it back to normal as soon as the normal form is reappearing. How do the repair systems do that? They must in fact, many of them - not quite all, but many of them - can identify which is the parental strand and which is the newly inserted partner. And they of course do not do the repair in the mispairing on the parental strand, but on the partner. And one way to identify the parental strand is looking on metal groups. We must know that behind the replication fork, with some delay, uncertain sequences, metal groups are attached to some of the nucleotides and that marks then the strand as a parental. Shortly after replication, new strands have not yet reached metal groups. So nature is very inventive and knows how to do these things. Here is a list, I do not have time to go through all these in detail. In transformation, you have already seen, this is the process to bring a DNA from one kind of bacteria into another. It usually works fine if the strains are just the same bacterial strain but distinguished by one or two or three mutations. But as soon as you go a bit further, related strains, you get into trouble. I will explain you why. This is true for transformation, for conjugation and for virus-mediated transduction, you have seen these things before. And I will now show you what the reasons are. Why in fact sometimes you get low efficiency of these processes. Of course, surface compatibility must exist. For example, these viruses must find a way to absorb and inject their DNA into the new host. Penetration through the cell wall, the same as in conjugation and free DNA molecules sometimes in some bacteria are taken up actively. In other bacteria they try to diffuse in with low efficiency. Then, practically all bacterial strains have one or a few restriction modification systems, these are systems able to identify if foreign DNA comes in or DNA from the same kind of bacteria as are infected. I will show you just afterwards how that works. Then functional compatibilities have to be considered in order to have a gene which comes in from another organism. If it doesn’t integrate into the genome in a stable way, it’s going to be lost rapidly. And, of course, then if it’s expressed, it’s a matter of knowledge whether the harmony of the cell is maintained, sometimes improved or most of the time inhibited, harmony destroyed. So that is not being maintained, of course. So the harmony can best be obtained if only a small segment of DNA is accepted, that can be one gene, sometimes only a functional domain. Or very few genes but not half a genome. That you usually doesn’t function. That’s natural strategy here, which we learn from these processes. Now, just one word to the restriction, for which, together with two American colleagues, I got the Nobel Prize 30 years ago. We had been working on the so-called type 1 restriction enzymes. I like to explain first the type 2, because these are those which many of you work in the laboratory. These are enzymes, each has its particular name, that’s Eco R1. This enzyme identifies the sequence GAATTC - you’ll see it’s also in both sides like that. And if there is no metal group attached to that adenine here, and to that adenine, unmethylated then, the DNA is cleaved in that way reproducibly. These enzymes, since they do cleave DNA reproducibly, and of course since there are these relatively short sequences are at various locations, then that fragments longer DNA molecules into handable fragments and these enzymes were used to produce these fragments and to analyse them, sequence analysis and functional analysis. The enzymes with which we had been working first were from Eco K12, this is Eco K1, it identifies again AACGTGC and any six nucleotides in between space. So that sequence is recognised by these restriction enzymes. They do not cleave here but they fix, they stay fixed there on that side and start to rope through the DNA. You can see that loop growing and growing in the electron microscope. It’s quite nice. So it continues here symbolically, this translocation goes in one direction. It goes also in the other but it’s irrelevant for that. But since there are more than, on longer DNA molecules there are others of these sides. The enzyme may also fix here. Certainly not simultaneously at the same time. Therefore here a fixation of the enzyme in time is translated into a cutting in space at various sides. When in fact these two translocation complexes run into each other. About half of all restriction modification systems are of one type, half of the other type. There are third types and so on, which are minor populations. So you see, nature is very inventive. And particularly this one I call a variation generator. Any of these fragments upon infection is cut at a different side. Evolutionary that’s quite interesting because in the Type 1 and Type 2 enzymes all is cut. Maybe that sequence is in the important gene. If it is cut it cannot acquire it. But here anything can be acquired in small steps. So evolutionary this is much more better for nature and probably that’s why, I mean there is some flexibility in nature to have all these different ways to do it. It shows you that, once you have explained something in nature, don’t believe that’s true for all of these things. Often the same purpose can be obtained by other means also. The evolutionary tree ... I draw it with horizontal connectors and these connectors of course are only for transferring genome fragments, they are just put there randomly. There’s no rule when that happens. The vertical flux is familiar to you, the whole genome. Now, Charles Darwin explained to us that living being have common ancestors. And in view of the horizontal transfer, in which gene functions are transferred horizontally, we have also common future. That’s a philosophical view which I would like to give you. I conclude with a few additional considerations. This is a summary of the three strategies, local sequence change, DNA rearrangements and DNA acquisition. I explained to you how that works, but as far as the quality of contribution to evolution, each strategy has its own quality. Here its search for the improvement of available biological functions. This search for improve also available capacities by fusing segments of genes with other segments of genes, or by fusing an open reading frame with an alternative reading control of the gene expression. The acquisition has a completely other quality, namely a sharing in successful development made by others. So from that, in one single step of acquisition, you can acquire a new capacity, which you didn’t possess before. I mentioned enzymes already. Repair enzymes, restriction enzymes. These are modulators of the frequency of genetic variation to keep the rate of mutagenesis very low, tolerably low. There are actual variation generators in the list of recombination enzymes. I had no time to explain to you all the details, but some of these are so-called mobile genetic elements and they act really, that has been shown, as variation generators inserting once in a while low rates at various places. Then, all the recombination enzymes giving rearrangements internally are also enzymatically guided. So these I call evolution genes because many of these enzymes which have been studied are non-essential for normal bacterial growth. They serve for evolution. And we think that their own evolution had been in the far past selected for doing the right job. They work together with non-genetic elements, we had seen the tautomeric forms and there are other reasons, random counter of virus carrying genes around and so on. So natural reality takes actively care of biological evolution. And I feel that text books should be corrected. In many text books, still nowadays, you see that spontaneous mutations are called ‘errors’ or ‘accidents’ to the DNA. That’s the wrong attitude towards nature. Nature uses for example tautomeric forms in order to produce mutants, local mutants and the available repair systems keeps these rates tolerably low. Where are the genes, these evolution genes? They can only be in the genome of bacteria, of me, human beings. So the genome has a duality. Many genes, housekeeping genes, genes for developmental genes in higher organisms, genes for particular living conditions. They serve for the fulfilment of these individual lives. But in the same individual are genes which are responsible for further evolutionary development. For the expansion of life and these are the sources of biodiversity. Restoration of lost biodiversity is slowly happening. It doesn’t happen from one year to another but in long periods of time. All that gives guarantee that biodiversity, under changing environmental conditions, life can go on. This is my last - you may ask is what I told you on bacteria and bacteria viruses. They are also relevant for me, for animals, for plants. I think it is. And I expect, without knowing whether this is absolutely correct, that any living being has its evolutionary fitness when it is equipped with at least one, ideally more than one of the specific mechanisms for each of these three strategies – local, internal rearrangement and acquisition. Then evolution can go on. It’s also important that the rates are kept low, as I mentioned. And then, with bacteria, we do know that some bacteria - when they form colonies, all of a sudden, on the outside of that colony cells do other things than those inside. So there is some tendency to differentiate and I think if at some time that continues, these colonies like to stick together and then already we have a primitive multi-cellular organism. Later on symbiosis may play a big role. I have only relatively recently learnt that in my body I carry about 1kg of bacteria around, and you do too and they help my life. They are not pathogenic, they are not my enemies, symbiosis. And many of these are intercellular. And if you live for decades together, finally this is a cohabitation which favours occasional rare gene transfer from one to another. So I see this as an additional way really for evolution. One has just to know that evolution is a stepwise thesauring. Means accumulating functions which have been accepted by natural selection, will be maintained as long as the conditions require that. And that leads not only to higher complexity but also to higher biodiversity. If talking on higher animals and plants, I just should say that some of these by me defined evolution genes are also of relevance and exert their functions at a somatic level. Probably the best example is our immune system which just follows the bacterial variation by rearrangement and somatic mutagenesis, but of course that’s done not in the germ line but at the somatic level. So I think we need lots of work and insight, particularly on higher organisms. But the basis of all that knowledge which I tried to transfer to you is really anchored in the micro-biogenetics. Thank you for your attention.

Der Name Charles Darwin wurde heute morgen bereits erwähnt, und ich denke es ist gut, eine Vorlesung Charles Darwins Ideen über die Evolution, die biologische Evolution, zu widmen. Ich werde das tun. Bitte erwarten Sie nicht, dass ich Ihnen den Ursprung des Lebens erkläre oder die sehr frühe Evolution des Lebens, nachdem es eben erst begonnen hatte. Was wir jedoch auf wissenschaftliche Weise tun können ist Folgendes: die uns heute umgebenden Lebewesen betrachten und zu verstehen versuchen, wie sich die Evolution auf der molekularen Ebene vollzieht. Und ich denke, dass ich vor diesem Publikum aus Chemikern nicht erklären muss, was ich unter einem Molekül verstehe. Darwin veröffentlichte sein wichtiges Buch vor 150 Jahren. Er erläuterte darin seine Ideen darüber, wie es zur Evolution in der Welt des Lebens kommt. Man kann sagen, dass es eine Theorie der natürlichen Zuchtwahl war, und er erkannte natürlich auch, dass nicht alle Individuen einer Art identisch sind. Sie zeigen ein gewisses Maß an phänotypischer Vielfalt, und er bezeichnete dies als Variation. Und diese Mischungen der Varianten sind ständig der natürlichen Auslese unterworfen. Die Natur bevorzugt einige dieser Varianten und blockiert einige andere. Während meines gesamten Vortrags werde ich dies als Grundwissen voraussetzen. Wenige Jahre später begann Gregor Mendel das Studium der Genetik. Es dauerte allerdings noch einige Zeit, bis die klassische Genetik zu Beginn des 20. Jahrhunderts, hauptsächlich durch das Studium höherer Organismen, ihren Anfang nahm. Und um das Jahr 1940 kam es zur modernen, sogenannten synthetischen Evolutionstheorie, die behauptet, dass spontane Mutationen in der genetischen Information der Lebewesen der Grund für das Auftauchen phänotypischer Variationen sind. Zum damaligen Zeitpunkt war das Gen ein abstrakter Begriff, niemand hatte eine Vorstellung davon, was das Gen ist, und noch in der Mitte des letzten Jahrhunderts meinte man, man wisse, dass die Chromosomen wahrscheinlich Träger von Erbinformation sind. Chromosomen bestanden einerseits aus Nukleinsäuren und andererseits aus einer Vielzahl verschiedener anderer Proteine sowie aus einigen weiteren Substanzen. Da die Proteine wesentlich komplexer sind, nahm man an, dass die Gene, statt den Nukleinsäuren, wahrscheinlich den Proteinkomponenten der Chromosomen entsprachen. Eine Antwort auf diese Frage kam dann aus der Genetik der Mikroben. Ich werde das ein wenig später genauer ausführen. Ich möchte lediglich klarstellen, dass Fredrick Miescher wenige Jahre später im 19. Jahrhundert erstmals Nukleinsäuren beschrieben hat, und wie wir wissen ist die DNA der Träger der Erbinformation, und das wird dann später beschrieben. Ich werde darauf zurückkommen. Und zusammen mit unseren Erkenntnissen aus der Genetik der Mikroben, aus der Biochemie der Nukleinsäuren, die von der Molekulargenetik und der Evolutionsbiologie gewonnen wurden, ist der Zeitpunkt gekommen, eine weitere Synthese zwischen der Molekulargenetik und den Evolutionsbiologien vorzunehmen, und ich nannte das entweder molekulare Evolution oder molekularen Darwinismus. Tatsächlich wissen wir nicht nur, dass genetische Vorgänge das Substrat der natürlichen Auslese sind, sondern diese Mechanismen der genetischen Variation sind mittlerweile erkannt worden, und dies ist der Hauptgegenstand meines heutigen Vortrags. Schauen wir uns nun die Anfänge der Mikrobengenetik an. Erst relativ spät wurde erkannt, dass nicht nur höhere Organismen, sondern auch Bakterien und ihre Viren Gene haben und mutieren können. Man konnte also genetische Untersuchungen an diesen relativ einfachen Mikroorganismen durchführen. Es gab drei wichtige grundlegende Experimente in der Mikrobengenetik, die dann sehr schnell beschrieben wurden. Zunächst wurde von Avery, McLeod und McCarty die Transformation beschrieben. Hierbei wird die DNA aus einem Bakterienstamm entnommen und mit der DNA eines anderen Stammes gemischt, der möglicherweise mit dem ersten verwandt ist. Die DNA kann in die Bakterien eindringen und einige Eigenschaften darauf übertragen, die Eigenschaften des ursprünglichen Stammes waren, aus dem die DNA entnommen worden war. Bei der Konjugation legen sich zwei Bakterienzellen nebeneinander. Dies ist eine Art von sexueller Paarung, bei der ein Teil oder manchmal auch das ganze genetische Material von einer auf die andere Zelle übertragen werden kann. Hier dient ein Plasmid als Genträger. Ich erwähne das lediglich für diejenigen unter Ihnen, die mit dieser Terminologie vertraut sind. Bei der Transduktion züchtet man einen Virus in einem Bakterienstamm, hier in dem blauen Stamm, und zwar mit geringer Häufigkeit, statt die Virenpartikel in den Nachwuchs einzubauen. Man kann beobachten, dass manchmal ein kleines Bruchstück des Genoms der Host-Zelle integriert wird, und nach einer Infektion gelangt das DNA-Fragment in eine andere Zelle. In diesem Fall ist der Genträger offensichtlich ein Virus. Bei der Konjugation hat man beobachtet, indem man verschiedene Marker auf dem Genom betrachtet Man kann eine Paarung alle paar Minuten unterbrechen und überprüfen, welche Marker bereits in die Zelle eingedrungen sind. Nach diesen Experimenten sah es so aus, als befänden sich die Gene auf dem langen, fadenartigen Molekül. Das war auch in diesem Fall offensichtlich. Was dieser Autor tat, war Folgendes: Während der Transformation reinigte er die Bakterien-DNA aus dem blauen Stamm sehr vorsichtig von jeglichen Proteinen, die auch bei Bakterien normalerweise mit der DNA verbunden sind. Proteine und jegliche anderen Moleküle, die mit der DNA verbunden waren, wurden entfernt, und es konnte gezeigt werden, dass diese hochgradig gereinigte DNA Merkmale des blauen Stammes auf den grünen übertrug, während die anderen Fragmente, wie Proteine usw., keine Merkmale übertrugen. Im Jahre 1944 wurde also klar bewiesen, dass die DNA der Träger der Erbinformation ist. Sie können sich vorstellen, dass die Biologen dem wenig Aufmerksamkeit schenkten. Die meisten Evolutionsbiologen interessierten sich damals für das Studium der Evolution von höheren Tieren zum Menschen. Vielleicht auch für einige Pflanzen, jedoch nicht für Bakterien. Einige Jahre später, 1953, veröffentlichten dann Watson und Crick die Struktur des DNA-Moleküls, bei dem es sich um eine Doppelhelix handelte. Und sie konnten anhand der linearen Ordnung der Nukleotide erklären, dass dies die Buchstaben des genetischen Codes sind, ebenso wie in unserer Schriftsprache die Aneinanderreihung von Buchstaben eine Bedeutung ausdrücken kann. Später zeigte sich, dass es sich tatsächlich so verhielt. Gehen wir also weiter. Für diejenigen unter Ihnen, die mit der Genetik der Mikroben weniger vertraut sind: Das Bakterium E. coli verfügt über fast 5 Millionen Basenpaare in einem einzigen kreisförmigen Molekül, das hier symbolisch dargestellt ist. Und symbolisch zeichne ich hier ein Gen mit dem Leserahmen ein, das in der Regel ein Protein codiert, manchmal auch ein RNA-Molekül, und an verschiedenen Stellen befinden sich Expressionssteuerungssignale, mit denen andere Proteine interagieren, damit das Gen in der richtigen Menge exprimiert wird, wenn das Produkt benötigt wird. Und wenn man nun in dieser Darstellung eine Mutation als Änderung der Nukleotidsequenz definiert, symbolisch hier flach angegeben, wenn man dieses 8p-Basenpaar durch ein CG verändert, so ist das bereits eine lokale Mutation. Befindet diese sich in der Mitte des Leserahmens, hat dies möglicherweise eine Auswirkung auf das Genprodukt. Wenn man das in eine Expressionssteuerungssequenz einfügt, kann dadurch die Menge des Produkts vergrößert oder verringert oder das Gen vollständig deaktiviert werden. Sie sehen also, wie verschiedene Mutationen direkte Auswirkungen auf Seiten des Produkts haben können. Vielleicht hat Sie meine Definition einer Mutation überrascht. Wir müssen uns dessen bewusst sein, dass in der biologischen Literatur für das Wort "Mutation" zwei Arten von Definition verwendet werden. In der von mir erwähnten klassischen Genetik wussten die Leute nicht, was ein Gen ist, und dass es Gene auf der DNA gibt. Sie konnten Phänotypen sehen, und die Definition einer Mutation war, dass sie einem veränderten Phänotyp entsprach, der nicht nur bei den ersten Nachkömmlingen in den Nachwuchs übertragen wird, sondern auch bei den zweiten, dritten usw. Man muss hier vorsichtig sein, denn es gibt epigenetische Phänomene, die sich ebenfalls auf die Übertragung auswirken, nach ein oder zwei Generationen manchmal jedoch sehr schnell wieder verschwinden. Hierbei handelt es sich nicht um echte genetische Mutationen. In der molekularen Genetik, die umgekehrt nach dem Erbmaterial fragt, definiert man eine Mutation als veränderte Nukleotidsequenz. Es besteht also dieser Unterschied. Natürlich sollte ich Ihnen erklären, wenn man von dieser Art der Mutation ausgeht, von der Änderung der Sequenz der Nukleotide, dass Mutationen nur sehr selten günstig oder nützlich sind und einen selektiven Vorteil verschaffen. Wesentlich häufiger ist eine Mutation ungünstig und resultiert in einem selektiven Nachteil. Dies bedeutet, dass diese Mutanten auf längere Sicht wieder aus der Population eliminiert werden. Manche werden sofort eliminiert, da einige dieser Mutationen tödlich sind. Sehr viele Mutationen bleiben ohne jeden unmittelbaren Effekt auf die Lebensvorgänge. Man bezeichnet sie als stille und neutrale Mutationen. Es gibt mehrere Gründe hierfür. Ich habe keine Zeit Ihnen dies zu erklären. Man weiß warum dies so ist. Wenn Sie sich also diese allgemeinen Erkenntnisse anschauen, so gibt es keine Hinweise darauf, dass irgend eine neue Mutation von einem Bedürfnis gesteuert sein könnte. Nehmen wir zum Beispiel Bakterien. Ich weiß, dass Bakterien über keine Sinne verfügen, die sie wissen lassen könnten, wann sie in eine völlig veränderte Umgebung gelangen, um ein bestimmtes Gen auf eine bestimmte Weise zu verändern, um so das Leben unter diesen neuen Umweltbedingungen zu ermöglichen. Es mussten sehr viele Untersuchungen durchgeführt werden, um zu erkennen, ob diese Möglichkeit besteht. Und alle diese Experimente erwiesen sich schließlich als nicht wirklich aussagekräftig. Sie konnten Erklärungen geben, wenn Wirkungen beobachtet wurden. Manche Wirkungen konnten einfach durch andere Ursachen erklärt werden, die sich im Hintergrund befanden. Hierbei handelt es sich um eine allgemeine Angelegenheit: dass keine dieser Mutationen in Wirklichkeit eine Antwort auf das erkannte Bedürfnis ist, dass eine bestimmte Genfunktion benötigt wird. Aus diesem Grund, weil viele Mutationen ungünstig sind, ist es auch erforderlich, dass die Häufigkeit der Mutationen, die toleriert werden können, sehr gering sein muss. Es kann demnach nicht toleriert werden, dass Mutationen in Lebewesen in großer Häufigkeit auftreten. Dies ist die neodarwinistische Evolution. Ich nenne dies "die drei Säulen". Ich erwähnte die genetische Variation. Das ist eine Mutation, und dies ist die treibende Kraft der Evolution. Wäre das Genom von einer Generation zur nächsten vollkommen stabil, so gäbe es keine Möglichkeit zu irgendeiner Entwicklung. Dann werden die verfügbaren Varianten, zusammen mit ihren - nicht-mutierten - Eltern ständig der natürlichen Zuchtwahl ausgesetzt, und dies legt fest, wohin die Evolution auf dem Baum des Lebens geht. Ich zeige Ihnen das ein wenig später. Die dritte Säule ist die Isolation: entweder reproduktive Isolation, besonders bei Organismen mit sexueller Fortpflanzung - man erhält keine Nachkommenschaft von stark divergierenden Lebewesen - oder geographische Isolation. Charles Darwin hat hierüber zum Beispiel auf den Galapagos Inseln viel gelernt, wo die Lebewesen vom Festland getrennt waren und besondere, divergierende phänotypische Varianten zeigten. Hierdurch wird die Evolution abgewandelt. Dies ist eine allgemeine Darstellung, und ich möchte Ihnen nun die Grundlage der genetischen Variation erklären. Wie stellt man Experimente hierzu an? Heutzutage ist das sehr gut möglich, da man seit 10, 20 Jahren Nukleotidsequenzen eines bestimmten Gens sogar aus demjenigen Abschnitt eines Gens vergleichen kann, den wir als funktionale Domäne bezeichnen. Gruppen von Genen oder das gesamte Genom. Und daraus, wo sich stets einige Unterschiede finden je entfernter die evolutionäre Verwandtschaft ist, kann man Rückschlüsse darauf ziehen, was in der jüngeren Vergangenheit, seit der Trennung dieser beiden Arten von Lebewesen, passiert sein mag. Bedauerlicherweise ist das noch kein Beweis. Wir würden gern individuelle Mechanismen bei der Arbeit beobachten, in einzelnen Fallstudien erkennen, wie genau die genetischen Varianten erzeugt werden. Dies lässt sich am leichtesten bei den einfachsten Lebewesen untersuchen, d. h. bei Bakterienzellen und bei bakteriellen Viren oder anderen Viren. Das Ergebnis ist, dass es mehr als einen speziellen Vorgang gibt, und ich betone besonders "speziellen Vorgang". Sie werden sehen, was ich meine. Ich werde es Ihnen erklären, ohne ins Details zu gehen, weil die Zeit so kurz ist. Doch ich werde Ihnen erklären, was ich damit sagen will. Nun, Bakterien sind haploide, einzellige Organismen. Vor der Zellteilung liegen, als Ergebnis der Replikation, natürlich zwei identische Chromosomen vor, von denen jeweils eins in die beiden Tochterzellen gelangt. Bei E. Coli Bakterien, mit denen wir normalerweise arbeiten, dauert das bei angemessenen Wachstumsbedingungen etwa eine halbe Stunde. Nach einer weiteren halben Stunde habe wir dann vier Zellen usw. Ab und zu kommt es nun zu einer spontanen Mutation. Dies ist eine größere, sie führt zu Nachkommenschaft, und dies ist eine kleine ohne Nachkommenschaft usw. Die Zeichnung ist etwas irreführend. Denken Sie nicht, dass die erste Mutation auftritt, wenn vier Zellen vorliegen. Im Durchschnitt tritt eine Mutation auf, wenn etwa 300 identische Zellen vorliegen. Die Mutagenese, die spontane Entstehung von Mutationen, ist ein seltenes Ereignis, muss ein seltenes Ereignis sein. Das Schöne an der Haploidie ist, dass der Phänotyp sich schnell manifestiert, so dass man die Auswirkung der Mutation recht schnell beobachten kann. Alle diese Mutationen manifestieren Ihre Phänotypen, und früher oder später hat man eine gemischte Population, wie sie hier dargestellt ist. Sie enthält natürlich elterliche mutierte Formen, die anschließend der natürlichen Auslese unterworfen werden. Dies ist eine Zusammenfassung dessen, was wir Mikrobiologen heute wissen. Auf der linken Seite sehen Sie wieder die genetische Variation bzw. die Entstehung von Mutanten. Auf der rechten Seite haben wir die natürliche Auslese und hier oben die Isolation. Konzentrieren wir uns auf die linke Seite. Ich erwähnte bereits, dass wir eine Reihe verschiedener Ursachen für die Entstehung von Mutanten kennen, und was ich hier schreibe ist lediglich eine Vereinfachung der Replikation mit Ungenauigkeiten. Dies umfasst mehrere bekannte Formen der Ungenauigkeit während der Replikation. Mutagene Substanzen befinden sich in der lebenden Zelle, bereits im Körper, einige andere Faktoren sind zum Beispiel die Umweltstrahlung oder chemische Substanzen. Und eine weitere Quelle der Entstehung von Mutanten ist eine Kombination durch Neuanordnung innerhalb des Genoms. Dann gibt es da noch das Phänomen des horizontalen Transfers. Ich habe das bereits bei der Erklärung der Genetik der Bakterien gezeigt. Ich komme später noch darauf zurück. Man erkennt, dass diese Mutationsformen natürlich nicht spezifisch sind. Dies sind Gruppen spezifischer Vorgänge. Ich möchte ein wenig den Hintergrund dieser Dinge erläutern. Bevor ich jedoch darauf eingehe, wollen wir uns ansehen, dass es sich bei vielen dieser Replikationsungenauigkeiten lediglich um lokale Sequenzänderungen handelt. Die Substitution eines Nukleotids durch ein anderes, der Verlust eines Nukleotids, das Einfügen eines angrenzenden Nukleotids während der Replikation und ähnliche Dinge, möglicherweise die Vertauschung einiger angrenzender Nukleotide, örtlich sehr begrenzt. Die Neuanordnung betrifft Fragmente der Gesamtgröße eines Gens oder im Allgemeinen sehr wenige Gene, und ich werde Ihnen erklären, dass dies häufig durch den Vorgang der Neukombination und Umstrukturierung geschieht. Unter horizontalem Gentransfer verstehe ich den DNA-Erwerb, den Erwerb genetischer Information von einer anderen Art von Lebewesen. Viele von Ihnen sind Chemiker und es wird Ihnen gefallen, Sie werden das verstehen. Eine Quelle der Replikationsungenauigkeit, wahrscheinlich eine recht wichtige Quelle, besteht darin, dass Adenin, obwohl es normalerweise mit Thymin ein Paar bildet, diese Basenpaarung eingeht. Diese Bindung wird während der DNA-Replikation der Basenpaarung natürlich geöffnet. Die DNA-Polymerase fügt das Partnernukleotid ein, und für Adenin sollte dies immer ein Thymin sein. Wenn sich jedoch dieses Wasserstoffatom für kurze Zeit dort unten in einer isomerischen, tautomerischen Form von Adenin befindet, kommt es zu keiner korrekten Basenpaarung des Thymins. Es trifft sich nun so, dass Cytosin mit dieser tautomorphischen Form eine relativ gute Basenpaarung eingehen kann. Und wenn sich nach einem Bruchteil einer Sekunde die Normalform wiederherstellt und sich das Wasserstoffatom wieder hier oben befindet, haben wir eine Fehlpaarung. Dies ist also eine mögliche Quelle der Nukleotidsubstitution. Ich glaube, soweit wir wissen, verfügen alle untersuchten Lebewesen über enzymatische Reparatursysteme, die solche Fehlpaarungen im Verlauf ihrer Entstehung sehr schnell erkennen und wieder korrigieren, sobald wieder die normale Form erscheint. Wie gelingt dies den Reparatursystemen? Viele von ihnen, wenn auch nicht alle, aber viele von ihnen, können erkennen, welches der Elternstrang und welches der neueingefügte Partner ist, und sie nehmen die Reparatur der Fehlpaarung natürlich nicht auf dem Eltern-, sondern auf dem Partnerstrang vor. Eine Möglichkeit, den elterlichen Strang zu erkennen, besteht in der Suche nach Metallgruppen. Wir müssen wissen, dass hinter der Replikationsgabel mit einiger Verzögerung an einigen Sequenzen Metallgruppen mit einigen der Nukleotide eine Verbindung eingehen, und das markiert dann den Strang als Elternstrang. Unmittelbar nach der Replikation haben die neuen Stränge noch keine Metallgruppen erlangt. Die Natur ist also sehr einfallsreich und weiß, wie diese Dinge zu machen sind. Hier ist eine Liste, die im Einzelnen durchzugehen uns die Zeit fehlt. Bei der Transformation haben Sie gesehen, dass dies der Vorgang ist, durch den eine DNA von einer Art von Bakterium in eine andere gebracht wird. Normalerweise ist dies problemlos möglich, wenn die Stränge zum selben Bakterienstamm gehören und nur durch ein, zwei oder drei Mutationen voneinander verschieden sind. Sobald man jedoch etwas weiter hinter die neuesten Stränge zurückgeht, ergeben sich Schwierigkeiten. Ich werde Ihnen erklären, warum das so ist. Dies gilt für die Transformation, die Konjugation und für die durch Viren vermittelte Transduktion. Sie haben diese Dinge bereits gesehen, und ich werde Ihnen jetzt die Gründe dafür erläutern. Warum diese Vorgänge manchmal nicht sehr effizient sind. Eine Oberflächenkompatibilität muss natürlich vorhanden sein. Diese Viren müssen beispielsweise einen Weg finden, sich an der Oberfläche anzuheften und ihre DNA in den neuen Host zu injizieren. Das Eindringen durch die Zellwand, dasselbe wie bei der Konjugation, und freie DNA-Moleküle werden von manchen Bakterien manchmal aktiv aufgenommen. Bei anderen Bakterien versuchen sie durch Diffusion ins Innere der Zelle zu gelangen. Ferner verfügen fast alle Bakterienstämme über ein oder ein paar Systeme, die die Modifikation einschränken. Dies sind Systeme, die erkennen können, ob fremde DNA oder DNA derselben Art von Bakterien, die infiziert sind, in die Zelle gelangt ist. Ich werde Ihnen gleich noch zeigen, wie das funktioniert. Um über ein Gen verfügen zu können, das aus einem anderen Organismus stammt, ist dann zusätzlich noch die Kompatibilität von Funktionen zu bedenken. Wenn ein Gen nicht auf stabile Weise in ein Genom integriert werden kann, geht es schnell verloren. Und wenn das Gen dann exprimiert wird, muss man wissen, ob die Harmonie der Zelle erhalten bleibt: Manchmal wird sie verbessert, meistens jedoch gehemmt, die Harmonie wird zerstört. Das bleibt dann natürlich nicht erhalten. Die Harmonie lässt sich am einfachsten erhalten, wenn nur ein kleines Segment der DNA aufgenommen wird. Dabei kann es sich um ein Gen handeln, manchmal nur um eine funktionale Domäne. Oder um sehr wenige Gene, jedoch nicht um ein halbes Genom. Das funktioniert normalerweise nicht. Das ist die Strategie der Natur, die wir an diesen Vorgängen ablesen können. Nun nur noch ein Wort zu dieser Restriktion [der genetischen Modifikation], für die ich vor dreißig Jahren zusammen mit zwei amerikanischen Kollegen den Nobelpreis erhielt. Wir hatten über die sogenannten Typ 1 Restriktionsenzyme gearbeitet. Ich möchte zunächst den Typ 2 erklären, denn hierbei handelt es sich um diejenigen, mit denen viele von Ihnen in ihren Laboren arbeiten. Dies sind Enzyme, von denen jedes seinen eigenen Namen hat. Dies ist Eco R1. Dieses Enzym erkennt die Sequenz GAATTC. Sie werden sehen, dass es in der Gegenrichtung auf der anderen Seite dieselbe Sequenz ist. Und wenn mit diesem Adenin hier keine Metallgruppe verbunden ist, wenn es nicht methyliert ist, wird die DNA folgendermaßen auf reproduzierbare Weise aufgespalten. Diese Enzyme - da sie die DNA auf reproduzierbare Weise aufspalten und natürlich weil es diese relativ kurzen Sequenzen gibt - befinden sich an verschiedenen Stellen. Auf diese Weise werden längere DNA-Moleküle in handhabbare Fragmente zerlegt, und diese werden dann verwendet. Die Enzyme werden verwendet, um diese Fragmente herzustellen und dann zu analysieren, hinsichtlich ihrer Sequenz und Funktion. Die Enzyme, mit denen wir anfänglich gearbeitet haben, stammten von E. Coli K12. Dies ist Eco K1. Auch dieses Enzym erkennt AACGTGC und jegliche sechs Nukleotide in Zwischenräumen. Diese Sequenz wird also von diesen Restriktionsenzymen erkannt. Sie spalten die DNA hier nicht auf, sondern reparieren sie. Sie bleiben hier an dieser Stelle und beginnen, die DNA hindurchzuschieben. Im Elektronenmikroskop können Sie sehen, wie diese Schleife immer größer wird. Es ist sehr schön anzuschauen. So setzt sich dies hier symbolisch fort. Diese Translokation erfolgt in eine Richtung. Sie erfolgt auch in die andere Richtung, aber das ist hierfür irrelevant. Da es jedoch mehr als eine dieser Stellen gibt, gibt es bei langen DNA-Molekülen andere derartige Stellen. Die Enzyme können auch hier Reparaturen durchführen. Sicherlich nicht gleichzeitig. Daher wird hier eine Fixierung des Enzymes in der Zeit in einen Schneidevorgang an mehreren Stellen im Raum verwandelt, obwohl in Wirklichkeit diese beiden Translokationskomplexe ineinanderlaufen. Etwa die Hälfte aller Systeme zur Restriktion der Modifikation der DNA entspricht dem einen Typ, die andere Hälfte dem anderen. Es gibt auch noch einen dritten Typ usw. Dabei handelt es sich jedoch um kleine Populationen. Sie sehen also, dass die Natur sehr einfallsreich ist und besonders dieser Mechanismus. Ich nenne ihn einen "Variationsgenerator". Alle diese Fragmente werden nach einer Infektion an einer anderen Stelle geschnitten. Evolutionsmäßig ist dies sehr interessant, denn bei den Enzymen vom Typ 1 und Typ 2 kann es sein, wenn das Fragment geschnitten wird, dass die Sequenz in einem wichtigen Gen liegt. Wenn es geschnitten wird, kann man es nicht erlangen. Hier kann jedoch alles in kleinen Schritten erlangt werden. Evolutionsmäßig ist dies für die Natur sehr viel besser, und das ist wahrscheinlich auch der Grund dafür - ich meine es gibt ein gewisses Maß an Flexibilität in der Natur, dass es alle diese verschiedenen Wege gibt, dies zu tun. Es zeigt einem, dass man - wenn man etwas in der Natur erklärt hat - nicht annehmen soll, dass es für alle diese Dinge gültig ist. Häufig lässt sich derselbe Zweck auch durch andere Mittel erreichen. Der Baum der Evolution des Lebens, ich zeichne ihn mit horizontalen Verbindungen, und diese dienen natürlich lediglich der Übertragung von Genomfragmenten. Ich habe sie rein zufällig eingetragen. Es gibt keine Regel, die besagt, wann dies passiert. Der vertikale Fluss ist Ihnen vertraut. Dabei wird das gesamte Genom übertragen. Nun, Charles Darwin hat uns erklärt, dass die Lebewesen gemeinsame Vorfahren haben. Und angesichts der horizontalen Übertragung, bei der Genfunktionen horizontal übertragen werden, haben wir auch eine gemeinsame Zukunft. Das ist eine philosophische Sichtweise, die ich Ihnen nahe bringen möchte. Abschließend möchte ich nur noch einige wenige zusätzliche Überlegungen vortragen. Dies ist eine Zusammenfassung der drei Strategien: lokale Sequenzänderung, DNA-Neuanordnungen und DNA-Erwerb. Ich habe Ihnen erklärt, wie dies funktioniert, was jedoch ihren Beitrag zur Evolution betrifft, hat jede Strategie ihre eigene Qualität. Hier ist es die Suche nach der Verbesserung der vorhandenen biologischen Funktionen. Diese Suche nach der Verbesserung verfügbarer Fähigkeiten durch die Fusion von Segmenten von Genen mit anderen Segmenten anderer Gene oder durch die Fusion eines offenen Leserahmens mit einer alternativen Lesesteuerung der Genexpression. Der Erwerb hat eine völlig andere Qualität, nämlich die gemeinsame Nutzung der erfolgreichen Entwicklung anderer. Hierdurch ist es möglich, in einem Schritt eine neue Fähigkeit zu erlangen, die man vorher nicht besaß. Enzyme habe ich bereits erwähnt. Reparaturenzyme, Restriktionsenzyme. Hierbei handelt es sich um Modulatoren der Häufigkeit genetischer Variation, um die Rate der Entstehung von Mutationen gering zu halten, auf einem akzeptablen Niveau. Es gibt auch tatsächliche Variationsgeneratoren. In der Liste der Rekombinationsenzyme fehlte mir die Zeit, Ihnen alle Einzelheiten zu erklären, doch einige von diesen sind sogenannte "mobile genetische Elemente" und sie fungieren, das hat man bewiesen, als Variationsgeneratoren, die hin und wieder geringe Veränderungen an verschiedenen Stellen einfügen. Darüber hinaus werden sämtliche Rekombinationsenzyme, die zu internen Neuordnungen des genetischen Materials führen, ebenfalls durch Enzyme gesteuert. Ich nenne sie "Evolutionsgene", denn viele dieser Enzyme, die man untersucht hat, sind unwesentlich für das normale Wachstum eines Bakteriums. Sie dienen der Evolution. Und wir glauben, dass ihre eigene Evolution in der Frühzeit des Lebens sie genau für diese Aufgabe ausgewählt hat. Sie arbeiten mit nichtgenetischen Elementen zusammen. Die tautomerischen Formen haben wir gesehen, und es gibt andere Gründe, z.B. dass ein Organismus zufällig auf einen Virus trifft, der Gene mit sich führt, usw. Die Natur sorgt also aktiv für die biologische Evolution. Ich bin der Meinung, dass Lehrbücher korrigiert werden sollten. In vielen Lehrbüchern kann man auch heute noch lesen, dass spontane Mutationen als Fehler oder Störfälle der DNA-Replikation bezeichnet werden. Das ist die falsche Einstellung der Natur gegenüber. Die Natur verwendet zum Beispiel tautomerische Formen, um Mutanten hervorzubringen, lokale Mutanten, und die verfügbaren Reparatursysteme halten die Häufigkeit dieser Mutationen auf einem zuträglichen Niveau. Wo befinden sich nun diese Gene, diese Evolutionsgene? Sie können sich nur im Genom von Bakterien, von mir, dem Menschen befinden. Das Genom zeichnet sich demnach durch eine Dualität aus. Zahlreiche Gene, "Haushaltungsgene", Gene für Entwicklungsgene höherer Organismen, Gene für spezielle Lebensbedingungen: Sie dienen der Verwirklichung dieser individuellen Leben. Doch in denselben Individuen befinden sich Gene, die für die weitere evolutionäre Entwicklung verantwortlich sind, für die Expansion des Lebens, und sie sind die Quelle der Vielfalt des Lebens. Es kommt langsam zur Wiederherstellung früher verlorener Biodiversität. Dies geschieht nicht von einem Jahr zum anderen, sondern über lange Zeiträume. All dies garantiert Biodiversität unter veränderten Lebensbedingungen, veränderten Umweltbedingungen. Das Leben kann weitergehen. Dies ist mein letzter Punkt. Sie könnten fragen, ob dasjenige, was ich Ihnen über Bakterien erzählt habe, auch für Sie als Tiere relevant ist, oder für Pflanzen? Ich denke, dass es relevant ist. Und ich denke, ich erwarte - ohne zu wissen, ob dies absolut korrekt ist -, dass ein Lebewesen über evolutionäre Fitness verfügt, wenn es mindestens mit einem, idealerweise mit mehreren der spezifischen Mechanismen für jede dieser drei Strategien ausgerüstet ist - lokale, interne Neuanordnung und Neuerwerb [von genetischem Material]. Dann kann die Evolution weitergehen. Es ist ebenfalls wichtig, dass die Rate der Mutationen gering gehalten wird, wie ich gesagt habe. Und bei Bakterien wissen wir, dass sich - wenn sie Kolonien bilden - außerhalb einer solchen Kolonie plötzlich Zellen finden, die andere Dinge tun, als die Zellen innerhalb der Kolonie. Es gibt also eine bestimmte Tendenz zur Differenzierung, und ich bin der Auffassung, wenn sich das eine Zeit lang fortsetzt, dass diese Kolonien gerne zusammenbleiben, und dann haben wir bereits einen primitiven mehrzelligen Organismus. Später mag Symbiose eine wichtige Rolle spielen. Ich habe erst vor relativ kurzer Zeit erfahren, dass ich in meinem Körper etwa ein Kilogramm Bakterien mit mir herumtrage, und Sie tun das auch, und sie helfen unserem Leben. Es sind keine Krankheitserreger, es sind nicht meine Feinde: Es ist ein Fall von Symbiose. Und viele von diesen leben in den Zellen. Und wenn man jahrzehntelang zusammenlebt, so handelt es sich hierbei schließlich um eine Lebensgemeinschaft, die einen gelegentlichen, seltenen Gentransfer vom einen zum anderen begünstigt. Ich halte dies für einen zusätzlichen Weg der Evolution. Man muss nur wissen, dass die Evolution eine schrittweise Akkumulation von Mitteln, eine Anreicherung von Funktionen ist, die von der natürlichen Auslese akzeptiert worden sind und behalten werden, solange die Bedingungen es erfordern. Und das führt nicht nur zu einer höheren Komplexität, sondern auch zu einer höheren Biodiversität. Wenn von höheren Tieren und Pflanzen die Rede ist, sollte ich auch sagen, dass einige von den von mir als Evolutionsgene bezeichneten Gene auch auf der somatischen Ebene relevant sind und ihre Funktionen ausüben. Das beste Beispiel hierfür ist wahrscheinlich unser Immunsystem, das der Variation der Bakterien einfach durch Neuanordnung und die somatische Entstehung von Mutanten folgt, doch das geschieht natürlich nicht in der Keimbahn, sondern auf der somatischen Ebene. Ich denke daher, dass wir intensive Forschungen und Einsichten, besonders bei den höheren Organismen, benötigen. Die Grundlage dieses gesamten Wissens, das ich versucht habe Ihnen zu übermitteln, ist allerdings in der Genetik der Mikroben verankert. Ich danke Ihnen für Ihre Aufmerksamkeit.

Werner Arber giving an overview of the types of genetic variations.
(00:10:40 - 00:15:44)

The complete video is available here.

In 1978, Michael Smith and colleagues published a paper on site-directed mutagenesis, a novel technique, where short DNA molecules (oligonucleotides) are used to create mutations in gene sequences. The mutation can be generated by adding, deleting or substituting nucleotides, the building blocks of DNA [14]. According to Smith, who won the Nobel Prize in Chemistry in 1993, the potential of site-directed mutagenesis was obvious from the beginning, “however, we could not have anticipated the explosion of gene isolations, the improvements in DNA sequence determination methodology and the advances in the chemistry of nucleic acid synthesis that have occurred since 1978. This has resulted in an amazing increase in the use of site-directed mutagenesis as an analytical tool in biochemistry and biology.” [11] The technique formed the foundation for protein engineering – the ability to modify the nucleotides of a specific gene and observe the effects on the resulting protein.

Smith’s co-recipient of the Nobel Prize was Kary B. Mullis, who invented polymerase chain reaction (PCR), a method of creating significant amounts of copies of a small piece of DNA. Heat causes the double helix of a DNA fragment to disconnect. A heat-resistant type of DNA polymerase, isolated from the bacteria Thermus aquaticus, is used to build the DNA fragment of interest, and the cycle is repeated again and again, producing large numbers of copies, even millions of copies in hours, from a single strand of DNA [12, 15].

Turning up the Crank of Artificial Selection

Site-directed mutagenesis and PCR set the stage for directed evolution. These new technologies made it achievable to create extensive libraries of mutants and to screen the produced proteins for features chosen by the user. But there was one important development that changed the perspective of how experiments were done. During the 40th Lindau Nobel Laureate Meeting in 1990, Hamilton O. Smith, who won the Nobel Prize in Physiology or Medicine in 1978, explained the transformation caused by the advent of the personal computer; “The development of the personal computer ... puts within the hands of every scientist the ability to test new ideas.”

Hamilton Smith explaining the transformations caused by the advent of the personal computer.
(00:09:15 - 00:10:43)

 The complete video is available here.

In the 1980s, Frances Arnold implemented a process of mutating the protease subtilisin E, which can break down the milk protein casein, to carry out its activity in an organic solvent (dimethylformamide, or DMF) instead of water. The idea was that enzymes could be optimized to carry out their functions in non-natural conditions. The mutated genes were inserted in bacteria, which created a library of thousands of subtilisin variants. Screening identified the rare variant that hydrolyzed casein most effectively in a low-concentration solution of DMF. This variant was selected for additional mutations, and the cycle was repeated, with rising concentrations of DMF. Finally, this speedy evolution resulted in a variant of subtilisin that could function in 60% DMF, compared to the original subtilisin [6, 16]. Arnold explained how to re-optimize an enzyme for a new job in her lecture during the Online Science Days in 2020:

Frances H. Arnold explaining how to re-optimize an enzyme for a new job.
(00:09:06 - 00:11:21)

The complete video is available here.

Interestingly, the concept of accelerating enzyme efficiency, mimicking natural evolution, was not new. In 1980, the chemist and Nobel Laureate Sir John Cornforth presented his work on changing the chemical structure of enzymes to the audience at Lindau.

John Cornforth presenting his work on changing the chemical structure of enzymes.
(00:00:25 - 00:02:59)

The complete video is available here.

“The objective was to develop a stable, easily prepared and efficient catalyst which would work at room temperature in an aqueous environment and which might have commercial application,” wrote Rupert Purchase and James R. Hanson in a 2015 article describing Cornforth’s work in synthetic chemistry [17]. The challenge was to accelerate the properties nature could have devised, but in a laboratory at a much shorter time scale. “I do not have a thousand million years to complete this work!” said Cornforth, and this was echoed in Arnold’s 2018 Nobel lecture. But Cornforth focused solely on analytical chemistry, relying on laborious tinkering with chemical structure to get results. The power behind directed evolution lies in its multifaceted approach, combining methods from analytical chemistry, molecular biology and microbiology [14].

Scratching the Surface of Possibilities for New Enzymes

The methods devised by Arnold in the 1990s have been expanded by newer technologies and importantly, directed evolution has made many industrial applications feasible. “We have just scratched the surface of what nature can do,” said Arnold, and utilizing nature’s strategies in evolution is already fulfilling the principles of green chemistry, such as preventing waste, using less hazardous materials in chemical synthesis, or designing products with energy efficiency in mind [12]. During her online lecture in 2020, Arnold described how pheromones developed by directed evolution are successfully used as a biopesticide to curb damage to corn crops by the fall armyworm:

Arnold describes how pheromones developed by directed evolution are successfully used as a biopesticide.
(00:15:20 - 00:15:56)

The complete video is available here.

There are still many challenges ahead for directed evolution. It is difficult to predict enzyme function; we can mutate the gene, design protein structure, but how can we be sure of the function this enzyme will have, if at all? Protein engineering still requires considerable amounts of time and money before a solution to a real-world problem comes to fruition [12]. But the appealing perspective of custom-made enzymes, upgraded for the benefit of a cleaner environment, more efficient products and therapeutics will make it all worth it in the long term. Directed evolution is here to stay.





[3] Jackson, N., Maddocks, I.G., Watts, J.E., Scobie, D., Mason, R.S., Gordon-Thomas, C., Stockwell, S., and Moore, G.P.M. (2020). Evolution of the sheep coat: the impact of domestication on its structure and development. Genetics Research 104, e4.

[4] Gregory, T.R. (2009). Artificial selection and Domestication: Modern Lessons from Darwin’s Enduring Analogy. Evolution: Education and Outreach 2, pp. 5-27.








[12] Heckmann, C.M. and Paradisi, F. (2020) Looking Back: A Short History of the Discovery of Enzymes and How They Became Powerful Chemical Tools. Chem Cat Chem 12, pp. 6082 – 6102.

[13] Beadle, G.W. and Tatum, E.L. (1941). Genetic Control of Biochemical Reactions in Neurospora. Proc Natl Acad Sci USA 27(11), pp. 499-506.

[14] Enqvist, M.K.M. and Rabe, K.S. (2019). Applications of Protein Engineering and Directed Evolution in Plant Research. Plant Physiology 179, pp. 907 – 917.



[17] Purchase R. and Hanson, J.R. (2015). Sir John Cornforth AC CBE FRS: his synthetic work. Science Progress 98(3), 219 – 229.




Specify width: px


Associated Data