Arieh  Warshel  (2014) - Multiscale Simulations of the Functions of Biological Molecules

Despite enormous advances in structural studies of biological systems we are frequently left without a clear structure–function correlation and cannot fully describe how different systems actually work. This introduces a major challenge for computer modeling approaches that are aimed at a realistic simulation of biological functions

It’s a great pleasure to be here in the Lindau conference. I will try to convey to you some of the spirit of what we are doing, which is in the interface between chemistry and biology. The general name is multiscale modelling. And what I will try to cover in this short time are several items. One is the motivation, why we need such approaches. The other describing one of the key work horse of this field which is the QM/MM method. I will spend about half of the time on modelling enzyme catalysis as one example where this powerful approach is useful. And then I will move to general, larger and more complex systems. So we start with the motivation. Let’s say that you have a cell and you want to understand it. You want to understand signalling. There is or there has been a great advance. But you want to understand on more molecular level some of these junctions which are proteins in most cases. And fortunately we know a lot about the structures of many key proteins from x-ray structural studies. So using the structure we want to understand how these systems work. And one of the systems that interested me for many, many years are enzymes which for those of you who don’t know: When you try to break a bond regularly in solution, it could take very long time. When you use an enzyme, it’s always faster than one second because you need it for life processes. And the question is: What is it about the enzymes that make it work so fast? This is one example that you want to understand. And there are much more complex systems. There are molecular models like ATPase. We know the structure. There is some understanding of how it works. We want to go to more detail understanding. For example when you see this machine, you convince yourself that you understand how it works. You know you will stop the water, it will stop rotating. You want to understand molecular models on the same level. We have a lot of knowledge on ion channels. They are the targets of many medicines. You want to understand how voltage activation opens such channels and controls them. There are GPCR systems, again major advance in structural and biochemical studies and so on. So in many cases you have the basic component for trying to ask how the system works. And it’s similar to looking at the watch where most of you will say that you understand it. But very few will actually understand how it works. And essentially people now start to send me emails on what is wrong with this picture. But anyhow... or with this idea. But from my point of view, biochemistry is similar to discovering the clock. Structural studies show us all the parts. And kinetics like single molecule show us how fast they move. But in many cases we don’t have full molecular understanding. And the problem is that it’s a very complex system. It’s a large system with many atoms. It’s very hard to go and to see how the parts are interacting with each other. And you need computers for it. I mean if there were no computers, I would have nothing to say. But the way to model it is by computer. Now if you just try to study the structure or the small amplitude motions of a protein, you could use what is called empirical potential functions of force field, which basically describe bonds like ball and springs, similarly bending angles. And then they have repulsion between atoms which are not bonded to each other. With this type of mechanical model which is also called molecular mechanics you could describe many features of proteins in large molecules. This is what the Weizmann Institute group did. This is now Shneior Lifson, me and Michael Levitt long after these papers were published. So you could do a lot and a lot of the molecular modelling programs are based on just simple force fields. Now I told you that I am particularly interested in enzymes. And this spring model does not help you too much with enzymes. And the reason is that if you try to break a bond which is chemistry, using a spring model does not break the bond. I mean the more you stretch it the more it stretches. But it does not break. And the problem is that when you break a bond, the electrons are moving from one atom to another. So you have to add the electronic structure which requires what is called quantum mechanics or now quantum chemistry when you describe molecules. Now you cannot use standard quantum mechanics programs to model very large molecules because it is too expensive. You don’t have the computer time for this even now. So somewhere in the ‘70s we design a model called QM/MM which recognises that you don’t have to do quantum mechanics on the whole enzyme. You could describe only the reacting fragments quantum mechanically and the rest of the system by this ball and spring models provided that you include the effect of the charges and dipoles in the mechanical part inside the quantum description. Now this approach has the general name of multiscale modelling which basically says that if you want to study something really important, you don’t have to describe the whole system of the forest on the same detail. You have to do simplification. And so if this is the reacting part, you focus on it and the rest you could describe in simpler way. Along this line we also did realise that you don’t have to do regular quantum mechanics which is what most of these programs are doing. You could use an approach which is similar to high school chemistry called the empirical valence bond. It looks very simple but in a minute you will see what it could do. So if you want to study reaction, it’s enough to describe the reactant like ball and spring, the product like ball and springs and then to create the mixing between them and to make sure that the height of this barrier which determine how fast is the reaction correspond to experiment. So you train this system to reproduce what happens in solution. But then when you move to the enzyme, you only replace the surroundings and leave the parameters the same as they were in solution. So in this way you do not invent the quantum chemistry, you train it on what you know experimentally in solution. And you ask: What is the difference between chemistry and solution on which you know a lot to chemistry and enzymes? Again with our previous diagrams one state is like this, the other state is like this. And you find a way to capture the main physics or chemistry of the reaction without doing too complicated quantum mechanics. Now I will show you several examples. This is example, again in single transaction where you have a protein called Ras. They hydrolyse GTP. When you have GTP, the cell is being told to differentiate. When you bind to it another protein called GAP, this becomes a very good and fast catalyst and the GTP is broken to GTP plus phosphate. The structure of the protein and the complex is known. You want to understand how it works. So this is the complex: the 3 phosphates of the GTP, the water that attacks the phosphate, a residue that if you mutate it, you will get cancer and a magnesium ion that helps in catalysis. You have the structure. You know the biochemistry. You want to understand how it works. Now here comes one of the problems. That phosphate hydrolysis on which there are many, many books and many papers is not completely clear because it’s very hard to know what happens when the bond is being broken in what is called the transition state. A lot of studies which I argue, now I’m essentially sure, could have never figured out what really happens. Now it’s similar to these 2 blind people trying to figure out what they are holding. Some people say that the mechanism is dissociative, the other is associative. There is no experimental way to figure out what exactly is happening. And eventually quantum chemistry with a lot of experience allows you to chart the surfaces which tell you what is the energy for different parts. When you teach the EVB to do it, you could also do movies of the chemistry. Like this is the water molecule attacking the phosphate. This is the magnesium. The bond would be broken. So you could do a lot. Of course doing the movie does not mean that it is correct. So essentially you could do the movie being completely incorrect. But a lot of people when they see a movie, they assume it is incorrect. But anyhow you have to reproduce the actual activation barriers that tell you how fast is the reaction. And you have to keep working on this system. We were working on it since 1991. And now for example you could study chemistry or phosphate hydrolysis in solution with very high level quantum mechanics and classical water and really understand what’s happening in phosphate hydrolysis. And you find that it’s very, very different than what all the text books are telling you. But if you take these surfaces and fit to them this empirical valance bond and go to the protein and it’s correct for all G proteins, elongation factors, gap, almost all the devices that are used to transfer information, you could figure out how they really work. Now you could also do in the computer now a lot of mutations which tell you what happens when you change different residues. Essentially you could change for example a glycine to alanine moving to half glycine, half alanine and calculate the free energy of this and then check it on known cases. This is a protein called chorismate mutase where different mutants have different activation barriers. And you know the experiment so it’s not really predicting. But you have a computer program which is available to other people. And you could see how well it works. There is now this very popular field which still performs very poorly called rational enzyme design. You could try to see how a real rational approach like using computer simulations in calculating the barrier could work. This is still work in progress. You could also study what is the origin of enzyme catalysis. This is usually a one hour lecture so I won’t give it to you. But trying for many years, mainly to show that most of these proposals are wrong we showed that reproducing the activation barrier of enzymes and the corresponding barriers in solution, we show that it is always due to electrostatic effects. This is not simple electrostatic, essentially I will spend one minute about it. It’s called pre-organisation. And I will go relatively fast telling you what is this pre-organisation effect because it’s really the origin of enzyme catalysis. And it has very little to do with the interaction between the enzyme to the substrate. When you do chemistry and transfer a charge from one atom to another, the water molecules... When you do it in water, the water molecules have to rearrange. There is a penalty for rotating the water that when you do the same thing in enzyme, well the equivalent of the water, the hydrogen bonds and the dipoles of the enzymes do not have to pay for rotation. And this is really the origin of enzyme catalysis. So now I will switch field because it’s half the lecture. So we know to do enzymes. We know to do reactions which are very fast by full atomistic models where you let the atoms move like this missile and follow how they move with time. And then you simulate the reaction. A very early example is the first step of the visual process. I will try to move it to half in just a second. This is a retinal inside a restricted active site. It’s before the protein structure was known. In a minute you will see what happens. This is the ground state where it stays before there is a light, where it is in the cis structure. When light strikes, it goes to the excited state where it does not cost energy to rotate around a double bond. And this could be simulated in 1975. And what you find that in 100 femtosecond it goes from being cis to being trans. And this you could do with direct stimulation. Now the question is what you do when you have a larger system and it’s not picoseconds but seconds or milliseconds. So here you have to bridge the size and the time. And one way to treat large molecules, really large is a way that we introduced already in ’75: replacing all the side chains by spheres. This is now called coarse grained modelling. And a few years ago we decided to teach this model to give much better description of energy of large molecules by training the model to understand electrostatics. And electrostatics is something much more complex than what you think. Like I wrote 50 papers about it. But at the end of the day it’s not hard to tell computers what is important. So we have models -you will see in a minute how well they work- that focus on the electrostatic effect of large systems. You also want to go to long time simulation. So in short time you could use Newtonian dynamics. In long time you use what this fish is using which is Brownian dynamics for which you need friction. Now, I don’t have time to tell you how we find the friction. I will tell it very fast so a few of you will get it. We take the whole system, apply strong force, we take a simple system apply the same force with Langevin dynamics and we make the system behave in the same way. And when we do it, we could describe long time processes. Now comes the slower demonstration of what you could do with it. So as I said there are really nice complex systems where we know a lot about the structure, for example F1 ATPase. You have this central stalk which rotates. And when it rotates, you could move ADP to ATP to have high energy systems. A lot is known about it but one of the puzzles which was originally found by Kinoshita is that we have 3 sub units. It should rotate in 120 steps. In fact it rotates 80 degrees, stop, does the chemistry and continues to 40 degrees. You want to understand how this happens based on the structure which is not simple. So what we did to understand it: Running full molecular dynamics with the whole system is futile because your arrows would be 100s of kilocalories per mole. Instead we used this simplified model with Shayan. And what she found is that after 80 degrees of rotation there is an electrostatic barrier and the system does not like to rotate anymore. And this is where the chemistry occurs. Now when you add the chemistry -this is just conformation energy- to the conformation, you get a relatively complex map which I do not have the time to describe but it actually tells you how nature uses ATP to do work and the opposite, how you could use work to create ATP from ADP. This is the direction of the rotation of the central stalk. This is the direction of moving from ATP to ADP. And when you have time, you will look at this. I could tell you much more about it but I will give you a better example in a second. For example, I tell you essentially what you try to do. There is another part of this model where motions of protons from one side to another lead to rotation of the stalk. There is structural information about it, more limited about a C-ring with ionisable aspartic A-ring. And you want to be able to describe how this works, not by guessing it or assuming but by taking the structure and predicting how it works. It’s like this water driven models that I showed you before. You want to be on similar level. So you have to learn to describe the motion of protons. This is done by the EVB. You have to describe rotation, we don’t have time. But if you don’t end at the end of the day with such a map which has directionality, you have not explained how this works. A lot of the explanation is that it is work because it works, which essentially sounds extremely smart and convincing. But actually unless you have a free energy description that goes in one direction, you do not have explanation and I will give you one example which I will move a little more slowly. And this is myosin V. Myosin V carries load and it goes only in one direction. Again a lot of structural information, not really complete but a lot. A lot of single molecule information and yet the reason for moving in one direction is completely obscure. And to show you what is the puzzle... Usually when you walk in 2 directions, you walk in the same speed. The same probability to move like this. However... So this is what usually does not happen for unless people like me who had surgery in this leg. And you cannot attribute surgery to myosin V. So the question is why to walk only in one direction. And you want to get it from structure. So what we found is that if you look on the bend of this end of the myosin when it touches the part on which it is walking, reacting, you find that being like this is 11 kilocalories lower than being like this. And when you combine this knowledge with extremely complicated biochemistry of all the barriers, you find out that walking forwards has much lower barrier than walking backwards. And of course you could verify it by reproducing single molecule experiments. For this you need to run Langevin dynamics. And this is kind of using this model without the rest of it but including friction and seeing how does it move to just one direction. And of course you have to add mutation experiments and to verify it. So usually the first walk takes 3 months, then you fight the referees for 2 more months and then you have 3 years of trying to convince yourself and others that it is correct. Now same approach we have been using to study ion channels where they could be closed with one voltage direction and opened with the other one. And in order to model the whole system you have to learn to model the electrodes, the electrolyte and all of it. And unless you use a multiscale model, at least at present, you are wasting your time. There are extremely powerful computers that allow you to model part of it and even to model a single event of motion of current. But the connections to the electrodes cannot be done by even the most powerful super computers. We could calculate what is called gating currents, another interesting story. I will conclude with one more example. This is the ribosome which sometimes helps in transferring proteins through the translocon. And there are beautiful experiments which are really challenging of von Heijne where he shows the different peptides which are usually stored in the ribosome get pulled inside when they have the right length and they are connected to the translocon. So you have here a problem where you have to connect every tool that you ever knew about. You have to model the chemistry in the ribosome which at present I would argue that only this EVB could do properly. You could have to reproduce the fact that some peptides have higher barriers, some sequences than others. You have to get the barriers of moving through the translocon. Again it’s usually a half an hour lecture. And what you get at the end... So here by the way the simulation of the diffusive motion is really important because it’s going basically in 100 peptides per second. If you don’t have the right friction, you really are not sure what happen because there are so many things where we are not completely sure about, like moving to the translocon. And the fact that the protein has to become helical when it goes here, that you have to simulate also the motion and at the end of the day again it takes usually 3 months to figure out what you are doing. And we did get the difference between peptides which are stall to those which are not stall depending on the length. So I will conclude in the last 30 seconds that you could use this approach to study drug design by asking: What are the constraints that the pathogen needs to survive? And since we know to calculate the chemistry and we know to calculate the binding of a drug and since So this restricts the way it could evade the drug. So you could end up with a map of which mutations would be done by the virus. And then you could think on how to move with drug design. At the end my message is that everything is actually electrostatic. And these are people who work with me. Thank you very much. Applause.

Ich freue mich, bei diesem Treffen in Lindau dabei zu sein. Ich möchte Ihnen etwas von dem Geist dessen vermitteln, was wir an der Schnittstelle zwischen Chemie und Biologie tun. Die allgemeine Bezeichnung dafür lautet: Multiskalen-Modellierung. Und ich möchte in der kurzen mir zur Verfügung stehenden Zeit mehrere Aspekte beleuchten. Der eine ist die Begründung der Notwendigkeit solcher Ansätze. Zweitens möchte ich eines der wichtigsten "Arbeitspferde" auf diesem Gebiet beschreiben, nämlich die QM/MM-Methode. Ich werde ungefähr die Hälfte der Zeit dazu verwenden, die Modellierung der Enzymkatalyse als Beispiel dieses kraftvollen Ansatzes für eine nützliche Anwendung beschreiben. Und dann werde ich auf die allgemeinen, größeren und komplexen Systeme eingehen. Beginnen wir also mit dem Beweggrund. Gehen wir einmal von einer Zelle aus, die wir verstehen wollen. Wir wollen die Signalübertragung verstehen. Auf diesem Gebiet hat es enorme Fortschritte gegeben. Aber wir möchten einige der Verbindungen, bei denen es sich in den meisten Fällen um Proteine handelt, auf molekularer Ebene verstehen. Glücklicherweise wissen wir aus Röntgenstrukturanalysen eine Menge über die Strukturen vieler Schlüsselproteine. Mit Hilfe der Struktur wollen wir also verstehen, wie diese Systeme funktionieren. Und eines der Systeme, die mich seit vielen Jahren interessieren, sind Enzyme. Für alle, die das nicht wissen: Wenn man versucht, eine Bindung in Lösung aufzuspalten, kann das sehr lange dauern. Verwendet man ein Enzym, ist das schneller als innerhalb einer Sekunde erledigt, weil es die Grundlage für unsere Lebensprozesse ist. Die Frage lautet: Was macht das Enzym so schnell? Das ist ein Beispiel für die Fragen, die sich in diesem Zusammenhang stellen. Und es gibt wesentlich komplexere Systeme. Es gibt molekulare Modelle wie die ATPase, deren Struktur wir kennen. Es gibt Erkenntnisse darüber, wie das funktioniert, aber dieses Verständnis möchten wir weiter vertiefen. Wenn Sie beispielsweise dieses Gerät sehen, versuchen sie, seine Funktionsweise nachzuvollziehen. Sie wissen, dass das Gerät aufhört sich zu drehen, sobald Sie die Wasserzufuhr stoppen. In vergleichbarer Weise möchten Sie molekulare Modelle verstehen. Wir wissen inzwischen viel über Ionenkanäle. Sie sind die Zielmoleküle vieler Arzneimittel. Man will verstehen, wie die Spannungsaktivierung solche Kanäle öffnet und steuert. Es gibt GPCR-Systeme (G-Protein-gekoppelte Rezeptorsysteme), auch das ist ein großer Fortschritt in strukturellen und biochemischen Analysen usw. In vielen Fällen hat man also die Grundkomponente, um die Frage zu stellen, wie das System funktioniert. Und das ist ähnlich wie auf die Uhr zu schauen. Und da werden die meisten von Ihnen sagen, dass sie deren Funktionsweise verstehen. Aber nur sehr wenige verstehen tatsächlich, wie eine Uhr funktioniert. Und jetzt wird man mir wohl E-Mails zuschicken, um mir mitzuteilen, was an diesem Bild falsch ist ...aber egal ...oder an dieser Idee. Aber aus meiner Sicht ist das mit der Biochemie so ähnlich wie mit dem Verstehen der Uhr. Strukturelle Studien erschließen uns alle Einzelteile. Und die Kinetik von Einzelmolekülen zeigt uns, wie schnell sie sich bewegen. Das molekulare Verständnis ist allerdings in vielen Fällen begrenzt. Das Problem ist, dass es sich dabei um ein sehr komplexes System handelt. Das ist ein aus vielen Atomen bestehendes riesiges System. Da gestaltet es sich sehr schwierig herauszufinden, wie die Teile miteinander interagieren. Dafür braucht man Computer. Ohne Computer könnte man gar nichts machen. Der Weg zum Modell geht über den Computer. Wenn man versucht, die Struktur oder die kleinen Amplitudenbewegungen eines Proteins zu verstehen, könnte man die so genannten empirischen Potenzialfunktionen des Kraftfeldes verwenden, die Bindungen grundsätzlich wie Kugeln an Springfedern, ähnlich Biegewinkeln, beschreiben. Und zwischen den nicht gebundenen Atomen wirken Abstoßkräfte. Mit diesem mechanischen Modell, das auch als Molekularmechanik bezeichnet wird, könnte man viele Proteineigenschaften in großen Molekülen beschreiben. Und genau das hat die Gruppe am Weizmann-Institut gemacht. Hier sind Shneior Lifson, ich und Michael Levitt zu sehen, lange nachdem wir diese Artikel veröffentlicht haben. So konnte man also eine Menge tun. Im Molekularmodellierungsprogramm basiert Vieles auf einfachen Kraftfeldern. Ich sagte bereits, dass ich speziell an Enzymen interessiert bin. Und dieses Federmodell ist in Bezug auf Enzyme nicht wirklich hilfreich. Denn wenn man versucht, eine chemische Bindung zu spalten, gelingt das nicht mit einem Federmodell. Je größer die Dehnung wird, umso stärker dehnt sich die Bindung. Aber sie wird nicht aufgespalten. Und das Problem ist, dass die Elektronen beim Aufspalten einer Bindung von einem Atom zum anderen springen. Man muss also die elektronische Struktur ergänzen, wofür man die so genannte Quantenmechanik oder jetzt Quantenchemie benötigt, wenn man Moleküle beschreiben will. Für die Modellierung sehr großer Moleküle kann man allerdings keine Standardquantenmechanik-Programme verwenden, weil das zu teuer wäre. Und selbst heute verfügt man nicht über die erforderliche Computerzeit. Deshalb haben wir in den 1970er-Jahren ein Modell mit der Bezeichnung QM/MM entwickelt, das anerkennt, dass man nicht das gesamte Enzym quantenmechanisch untersuchen muss. Man beschreibt nur die reagierenden Fragmente quantenmechanisch und den Rest mit Hilfe dieser Kugeln an Springfedern. Voraussetzung ist jedoch, dass man den Effekt der Ladungen und Dipole im mechanischen Teil der Quantenbeschreibung berücksichtigt. Dieser Ansatz wird allgemein als Multiskalen-Modellierung bezeichnet. Grundsätzlich ist damit Folgendes gemeint: Wenn man etwas wirklich Wichtiges untersuchen will, muss man nicht das gesamte System, hier den Wald, mit gleicher Detailtiefe beschreiben. Man kann das vereinfachen. Wenn dies also der reagierende Teil ist, konzentriert man sich auf ihn und kann den Rest einfacher beschreiben. In diesem Zusammenhang realisierten wir uns auch, dass man nicht, wie es bei den meisten Programmen der Fall ist, reguläre Quantenmechanik betreiben muss. Man könnte einen Ansatz aus dem Chemieunterricht der Schule verfolgen, die empirische Valenzbindung (EVB). Das sieht sehr einfach aus, aber gleich werden Sie sehen, was damit möglich ist. Wenn man eine Reaktion untersuchen möchte, reicht also die Beschreibung des Reaktanten wie Kugel und Springfeder, des Produkts wie Kugel und Springfeder. Und dann mischt man beide und sorgt dafür, dass die Höhe der Barriere, die die Schnelligkeit der Reaktion festlegt, dem Experiment entspricht. So bringt man diesem System die Reproduktion dessen bei, was in Lösung geschieht. Wenn man dann zum Enzym übergeht, ersetzt man nur die Umgebung und lässt die Parameter genauso wie in der Lösung. So erfindet man nicht die Quantenchemie, sondern bringt ihr bei, was man experimentell aus der Situation in Lösung weiß. Und man fragt: Was ist der Unterschied zwischen Chemie und Lösung, über die man eine Menge hinsichtlich von Chemie und Enzymen weiß? Wie in unseren vorherigen Grafiken entspricht der eine Zustand diesem hier, der andere diesem hier. Und man findet eine Möglichkeit, die wesentliche Physik oder Chemie der Reaktion ohne allzu komplizierte Quantenmechanik zu erfassen. Ich möchte Ihnen jetzt mehrere Beispiele zeigen. Hier ist ein Beispiel, eine einzelne Transaktion mit dem Protein Ras. Es hydrolysiert GTP. Mit GTP erhält die Zelle die Information, sich zu differenzieren. Wenn man ein anderes Protein mit der Bezeichnung GAP daran bindet, entsteht ein sehr guter, schneller Katalysator und GTP wird in GDP plus Phosphat gespalten. Struktur und Komplex des Proteins sind bekannt. Jetzt geht es darum, die Funktionsweise zu verstehen. Das hier ist der Komplex: die drei Phosphate von GTP, das Wasser, das das Phosphat angreift, ein Rückstand, der, sofern er mutiert, Krebs auslöst und ein Magnesiumion, das die Katalyse unterstützt. Man hat die Struktur. Man kennt die Biochemie. Man möchte die Funktionsweise verstehen. Hier kommt eines der Probleme ins Spiel. Die Phosphathydrolyse, über die viele Bücher und Aufsätze geschrieben wurde, ist nicht vollständig aufgeklärt, weil man kaum weiß, was passiert, wenn die Bindung im so genannten Übergangszustand gespalten wird. Es gibt also eine Menge Untersuchungen, die - so behaupte ich und da bin ich mir heute ziemlich sicher - nie herausgefunden haben, was tatsächlich geschieht. Das ist ähnlich wie bei diesen beiden Blinden, die versuchen herauszufinden, was sie in den Händen halten. Einige sagen, der Mechanismus sei dissoziativ, andere sagen, er sei assoziativ. Es gibt keine experimentelle Möglichkeit herauszufinden, was tatsächlich passiert. Schließlich ermöglicht es die Quantenchemie mit viel Erfahrung, die Oberflächen darzustellen, um die Energien der verschiedenen Teile zu verdeutlichen. Wenn man der EVB beibringt, das zu tun, könnte man Filme über die Chemie herstellen. Wie dieses Wassermolekül hier, das das Phosphat angreift. Das ist das Magnesium. Die Bindung wird aufgespalten. Man kann also eine Menge tun. Den Film herzustellen, heißt nicht, dass das auch richtig ist. Man könnte einen völlig falschen Film herstellen. Aber viele Menschen, die sich einen Film anschauen, halten ihn per se für falsch. Aber wie auch immer, man muss die tatsächlichen Aktivierungsbarrieren reproduzieren, die etwas über die Schnelligkeit der Reaktion aussagen. Und man muss an diesem System dranbleiben. Wir arbeiten seit 1991 daran. Und jetzt konnte man beispielsweise die Chemie der Phosphathydrolyse in Lösung mit sehr hochwertiger Quantenmechanik und klassischem Wasser untersuchen und tatsächlich verstehen, was bei der Phosphathydrolyse passiert. Und dann hat man herausgefunden, dass das ganz anderes ist, als es in den Lehrbüchern steht. Wenn man aber diese Oberflächen nimmt und diese empirische Valenzbindung einpasst und dann das Protein nimmt kann man herausfinden, wie sie tatsächlich funktionieren. Nun könnte man am Computer viele Mutationen simulieren, die aufzeigen, was geschieht, wenn man verschiedene Rückstände verändert. Man könnte beispielsweise ein Glycin in ein Alanin wandeln, was halb Glycin, halb Alanin ergibt, und die freie Energie davon berechnen und das an bekannten Fällen überprüfen. Das hier ist ein Protein mit der Bezeichnung Chorismat-Mutase, bei dem verschiedene Mutanten verschiedene Aktivierungsbarrieren aufweisen. Und man kennt das Experiment, es ist also nicht wirklich indikativ. Aber es gibt ein Computerprogramm, das anderen Menschen zur Verfügung steht. Und man hat erlebt, wie gut das funktioniert. Es gibt jetzt dieses populäre, aber noch schwache Forschungsgebiet, das als rationales Enzymdesign bezeichnet wird. Man versucht zu beobachten, wie ein wirklich rationaler Ansatz wie Computersimulationen in der Berechnung der Barriere funktioniert. Diese Arbeiten laufen derzeit noch. Man könnte auch den Ursprung der Enzymkatalyse untersuchen. Das ist üblicherweise eine einstündige Vorlesung, die ich aber jetzt hier nicht halten werde. Aber in den langjährigen Versuchen, die größtenteils bestätigt haben, dass die meisten dieser Ansätze falsch sind, haben wir nachgewiesen, dass die Reproduktion der Aktivierungsbarrieren von Enzymen und der entsprechenden Barrieren in Lösung immer auf elektrostatische Effekte zurückzuführen ist. Das ist nicht einfache Elektrostatik, ich werde das kurz erläutern. Das wird als Vororganisation bezeichnet. Und ich werde Ihnen relativ kurz erzählen, was es mit diesem Vororganisationseffekt auf sich hat, denn das ist tatsächlich der Ursprung der Enzymkatalyse. Und das hat sehr wenig mit der Wechselwirkung zwischen Enzym und Substrat zu tun. Wenn man Chemie betreibt und eine Ladung von einem Atom auf ein anderes überträgt, müssen sich die Wassermoleküle ... wenn man das in Wasser macht ... müssen sich die Wassermoleküle neu ordnen. Es entsteht ein Aufwand für die Drehung der Wassermoleküle in dem Sinne, dass, wenn man das gleiche mit dem Enzym macht, das Äquivalent des Wassers, die Wasserstoffbindungen und die Dipole der Enzyme keine Energie für die Drehung aufwenden. Das ist der Ursprung der Enzymkatalyse. Jetzt werde ich das Thema wechseln, denn die Hälfte meiner Zeit ist um. Wir wissen also, wie das mit den Enzymen funktioniert. Wir können sehr schnelle Reaktionen durch komplette atomistische Modelle darstellen, wo die Atome wie diese Rakete bewegt werden und man beobachtet, wie sie sich diese Bewegung im Zeitverlauf darstellt. Und dann simuliert man die Reaktion. Ein sehr frühes Beispiel ist der erste Schritt des Sehvorgangs. Ich versuche es gleich halb so schnell abzuspielen. Das hier ist ein Retinal mit einem eingeschränkten aktiven Zentrum im Innern. Das war, bevor die Proteinstruktur bekannt war. Gleich werden Sie sehen, was geschieht. Das ist der Grundzustand, in dem es sich vor Lichteinwirkung befindet, die cis-Struktur. Wenn Licht auftrifft, wechselt es in den angeregten Zustand, wo kein Energieaufwand erforderlich ist, eine Drehung um eine Doppelbindung zu absolvieren. Das konnte 1975 simuliert werden. Und man hat dabei festgestellt, dass sich das in 100 Femtosekunden von cis zu trans bewegt. Und das kann man durch direkte Simulation darstellen. Die Frage ist, was man tut, wenn es um ein größeres System und nicht um Picosekunden, sondern um Sekunden oder Millisekunden geht. Hier muss man Größe und Zeit überbrücken. Und eine Möglichkeit der Behandlung großer, sehr großer Moleküle habe wir bereits 1975 realisiert: alle Seitenketten durch Kugeln ersetzen. Dieses Vorgehen wird als grobkörnige Modellierung bezeichnet. Und vor einigen Jahren entschieden wir uns dazu, dieses Modell so zu trainieren, dass es eine bessere Beschreibung der Energie großer Moleküle erstellt, indem wir dem Modell beibrachten, Elektrostatik zu verstehen. Elektrostatik ist wesentlich komplexer, als Sie vielleicht denken. Ich habe allein 50 Aufsätze darüber geschrieben. Aber letzten Endes ist es nicht schwer, Computern das Wichtigste beizubringen. Es gibt also Modelle - Sie werden in einer Minute sehen, wie gut sie funktionieren -, die sich auf elektrostatische Effekte großer Systeme konzentrieren. Man möchte auch Langzeitsimulationen machen. Im Kurzzeitbereich kann man mit der Newtonschen Dynamik arbeiten. Im Langzeitbereich verwendet man, wie dieser Fisch hier, die Brownsche Dynamik, für die man die Reibung braucht. Ich habe hier jetzt nicht die Zeit, Ihnen zu erklären, wie man den Reibungsfaktor findet. Ich werde das ganz kurz erklären, damit einige von Ihnen das verstehen. Wir nehmen das ganze System, wenden eine starke Kraft an. Wir nehmen ein einfaches System und wenden die gleiche Kraft mit Langevin-Dynamik an und so sorgen wir dafür, dass sich das System genauso verhält. Und wenn wir das tun, können wir Langzeitprozesse beschreiben. Jetzt folgt die langsamere Demonstration dessen, was man damit machen kann. Ich sagte bereits, dass es wirklich schöne, komplexe Systeme gibt, bei denen uns viel über die Struktur bekannt ist, beispielsweise F1 ATPase. Es gibt den zentralen, rotierenden Verbindungsschaft. Und wenn er sich dreht, reagiert ADP zu ATP und es entstehen hochenergetische Systeme. Es ist vieles bekannt, aber eines der Puzzleteilchen, das ursprünglich von Kinoshita entdeckt wurde, sind die drei Untereinheiten. Sie sollten sich in 120-Grad-Schritten drehen. Tatsächlich drehen sie sich um 80 Grad, halten an, machen die Chemie und setzen die Drehung dann um 40 Grad fort. Das versucht man auf der Grundlage der nicht einfachen Struktur zu verstehen. Was man wissen muss: Die Durchführung der vollständigen molekularen Dynamik ist aussichtslos, weil die Pfeile Hunderte kcal/mol ausmachen würden. Stattdessen nutzten wir dieses vereinfachte Modell von Shayan. Sie fand heraus, dass nach einer Drehung von 80 Grad eine elektrostatische Barriere auftritt und sich das System nicht weiterdrehen will. Und hier geschieht der chemische Prozess. Wenn man die Konformation durch Chemie ergänzt - das ist nur Konformationsenergie -, erhält man eine relativ komplexe Abbildung, die ich hier nicht beschreiben kann, die aber tatsächlich etwas darüber aussagt, wie die Natur ATP für die Arbeit nutzt, und das Gegenteil, wie man nämlich die Arbeit nutzen kann, um aus ADP ATP zu machen. Das hier ist die Drehrichtung des zentralen Schaftes. Das ist die Bewegungsrichtung von ATP zu ADP. Und wenn Sie Zeit haben, schauen Sie sich das hier an. Ich könnte Ihnen noch wesentlich mehr darüber erzählen, aber ich zeige Ihnen gleich ein besseres Beispiel. Ich erzähle Ihnen im Wesentlichen, was man eigentlich versucht. In einem weiteren Teil dieses Modells führen Protonenbewegungen von einer zur anderen Seite zu einer weiteren Drehung des Schafts. Darüber gibt es strukturelle Informationen, in eingeschränkterem Maße über einen C-Ring mit ionisierbarem Asparagin, A-Ring. Und man möchte gerne die Funktionsweise beschreiben können, nicht durch Erraten oder Annahmen, sondern durch Analyse der Struktur und Vorhersagen darüber, wie sie funktioniert. Das ist mit dem wasserangetriebenen System vergleichbar, dass ich Ihnen gezeigt habe. Es geht hier um eine vergleichbare Ebene des Verständnisses. Man muss also lernen, die Bewegung von Protonen zu beschreiben. Das hat die EVB getan. Man muss die Drehung beschreiben, wir haben nicht die Zeit. Aber wenn man letztendlich nicht zu einer solchen Darstellung mit Richtcharakteristik gelangt, hat man keine Erklärung für die Funktionsweise geliefert. Oft wird das damit erklärt, dass es funktioniert, weil es funktioniert, was extrem intelligent und überzeugend klingt. Aber sofern man keine Freie-Energie-Darstellung hat, die in eine Richtung weist, hat man keine Erklärung. Ich zeige Ihnen dazu ein Beispiel, das ich etwas langsamer abspiele. Und das ist Myosin V. Myosin V transportiert eine Ladung und bewegt sich nur in eine Richtung. Wiederum viel strukturelle Informationen, nicht wirklich vollständig, aber eine Menge. Eine Menge Einzelmolekülinformationen und dennoch bleibt der Grund für die Bewegung in eine Richtung vollständig undurchschaubar. Und um Ihnen dieses Rätsel zu veranschaulichen ... Wenn man sich in zwei Richtungen bewegt, macht man das normalerweise in der gleichen Geschwindigkeit. Dieselbe Wahrscheinlichkeit einer derartigen Bewegung. Das hier jedoch ... geschieht normalerweise nicht, es sei denn bei Menschen wie mir, die am Bein operiert worden sind. Man kann Myosin V aber keiner Operation unterziehen. Die Frage ist also, warum die Bewegung nur in eine Richtung verläuft. Und das möchte man von der Struktur ableiten. Wir fanden heraus, dass bei Betrachtung der Beugung dieses Myosin-Endes bei Berührung des Teils, auf dem es mit dem Aktin arbeitet, hier 11 Kilokalorien weniger vorhanden sind als hier. Und wenn man dieses Wissen mit der extrem komplizierten Biochemie aller Barrieren kombiniert, stellt man fest, dass die Bewegung vorwärts eine wesentlich geringere Barriere aufweist als die Bewegung rückwärts. Und das konnte man durch die Reproduktion von Einzelmolekülexperimenten verifizieren. Dafür muss man die Langevin-Dynamik anwenden. Und hier sehen Sie eine Anwendung dieses Modells ohne den Rest, aber einschließlich Reibung, und Sie können beobachten, wie es sich in nur eine Richtung bewegt. Und natürlich muss man das durch Mutationsexperimente ergänzen und verifizieren. Der erste Gang hat drei Monate gedauert, dann kämpft man zwei weitere Monate mit Gutachtern und dann vergehen drei Jahre, in denen man sich selbst und andere davon überzeugt, dass das richtig ist. Denselben Ansatz verwenden wir zur Untersuchung von Ionenkanälen, die mit einer Spannungsrichtung geschlossen und mit der anderen geöffnet werden konnten. Zur Modellierung des Gesamtsystems muss man lernen, die Elektroden, das Elektrolyt und alles andere zu modellieren. Und sofern man, zumindest heute, kein Multiskalenmodell verwendet, verschwendet man seine Zeit. Es gibt extrem leistungsstarke Computer, die eine Teilmodellierung oder auch die Modellierung eines einzelnen Ereignisses der Bewegung des Stroms ermöglichen. Aber die Verbindungen zu den Elektroden werden selbst von den leistungsstärksten Supercomputern nicht bewältigt. Wir konnten Gating-Ströme berechnen, eine weitere interessante Geschichte. Ich möchte mit einem weiteren Beispiel schließen. Das ist das Ribosom, das manchmal die Übertragung von Proteinen über das Translocon unterstützt. Und von Heijne gibt es wirklich wunderbare Experimente, wo er aufzeigt, dass die verschiedenen Peptide, die normalerweise im Ribosom gespeichert sind, nach innen gezogen werden, wenn sie die richtige Länge aufweisen und mit dem Translocon verbunden sind. Hier besteht also das Problem, dass man jedes Werkzeug, von dem man je gehört hat, einbeziehen muss. Man muss die chemischen Prozesse im Ribosom modellieren, was meiner Meinung nach derzeit nur mit dieser EVB korrekt möglich ist. Man müsste die Tatsache nachbilden, dass einige Peptide um einige Sequenzen höhere Barrieren aufweisen als andere. Man muss die Barrieren für die Bewegung durch das Translocon ermitteln. Auch für diese Ausführungen bräuchte ich eigentlich eine weitere halbe Stunde. Und letzten Endes erhält man ... Hier ist übrigens die Simulation der diffusen Bewegung wirklich wichtig, weil das grundsätzlich in 100 Peptiden pro Sekunde abläuft. Wenn man nicht die richtige Reibung hat, weiß man wirklich nicht, was geschieht. Denn es gibt so viele Faktoren, die wir nicht ganz genau kennen, etwa die Bewegung durch das Translocon. Und auch die Tatsache, dass das Protein spiralförmig wird, wenn es sich dorthin bewegt, muss in der Bewegung simuliert werden. Und letzten Endes braucht es normalerweise noch mal drei Monate, um herauszufinden, wie man das macht. Und wir ermittelten die Differenz zwischen Peptiden, die verzögert sind, und denen, die nicht verzögert sind, was von der Länge abhängig ist. So möchte ich die letzten 30 Sekunden mit der Bemerkung abschließen, dass man diesen Ansatz in der Arzneimittelforschung mit der Fragestellung einsetzen könnte: Welche negativen Bedingungen benötigt das Pathogen zum Überleben? Und da wir die chemischen Prozesse und die Bindung eines Wirkstoffs berechnen können und da wir - das hier ist beispielsweise die HIV-Protease - zum Überleben nach wie vor Chemie betreiben wollen, beschränkt dies die Möglichkeit für das Pathogen, dem Wirkstoff zu entkommen. Schließlich könnten wir dann eine Karte darüber erstellen, welche Mutationen durch das Virus erfolgen. Und dann könnte das in die Arzneimittelentwicklung einfließen. Letztendlich lautet meine Botschaft, dass alles elektrostatisch ist. Und hier sehen Sie die Menschen, mit denen ich zusammenarbeite. Vielen Dank. Applaus. Ende.

Arieh Warshel (2014)

Multiscale Simulations of the Functions of Biological Molecules

Arieh Warshel (2014)

Multiscale Simulations of the Functions of Biological Molecules

Abstract

Despite enormous advances in structural studies of biological systems we are frequently left without a clear structure–function correlation and cannot fully describe how different systems actually work. This introduces a major challenge for computer modeling approaches that are aimed at a realistic simulation of biological functions. The unresolved questions range from the elucidation of the basis for enzyme action to the understanding of the directional motion of complex molecular motors. Here we review progress in simulating biological functions, starting with the early stages of the field and the development of QM/MM approaches for simulations of enzymatic reactions. We provide overwhelming support for the idea that enzyme catalysis is due to electrostatic preorganization and then move to the renormalization approaches aimed at modeling long-time processes, demonstrating that dynamical effects cannot change the rate of the chemical steps in enzymes. Next we describe the use of our electrostatic augmented coarse-grained (CG) model and the renormalization method to simulate the action of different challenging complex systems. It is shown that our CG model produces, for the first time, realistic landscapes for vectorial process such as the actions of F1 ATPase, F0 ATPase and myosin V. Significantly, at present, to the best of our knowledge, these are the only studies that consistently reproduced (rather than assumed) a structure-based vectorial action of molecular motors. The emerging finding from all of our simulations is that electrostatic effects are the key to generating functional free energy landscapes.
References

Electrostatic Basis for Enzyme Catalysis, A. Warshel, P. K. Sharma, M. Kato, Y. Xiang, H. Liu and M. H. M. Olsson, Chem. Rev., 106, 3210 (2006).

Coarse-Grained (Multiscale) Simulations in Studies of Biophysical and Chemical Systems, S. C. L.Kamerlin, S. Vicatos, A. Dryga and A. Warshel, Ann. Rev. Phys. Chem. 62,41 (2011).

Content User Level

Beginner  Intermediate  Advanced 

Cite


Specify width: px

Share

COPYRIGHT

Content User Level

Beginner  Intermediate  Advanced 

Cite


Specify width: px

Share

COPYRIGHT


Related Content