Robert Aumann (2011) - Challenging Nash Equilibrium: Rational Expectation in Games

Nash Equilibrium is without doubt the most widely used solution concept in Game Theory, and also in its applications to Economics, Political Science, International Relations, Law, Business, Computers, Evolutionary Biology, and many other disciplines. Yet its conceptual foundations are murky

Good morning. First of all I’d like to pay my respects to John Nash, I mean he’s really the god of game theory, the parents of game theory were Von Neumann and Morgenstern, the god of game theory is John Nash, the high priest of game theory is Lloyd Shapley, so let me, you know pay my respects to John Nash. And having said that we’ve got to challenge the basic contribution that John Nash made. This paper is based on a paper in the AER, by Jacques Dreze and your humble servant, Rational Expectations in Games. And let’s get started. For those of you who don’t know, a Nash equilibrium of a game is defined as a profile of strategies, one for each player. Each of the strategies being optimal for that player given the strategies of the other players. So on the assumption that the player knows what the other players are doing, what he is planning to do or what he does, is best possible for him. Now this is without doubt, this concept is the most widely used solution concept, it’s the most widely used tool in game theory. And also in its applications to economics but not only in its applications to economics, also in its applications, in all its applications, political science to international relations, to law, to business, to computers, to evolutionary biology and to many other disciplines. Today I would say, I don’t think I’m far off the mark when I say that about between a quarter and a half of the papers in economic theory are based on game theory models. And essentially all of them use the concept of Nash equilibrium, it’s totally widely accepted and has been very successful in applications. Yet the conceptual foundations of Nash equilibrium are, shall we say, murky. It’s not clear what the justification for looking at Nash equilibrium is. The most, the outstanding query that relates to Nash equilibrium is: Why would you assume that the players know the other player’s strategies. Well we’re saying that each player maximises against the other player’s strategies, but how does he know what the other player’s strategies are. That is the basis of the query but let’s go back to the justification of Nash equilibrium. The most common justification and it was advanced already by Von Neumann and Morgenstern before Nash, when Von Neumann and Morgenstern were talking only about zero sum games. And the justification is that if game theory is to recommend strategies to the players in the game, then what is game theory if its taken as a prescriptive science, what is game theory supposed to do, it’s supposed to tell the players how to play. And if it is to recommend strategies to the players in a game, then the resulting strategy profile must be known. Because game theory predicts it, you can look it up in a game theory text book. So if there is to be a game theory, that’s what this justification says, then it’s going to propose strategies to the players in the game. And then these strategies will be known. And if they are known it follows that each strategy must be a best reply to the others. And that means exactly that the strategies constitute a Nash equilibrium. And what's wrong with that argument, it sounds foolproof but nevertheless when we’re playing a game we still don’t know what the other players are going to do. So what has gone wrong with this argument? And the answer is that game theory need not recommend any particular strategy. So the fundamental assumption that on a previous slide that if game theory is going to be good for anything, it has to recommend particular strategies, is unjustified. Well what should game theory do then, it needs to recommend a procedure for arriving at a strategy. And what do you mean by that and let me say right away, a procedure like that could be maximise your expected pay off, given how you think the others will play. And that, the resulting strategy would not be known to the other players, why would it not be known to the other players, it would not be known to the other players because the other players need not know how you think they will play, ok. You have some idea about how the other players will play and you will try to maximise against that and the other players know that, that you're trying to maximise against how you think they’ll play but they don’t know how you think they will play, ok. That is the catch. So a Nash equilibrium need not result. And indeed this approach was suggested by Kadane and Larkey in management science 1982 who suggested that games are no different from one person decision problem, that each player should simply maximise given his estimate of what the others would do. Just like in a one person decision, there is no need for game theory and they rather provocatively or one might even say, use the term viciously, attacked game theory saying it’s totally useless, they are not the first people to do that. But their paper was published immediately before the great flowering of applications of game theory to economics and many other disciplines. But they said there’s no point in this at all. But what is the mistake that they made, they’re basically right, why would a person want to treat the problem of how to act in a game differently from the problem of how to act in any decision situation, so they’re basically right. But the point is that they ignored the interactive nature of games. In other words in games you have to take into account that the other guy is also maximising against you or the other, I’m sorry, guy, gal, yes, is maximising against you. And how does this impact what you think that they’re going to do. And that’s where game theory comes in, ok. So it’s not that, they wrote, you know they used, I think they wrote a sentence like psychology is more important for this than game theory. And I think that that is incorrect because you have to try to figure in, factor in that the other guy is maximising. And how do you do this and I say that they didn’t have to ignore the interactive nature of games. We will basically follow their approach, while yes taking the interactive nature of games into account. So how do we do this? Ok there are a number of concepts that are needed over here, the first one is CKR, common knowledge of rationality. How does this work out. Taking the interactive nature of games into account means that when guessing what the others do, each player must take into account that they are guessing what he does, ok. You have to somehow take this into account. In a Nash equilibrium each player takes into account the other’s strategies, Nash equilibrium assumes that the players know the strategies, that these strategies are prescribed by game theory. Now the above suggests that each player take into account not the other’s strategies but their procedures for arriving at the strategies. In other words that they are maximising, they take into account the whole procedure, namely specifically that they are maximising against what they think the other players are doing, but also that they are taking into account that you’re maximising. So these procedures are based on utility maximisation which leads to a rational choice like Kadane and Larkey said. However since the procedures themselves involve taking into account the others’ procedures you are led to common knowledge of rationality. Which means that you know that the others are taking, you know that the others are rational, they’re maximising against that. And you know not only that they are rational but also that they are taking your knowledge, that they are taking into account that you are rational. And you know that they are taking into account that you know that they are rational and so on and that is common knowledge of rationality, that’s the definition of common knowledge of rationality. Ok let’s carry this further. Another fundamental building block in this is the notion of belief hierarchies, ok. So a rational player, one who maximises against his belief of what others do and that is what a rational player is defined to be. If he maximises against his belief of what others do, he must have a belief of what others do. So if he is to take into account that the others are also rational then he must have a belief about their beliefs. Ok he’s not sure what their beliefs are but he must have a belief about their beliefs, and so on. So in principle common knowledge of rationality involves an infinite hierarchy of beliefs, beliefs about beliefs and so on. So the first person to realise, to build a model of this kind was John Harsanyi who was awarded the Bank of Sweden Prize in memory of Alfred Nobel, now there’s no more time now for the rest of the talk (laugh) in economic science, together with John Nash and Professor Reinhard Selten from whom we’ll hear tomorrow, he’s at this conference, I don’t know if he’s in the room or not. So he was the first one to capture this idea and in a very beautiful way which we’ll talk about by and by. This idea of an infinite hierarchy of beliefs. Now this sounds extremely complex, yet as we shall see we can draw from it simple and easily calculable conclusions. Now one more building block is needed and that is the building block of common priors. The Common Prior Axiom says that beliefs are based only on information. That players with precisely the same information do not entertain different beliefs. When there is no economic basis, when there’s no objective basis for holding different beliefs then people will not have different beliefs. Beliefs are, you know even your genetic make up can be a part of your information, if there’s no reason to have different beliefs you're not going to have different beliefs. That’s what the Common Prior Axiom says. Now this axiom has been the subject of some discussion in the economic literature, it’s somewhat controversial. In theory it’s somewhat controversial, in practice though it is almost universally used. In economic models that have, almost, not entirely, there are 2 or 3 papers, there’s a Harrison and Kreps paper that does not use the Common Prior Axiom but in practice it is almost universally used. Technically the Common Prior Axiom says that all the players’ beliefs can be derived from a single prior by updating with different information partition. So you take a single prior, at that point, everybody is assumed to have the same information, now people get different information and they update from that single prior. So the assumptions that we’re going to use, we’re going to use the assumption of common knowledge of rationality and the common prior assumption. And then basically using those 2 building blocks we’ll see what the Kadane and Larkey approach says. Ok the approach of not treating games differently from one person decision situations. Let’s get to the formal definitions, in a given game the players beliefs are called rational if common knowledge of rationality and the Common Prior Axiom obtains. And we are going to say that a rational expectation of a player is her expectations under some set of rational beliefs. So in a Nash equilibrium what we have is that each player’s strategy is best given the other strategies. With rational beliefs each player’s procedure is best given the other’s procedures, ok. Now this is the background, the introduction so to speak and the definitions. Where do these ideas lead us, what do we get in practice with the idea of rational expectations. You know in practice, it’s not quite as practical as, or not immediately as practical perhaps as Professor Prescott’s presentation here, it’s a little different kind of economics. But I think it is in fact practical. So we have 2 basic theorems, 2 basic results. First of all there is a test that one can use to test any solution concept in strategic game theory. And that is what does it say about two-person zero-sum games, ok. And actually this research started when Jacques Dreze asked me about 15 years ago, Bob how can we generalise the notion of the value of the two-person zero-sum game to games that are not zero sum. The thinking that is behind the value of a two-person zero-sum game, how does it generalise when the game is not zero sum. So we both thought about this, you know for like 13 years and then finally we published our answer in ’08. But if we’re going to answer that question then the answer has to give the value for twoperson zero-sum games. And indeed it does, ok. The usual justifications for the value in a two-person zero-sum game are also somewhat shaky and I think this gives a solid foundation for the notion of the value, the mini-max value of a two-person zero-sum game. Now what about, so this is a sort of, a benchmark, a test, does this theory hold up when you apply it to a situation where you know what the answer should be, you don’t quite know the question but you know what the answer should be? And the answer is yes it does. But in general how can we calculate the rational expectations of a game. So the answer is that the rational expectations of a player in a game are precisely her conditional pay offs. So the expected pay offs to her individual pure strategies when a correlated equilibrium is played in the doubled game. I’m not going to, I don’t have time to explain what a correlated equilibrium is, I’ll illustrate it a little bit, I’m not going to define it. And what is the doubled game, the doubled game is the game in which each of a pure strategy is written twice. Let me illustrate this. Ok let’s take this game, this is a famous game which was devised by Lloyd Shapley about 40 years ago to answer a question in game theory, I’m not going to go into that now, it’s a famous game. This has a single Nash equilibrium in mixed strategies. And that Nash equilibrium is that each player must play each of his 3 strategies with probability one third each. And that’s the only Nash equilibrium and the pay off is 3, 3. And it looks crazy because lets say the player 1 would play top, ok, he announces he’s going to play top and player 2 would play middle, right, because he gets 5, that’s his best response to top. Now that is not a Nash equilibrium because then player 1 could play bottom and get 5. But in answering, in giving best responses you cycle among the 4, 5 and the 5, 4 and the 4, 5 and the 5, 4, you cycle among those but you never get to 3, 3, right, 4, 5 anyway is better than, for both players than 3, 3. Nevertheless the only Nash equilibrium is wanted and this game sort of epitomises some of the things that are wrong with Nash equilibrium. Now this has a correlated equilibrium in which each of the non zero pay offs gets probability one sixth and then that has an expected pay off of 4½, ok. There are other correlated equilibrium of this game. Now what does a doubled game look like, the doubled game looks like this, ok. You just write, so let’s say the protagonist, the player we’re looking at, we just write each of her strategies twice, that’s all. Now one would think that no self respecting tool, no self respecting solution concept in game theory would treat this game differently from the original game, it’s just that each strategy is written twice, what difference does it make. But in fact it does make a difference. You see the conditional pay offs to correlated equilibria change when the game is doubled. There are then more such pay offs. In the above example, let’s go back to that, in the original game 5 is not a conditional pay off to a correlated equilibrium. Whereas in the doubled game it is and here is a correlated equilibrium of the doubled game. You see there are 2 types of the red player. In one type she knows that the blue player is going to play right. All together it has a probability of one twelfth but the others, the first row she knows that the blue player is going to pay right. For the blue player himself, for him it doesn’t look different than the previous game but for her it looks different, she knows and this actually, the conditional pay off to the first strategy is 5 for the red player. I’m just going to give you, 5 is the conditional pay off to the top strategy. I’m going to skip this slide. And try to give you an idea, very briefly of why this is the case, why the doubled game is the right way to look at it. So suppose there are just 2 players, a belief hierarchy of a player can be represented by a type of that player, a la Harsanji. Each type of each player is characterised by a pure strategy of that player and probabilities for the other player’s types. Having a common prior means that these probabilities are conditionals that derive from a single distribution on pairs of types. What am I talking about, in example 2 the situation might look like this. Ok here we have, this is not a game matrix, this is a type matrix. So we have 3 types of the red player who play the first strategy. We have 4 types that play the centre and we have 2 types that play bottom. And similarly for the blue player. And there is a probability distribution on this, I’ve probably lost most of you but in any good lecture I think, in any good lecture eventually less and less people understand the lecture as one is going on. So just retain the first part, in the end I’m not going to understand it myself, ok. Ok so here the rows and the columns are types, the entries in the matrix are probabilities that add to one overall and that’s the common prior. And requiring common knowledge of rationality means that it is optimal for each type to play the pure strategies that that type specifies, ok. So the entries for T1 for example, he is given the probabilities that are written in the top row are the probabilities, the prior probabilities that the player plays T1 and that the blue player plays whatever numbers are written in there. So this will be, what this really says is that this is a correlated equilibrium of this game. The rows and columns are now pure strategies whose conditional pay offs are the expectations of the corresponding types. And if you are playing, if the red player is playing T1 then she doesn’t care about the other, the types T2 and T3 of the players, what she, the pay off that she is going to get is going to be the conditional pay off to T1 and you can add up the probabilities for T2 and T3 and all the other probabilities so you're going to get a correlated equilibrium of this game. And you will, this yields also a correlated, you can now amalgamate the other rows and you get a correlated equilibrium of this game which is also a correlated equilibrium of the doubled game. And I’m going to give you a bonus of about 30 seconds by ending right here and for those of you who do not understand German, thank you.

Guten Morgen. Zuallererst möchte ich mich vor John Nash verneigen - er ist wirklich der Gott der Spieltheorie. Die Eltern der Spieltheorie waren von Neumann und Morgenstern, doch der Gott der Spieltheorie ist John Nash. Ihr Hohepriester ist Lloyd Shapley. Lassen Sie mich also John Nash meinen Respekt zollen. Nichtsdestoweniger müssen wir den grundlegenden Beitrag, den John Nash geleistet hat, in Frage stellen. Dieser Vortrag basiert auf einer im AER erschienen Arbeit von Jacques Dreze und meiner Wenigkeit mit dem Titel "Rational Expectations in Games" (Rationale Erwartungen bei Spielen). Fangen wir an. Falls es jemand von Ihnen noch nicht wissen sollte: Das Nash-Gleichgewicht eines Spiels ist definiert als Strategieprofil, jeweils eines für jeden Spieler, wobei jede der Strategien angesichts der Strategien der anderen Spieler für diesen Spieler optimal ist. Unter der Annahme also, dass der Spieler weiß, was die anderen Spieler tun, ist das, was er plant bzw. tut das für ihn Bestmögliche. Dieses Konzept ist zweifellos das am häufigsten verwendete Lösungskonzept; es ist das in der Spieltheorie am häufigsten verwendete Instrument. Auch in den ökonomischen Anwendungen der Spieltheorie, aber nicht nur dort - in all ihren Anwendungen: Politikwissenschaft, internationale Beziehungen, Recht, Geschäftsleben, Computer, evolutionäre Biologie und in vielen anderen Disziplinen. Ich glaube nicht, dass ich weit danebenliege, wenn ich sage, dass heutzutage etwas mehr als ein Viertel der Arbeiten in ökonomischer Theorie auf Modellen der Spieltheorie beruhen. Und praktisch alle davon verwenden das Konzept des Nash-Gleichgewichts. Es ist weithin vorbehaltlos akzeptiert und war in der Anwendung sehr erfolgreich. Und doch sind die konzeptionellen Grundlagen des Nash-Gleichgewichts, sagen wir, unklar - es ist nicht klar, worin die Rechtfertigung für die Heranziehung des Nash-Gleichgewichts liegt. Die am häufigsten gestellte, wichtigste Frage zum Nash-Gleichgewicht lautet: Warum sollte man annehmen, dass die Spieler die Strategien der anderen Spieler kennen? Wir sagen, dass jeder Spieler seine Auszahlung vor dem Hintergrund der Strategien der anderen Spieler maximiert, doch woher weiß er, wie die Strategien der anderen Spieler beschaffen sind? Das ist die Grundlage der Frage, doch lassen Sie uns auf die Rechtfertigung für das Nash-Gleichgewicht zurückkommen - auf die am weitesten verbreitete Rechtfertigung, die von Neumann und Morgenstern schon vor Nash vorgebracht hatten, als sie nur über Nullsummenspiele sprachen. Die Rechtfertigung lautet wie folgt: Wenn die Spieltheorie darin besteht, den Teilnehmern am Spiel Strategien zu empfehlen - wenn sie als präskriptive Wissenschaft aufgefasst wird, worin besteht dann die Spieltheorie, was ist ihre Aufgabe? Ihre Aufgabe ist es, den Spielern zu sagen, wie sie zu spielen haben. Und wenn sie den Teilnehmern eines Spiels Strategien empfehlen soll, muss das daraus folgende Strategieprofil bekannt sein. Da es von der Spieltheorie vorhergesagt wird, können Sie es in einem Spieltheorie-Lehrbuch nachschlagen. Wenn es also eine Spieltheorie geben soll - so diese Rechtfertigung - dann wird sie den Teilnehmern am Spiel Strategien vorschlagen. Diese Strategien werden dann bekannt sein. Und wenn sie bekannt sind, so folgt daraus, dass jede Strategie zwangsläufig die beste Reaktion auf die anderen ist. Und genau das bedeutet, dass die Strategien ein Nash-Gleichgewicht bilden. Was stimmt mit diesem Argument nicht? Es klingt narrensicher, doch wenn wir ein Spiel spielen, wissen wir trotzdem immer noch nicht, was die anderen Spieler tun werden. Was ist also mit dem Argument nicht in Ordnung? Die Antwort lautet: Die Spieltheorie muss nicht unbedingt eine bestimmte Strategie empfehlen. Die auf der vorhergehenden Folie enthaltene Grundannahme, dass die Spieltheorie, wenn sie überhaupt für etwas gut sein soll, bestimmte Strategien empfehlen soll, ist nicht gerechtfertigt. Was sollte die Spieltheorie dann tun? Sie hat ein Verfahren zu empfehlen, wie man zu einer Strategie gelangt. Was meine ich damit? Nun - ein derartiges Verfahren könnte in Folgendem bestehen: Maximiere die erwartete Auszahlung vor dem Hintergrund deiner Vermutung darüber, wie die anderen spielen werden. Und die daraus resultierende Strategie wäre den anderen Spielern nicht bekannt. Warum wäre sie den anderen Spielern nicht bekannt? Sie wäre den anderen Spielern nicht bekannt, weil die anderen Spieler deine Vermutung darüber, wie sie spielen werden, nicht unbedingt kennen. Du hast bestimmte Vorstellungen darüber, wie die anderen Spieler spielen werden, und du wirst versuchen, die Auszahlung vor diesem Hintergrund zu maximieren. Die anderen Spieler wissen das, sie wissen, dass du versuchst, die Auszahlung vor dem Hintergrund deiner Vermutung darüber, wie sie spielen werden, zu maximieren. Was sie nicht kennen, ist deine Vermutung darüber, wie sie spielen werden. Das ist der Haken an der Sache. Es muss also kein Nash-Gleichgewicht herauskommen. Tatsächlich wurde dieser Ansatz von Kadane und Larkey 1982 in Management Science vorgeschlagen. Sie brachten vor, dass sich Spiele von dem Entscheidungsproblem einer einzelnen Person nicht unterscheiden; dass jeder Spieler die Auszahlung einfach vor dem Hintergrund seiner Einschätzung darüber, was die anderen tun würden, maximieren sollte. Genauso wie bei der Entscheidung einer Einzelperson besteht kein Bedarf nach Spieltheorie. Und sie griffen die Spieltheorie ziemlich provokativ, man könnte fast sagen: boshaft an, indem sie sie als vollkommen nutzlos bezeichneten. Sie waren nicht die Ersten, die das taten, doch ihre Arbeit erschien unmittelbar vor der Blütezeit der Spieltheorie-Anwendungen auf die Ökonomie und viele andere Disziplinen. Sie allerdings waren der Ansicht, dass es für diese Anwendungen nicht den geringsten Grund gibt. Doch worin besteht der Fehler, den sie begingen? Grundsätzlich hatten sie Recht - warum würde eine Person das Problem, wie sie sich in einem Spiel zu verhalten hat, anders behandeln als das Problem, wie sie sich in einer beliebigen Entscheidungssituation zu verhalten hat? Grundsätzlich hatten sie also Recht. Die Sache ist nur die, dass sie den interaktiven Charakter von Spielen übersahen. Anders ausgedrückt: In Spielen muss man berücksichtigen, dass der Andere die Auszahlung im Verhältnis zu dir oder einem anderen ebenfalls maximiert, Entschuldigung, der oder die andere maximiert die Auszahlung. Und wie wirkt sich das auf deine Vermutung darüber aus, was sie tun werden? An diesem Punkt setzt die Spieltheorie ein. Ich glaube, sie schrieben den Satz, dass Psychologie hierfür wichtiger sei als Spieltheorie. Das ist meiner Ansicht nach falsch, denn man muss ja in Rechnung stellen, dass auch der Andere die Auszahlung maximiert. Und man muss herausfinden, wie man das macht. Ich behaupte, sie mussten den interaktiven Charakter von Spielen nicht ignorieren. Wir werden ihrem Ansatz grundsätzlich folgen, wobei wir aber den interaktiven Charakter von Spielen in Rechnung stellen. Wie machen wir das? Es gibt eine Anzahl von Konzepten, die hierfür benötigt werden. Das erste ist CKR - Common Knowledge of Rationality - also das gegenseitige Wissen von rationalem Verhalten. Wie funktioniert das? Die Berücksichtigung des interaktiven Charakters von Spielen bedeutet, dass jeder Spieler, wenn er Vermutungen darüber anstellt, was die anderen tun, berücksichtigen muss, dass sie Vermutungen darüber anstellen, was er tut. Das muss man irgendwie berücksichtigen. In einem Nash-Gleichgewicht berücksichtigt jeder Spieler die Strategien der anderen; beim Nash-Gleichgewicht wird vermutet, dass die Spieler die Strategien kennen, dass diese Strategien von der Spieltheorie vorgeschrieben werden. Nach dem oben Gesagten ist es naheliegend, dass die jeweiligen Spieler nicht die Strategien der anderen berücksichtigen, sondern deren Verfahren, mit denen sie zu ihren Strategien gelangen. In anderen Worten: dass sie die Auszahlung maximieren, dass sie das ganze Verfahren mit einbeziehen, insbesondere, dass sie die Auszahlung demgegenüber maximieren, was die anderen Spieler ihrer Meinung nach tun, dass sie aber auch in Betracht ziehen, dass man selbst die Auszahlung maximiert. Diese Verfahren beruhen also auf Nutzenmaximierung, was zu einer rationalen Entscheidung führt, wie Kadane und Larkey sagten. Da allerdings die Verfahren selbst beinhalten, dass die Verfahren der Anderen berücksichtigt werden, landet man schließlich beim gegenseitigen Wissen von rationalem Verhalten. Das bedeutet: Man weiß, was die anderen einkalkulieren, man weiß, dass die anderen rational sind, sie betreiben Maximierung vor diesem Hintergrund. Und man weiß nicht nur, dass sie rational sind, sondern auch, dass sie die Tatsache berücksichtigen, dass man selbst rational ist. Und man weiß, dass sie berücksichtigen, dass man selbst weiß, dass sie rational sind und so weiter. Das ist gegenseitiges Wissen von rationalem Verhalten, das ist die Definition des gegenseitigen Wissens von rationalem Verhalten. Gehen wir einen Schritt weiter. Ein weiterer Grundbaustein ist die Idee von Glaubenshierarchien. Ein rationaler Spieler ist einer, der Maximierung vor dem Hintergrund seiner Vorstellung davon betreibt, was andere tun. So wird ein rationaler Spieler definiert. Betreibt er Maximierung vor dem Hintergrund dessen, was andere tun, muss er eine Vorstellung davon haben, was andere tun. Wenn er berücksichtigen soll, dass die anderen ebenfalls rational sind, muss er eine Vorstellung von ihren Vorstellungen haben. Er kann nicht sicher sein, was sie für Vorstellungen haben, aber er muss eine Vorstellung von ihren Vorstellungen haben und so weiter. Grundsätzlich also beinhaltet das gegenseitige Wissen von rationalem Verhalten eine unendliche Hierarchie von Vorstellungen, Vorstellungen über Vorstellungen und so weiter. Die erste Person, die ein Modell dieser Art entwickelt hat, war John Harsanyi, der den Nobelpreis... Entschuldigung: den Preis der Bank von Schweden für Wirtschaftswissenschaften zum Gedächtnis von Alfred Nobel erhielt - damit ist unsere Zeit um - zusammen mit John Nash und Professor Reinhard Selten, den wir morgen hören werden. Er nimmt an dieser Konferenz teil, aber ich weiß nicht, ob er hier im Saal ist. Er war also der Erste, der diese Idee aufgegriffen hat, und zwar auf eine sehr schöne Art und Weise; darüber werden wir sogleich sprechen. Diese Idee einer unendlichen Hierarchie von Vorstellungen. Das klingt jetzt extrem kompliziert, doch wie wir sehen werden, können wir daraus einfache und leicht zu berechnende Schlüsse ziehen. Wir brauchen noch einen weiteren Baustein, und das ist der Baustein "gemeinsames Vorwissen" (common priors). Das Common Prior-Axiom besagt, dass Vorstellungen ausschließlich auf Informationen beruhen; dass Spieler mit exakt den gleichen Informationen keine unterschiedlichen Vorstellungen entwickeln. Wenn es keine ökonomische Grundlage, keine objektive Grundlage für unterschiedliche Vorstellungen gibt, dann haben die Menschen auch keine unterschiedlichen Vorstellungen. Wie Sie wissen, kann sogar Ihre genetische Ausstattung Teil Ihrer Informationen sein. Wenn es aber keinen Grund für unterschiedliche Vorstellungen gibt, dann haben Sie keine unterschiedlichen Vorstellungen. Das ist es, was das Common Prior-Axiom sagt. Nun, dieses Axiom war Gegenstand einiger Diskussionen in der wirtschaftswissenschaftlichen Literatur; es ist nicht unumstritten. In der Theorie ist es jedenfalls nicht unumstritten; in der Praxis wird es allerdings fast durchgängig verwendet. Fast, nicht ganz - es gibt zwei oder drei Arbeiten... es gibt eine Arbeit von Harrison und Kreps, in der das Common Prior-Axiom nicht verwendet wird. In der Praxis jedoch wird es fast überall verwendet. Im Prinzip besagt das Common Prior-Axiom, dass die Vorstellungen aller Spieler durch Aktualisierung mittels einer unterschiedlichen Informationspartition von einer einzigen Vorannahme abgeleitet werden können. Man nimmt also eine einzelne Vorannahme, wobei an dieser Stelle angenommen wird, dass alle die gleichen Informationen haben. Nun erhalten die Menschen verschiedene Informationen, anhand derer sie die einzelne Vorannahme aktualisieren. Wir werden also die Annahme des gegenseitigen Wissens von rationalem Verhalten und die gemeinsame Vorannahme heranziehen. Und indem wir im Grunde nur diese beiden Bausteine verwenden, werden wir erkennen, was der Ansatz von Kadane und Larkey aussagt, also der Ansatz, dass Spiele nicht anders zu behandeln sind als Entscheidungssituationen einer Person. Kommen wir zu den formalen Definitionen. In einem vorgegebenen Spiel werden die Vorstellungen der Spieler rational genannt, wenn das gegenseitige Wissen von rationalem Verhalten sowie das Common Prior-Axiom zugrunde gelegt werden. Und wir sagen, die rationale Erwartung eines Spielers ist eine Erwartung aufgrund rationaler Vorstellungen. In einem Nash-Gleichgewicht ist die Strategie eines jeden Spielers angesichts der Strategien der anderen die beste. Bei rationalen Vorstellungen ist das Verfahren eines jeden Spielers angesichts der Verfahren der anderen das Beste. Das ist also der Hintergrund, sozusagen die Einleitung und die Begriffsbestimmungen. Wohin führen uns diese Ideen, was erhalten wir in der Praxis durch die Idee rationaler Erwartungen? Wissen Sie, tatsächlich ist sie nicht ganz so praktisch, oder nicht so unmittelbar praktisch wie Professor Prescotts Präsentation, es ist eine etwas andere Art von Ökonomie. Doch ich glaube, dass sie in der Tat praktisch ist. Wir haben also zwei grundlegende Theoreme, zwei Grundresultate. Zunächst einmal gibt es einen Test, mit dem man jedes Lösungskonzept in strategischer Spieltheorie überprüfen kann, nämlich: Was sagt es über Zwei-Personen-Nullsummenspiele aus? Eigentlich begann diese Forschungsarbeit, als mich Jacque Dreze vor etwa 15 Jahren fragte: Bob, wie können wir den Begriff des Wertes eines Zwei-Personen-Nullsummenspiels gegenüber Spielen, die keine Nullsummenspiele sind, verallgemeinern? Hinter dem Wert eines Zwei-Personen-Nullsummenspiels steht der Gedanke: Wie wird es verallgemeinert, wenn das Spiel kein Nullsummenspiel ist? Wir dachten also beide darüber nach, etwa 13 Jahre lang, und im Jahr 2008 veröffentlichten wir schließlich unsere Antwort. Wenn wir die Frage beantworten, muss die Antwort den Wert für ein Zwei-Personen-Nullsummenspiel ergeben. Und das tut sie tatsächlich. Die üblichen Begründungen für den Wert in einem Zwei-Personen-Nullsummenspiel sind ebenfalls etwas dubios, und ich glaube, hier haben wir eine solide Grundlage für den Begriff des Wertes, des Mindest- und Höchstwertes eines Zwei-Personen-Nullsummenspiels. Das ist also eine Art von Richtwert, ein Test: Kann sich diese Theorie behaupten, wenn man sie auf eine Situation anwendet, bei der man weiß, wie die Antwort lauten sollte - die Frage kennt man nicht genau, aber man weiß, wie die Antwort lauten sollte? Und die Antwort lautet: Ja, das kann sie. Wie aber können wir generell die rationalen Erwartungen eines Spiels berechnen? Die Antwort lautet, dass die rationalen Erwartungen eines Spielteilnehmers genau seinen bedingten Auszahlungen entsprechen, also den aufgrund seiner individuellen, reinen Strategien erwarteten Auszahlungen, wenn in dem "doppelten" Spiel ein korreliertes Gleichgewicht herrscht. Meine Zeit reicht nicht aus, um zu erklären, was ein korreliertes Gleichgewicht ist. Ich werde es ein wenig veranschaulichen, aber nicht definieren. Und was ist ein doppeltes Spiel? Ein doppeltes Spiel ist ein Spiel, in dem jede reine Strategie zweimal geschrieben wird. Lassen Sie mich das veranschaulichen. Nehmen wir dieses Spiel - ein berühmtes Spiel, das von Lloyd Shapley etwa vor 40 Jahren entwickelt wurde, u m eine Frage der Spieltheorie zu beantworten. Ich werde darauf jetzt nicht eingehen, es ist ein berühmtes Spiel. Es hat ein einziges Nash-Gleichgewicht aus gemischten Strategien, und dieses Nash-Gleichgewicht besteht darin, dass jeder Spieler jede seiner drei Strategien mit einer Wahrscheinlichkeit von jeweils einem Drittel spielen muss. Das ist das einzige Nash-Gleichgewicht, und die Auszahlung ist 3, 3. Es sieht verrückt aus, denn sagen wir, Spieler 1 würde oben spielen - er gibt bekannt, dass er oben spielen wird. Spieler 2 würde Mitte spielen, nicht wahr, denn er bekommt 5, das ist seine beste Antwort auf oben. Das ist nun kein Nash-Gleichgewicht, da Spieler 1 danach unten spielen und 5 erhalten könnte. Doch um die beste Antwort zu geben, bewegt man sich zwischen 4, 5 und 5, 4 und 4, 5 und 5, 4, man bewegt sich hin und her, aber man kommt nie zu 3, 3, nicht wahr, 4, 5 ist für beide Spieler auf jeden Fall besser als 3, 3. Dennoch ist das einzige Nash-Gleichgewicht ein Drittel, und dieses Spiel versinnbildlicht in gewisser Weise einige der Dinge, die mit dem Nash-Gleichgewicht nicht stimmen. Dieses Spiel hat ein korreliertes Gleichgewicht, bei dem jede Nicht-Nullauszahlung eine Wahrscheinlichkeit von einem Sechstel erhält und das damit eine erwartete Auszahlung von 4 1/2 hat. Es gibt weitere korrelierte Gleichgewichte dieses Spiels. Wie sieht nun ein doppeltes Spiel aus? Ein doppeltes Spiel sieht aus wie dieses. Der Protagonist, der Spieler, den wir im Auge haben - wir schreiben einfach jede seiner Strategien zweimal, das ist alles. Man könnte nun glauben, dass kein anständiges Instrument, kein anständiges Lösungskonzept in der Spieltheorie dieses Spiel anders behandeln würde als das ursprüngliche Spiel. Es ist nur so, dass jede Strategie zweimal geschrieben wird, was macht das schon für einen Unterschied? Tatsächlich aber macht es einen Unterschied. Sie sehen, dass sich die bedingten Auszahlungen aus den korrelierten Gleichgewichten ändern, wenn das Spiel verdoppelt wird. Es gibt dann mehr von diesen Auszahlungen. Im obigen Beispiel - lassen Sie uns darauf zurückkommen - im ursprünglichen Spiel ist 5 keine bedingte Auszahlung aus einem korrelierten Gleichgewicht. Im doppelten Spiel ist es dagegen eine, und hier haben wir ein korreliertes Gleichgewicht des doppelten Spiels. Sie sehen, es gibt zwei Arten des roten Spielers. In der einen Art weiß er, dass der blaue Spieler richtig spielen wird. Insgesamt hat das eine Wahrscheinlichkeit von einem Zwölftel, doch in der ersten Reihe weiß er, dass der blaue Spieler richtig spielen wird. Für den blauen Spieler sieht die Sache nicht anders aus als im vorherigen Spiel. Für ihn aber sieht es anders aus - er weiß tatsächlich, dass die bedingte Auszahlung aus der ersten Strategie für den roten Spieler 5 ist. Diese Folie überspringe ich. Ich werde versuchen, Ihnen in aller Kürze eine Vorstellung davon zu vermitteln, warum das so ist, warum das doppelte Spiel die richtige Art der Betrachtungsweise ist. Nehmen wir an, es gibt nur zwei Spieler. Die Vorstellungshierarchie eines Spielers kann durch einen Typ dieses Spielers verkörpert werden, nach der Art von Harsanyi. Jeder Typ eines jeden Spielers wird durch eine reine Strategie dieses Spielers sowie durch Wahrscheinlichkeiten für die Typen des anderen Spielers charakterisiert. Ein gemeinsames Vorwissen bedeutet, dass diese Wahrscheinlichkeiten Konditionale sind, die sich aus einer einfachen Verteilung auf Typenpaare herleiten lassen. Wovon spreche ich? In Beispiel 2 könnte die Situation folgendermaßen aussehen. Was wir hier haben, ist keine Spielmatrix, es handelt sich um eine Typenmatrix. Wir haben also drei Typen des roten Spielers, die die erste Strategie spielen. Wir haben drei Typen, die die mittlere spielen und zwei Typen, die die untere spielen. Für den blauen Spieler ist es ähnlich. Es gibt dabei eine Wahrscheinlichkeitsverteilung... die meisten von Ihnen können wahrscheinlich nicht mehr folgen, aber ich denke, bei jedem guten Vortrag können letztendlich immer weniger Zuhörer dem Lauf des Vortrags folgen. Behalten Sie also einfach den ersten Teil im Gedächtnis; am Ende verstehe ich selbst auch nichts mehr. Hier sind also die Zeilen und Spalten Typen, die Einträge in die Matrix sind Wahrscheinlichkeiten, die sich zu einer summieren, und das ist das gemeinsame Vorwissen. Und das Erfordernis des gegenseitigen Wissens von rationalem Verhalten bedeutet, dass es für jeden Typen optimal ist, diejenige reine Strategie zu spielen, die den betreffenden Typen beschreibt. Zum Beispiel die Einträge für T1 - die in der oberen Zeile eingetragenen Wahrscheinlichkeiten sind die Wahrscheinlichkeiten, die Zugehörigkeitswahrscheinlichkeiten, dass der Spieler T1 spielt und dass der blaue Spieler eine beliebige der dort eingetragenen Zahlen spielt. Was uns das wirklich sagt, ist, dass es sich hierbei um ein korreliertes Gleichgewicht dieses Spiels handelt. Die Zeilen und Spalten sind jetzt reine Strategien, deren bedingte Auszahlungen den Erwartungen des jeweiligen Typs entsprechen. Und wenn der rote Spieler T1 spielt, dann kümmert er sich nicht um die anderen, um die Spielertypen T2 und T3. Die Auszahlung, die er erhalten wird, ist die bedingte Auszahlung aus T1. Man kann die Wahrscheinlichkeiten von T2 und T3 und alle anderen Wahrscheinlichkeiten addieren und erhält dadurch ein korreliertes Gleichgewicht dieses Spiels. Jetzt kann man die anderen Reihen miteinander vereinigen und erhält ein korreliertes Gleichgewicht dieses Spiels, bei dem es sich auch um ein korreliertes Gleichgewicht des doppelten Spiels handelt. Ich schenke Ihnen ungefähr 30 Sekunden, indem ich jetzt Schluss mache. Für diejenigen unter Ihnen, die kein Deutsch sprechen: Thank You.

Robert Aumann (2011)

Challenging Nash Equilibrium: Rational Expectation in Games

Robert Aumann (2011)

Challenging Nash Equilibrium: Rational Expectation in Games

Abstract

Nash Equilibrium is without doubt the most widely used solution concept in Game Theory, and also in its applications to Economics, Political Science, International Relations, Law, Business, Computers, Evolutionary Biology, and many other disciplines. Yet its conceptual foundations are murky. The most common justification - offered already by von Neumann and Morgenstern - is that if Game Theory is to recommend strategies to the players in a game, then the resulting strategy profile must be known; for example, because it could be read off from a game theory text. It follows that each strategy must be a best reply to the others, which means that the strategies constitute a Nash equilibrium.

The difficulty with this is that Game Theory need not recommend any particular strategy. Rather, it needs to recommend a *procedure* for arriving at a strategy. For example, such a procedure could be, "maximize your expected payoff given how you think the others will play." The resulting strategy of a player would not be known to the others, so a Nash equilibrium need not result.

Other serious criticisms of Nash equilibrium have been raised, inter alia by Bernheim and by Pearce in their 1984 Econometrica articles introducing the concept of rationalizability. Yet whereas that concept became widely known and applied, their criticism of Nash equilibrium was largely ignored. Perhaps, that is because rationalizability is a fairly "loose" concept; in many games it is very far from providing precise solutions. In particular, in the benchmark case of two-person zero-sum games, it can yield payoffs that are very far from the value.

The lecture will explore these ideas. We will see that they lead to a solution notion that while somewhat "looser" than Nash equilibrium, is still fairly "tight;" in particular, in two-person zero-sum games, it does yield precisely the value. Auxiliary use will be made of the concept of correlated equilibrium.

The lecture is based on joint work with Jacques Dreze.

------------------------

Recommended Readings:

R. Aumann and J. Dreze, "Rational Expectations in Games," American Economic Review 98 (2008), pp. 72-86.
http://www.ma.huji.ac.il/raumann/pdf/86.pdf

Wikipedia: Correlated Equilibrium
http://en.wikipedia.org/wiki/Correlated_equilibrium

Cite


Specify width: px

Share

COPYRIGHT

Cite


Specify width: px

Share

COPYRIGHT


Related Content