715 88 3MB
Spanish; Castilian Pages 244 [266] Year 2008
Table of contents :
Economía, sociedad y teoría de juegos
Página Legal
Contenido
Presentación
Pirmera Parte
C a p í t u l o 1
1. Introducción
2. Economía sin juegos
3. Juegos sin economía
4. La economía con juegos
5. El futuro de la economía con juegos
6. Conclusión
C a p í t u l o 2
1. Introducción
2. Un problema complejo que siempre ha despertado interés
3. Criterios para la evaluación de soluciones
4. Las instituciones como mecanismo de transformación de las preferencias individuales en colectivas
5. Las instituciones son algo más que un buen arreglo
6. Conclusión
C a p í t u l o 3
1. Introducción
2. El punto de partida en la teoría social. La obra de Neil Smelser
3. El problema de los microfundamentos
4. El problema de las normas sociales
5. Normas sociales y comportamiento colectivo
6. Conclusión
C a p í t u l o 4
1. Introducción
2. David Lewis y las convenciones como regularidades de hecho en el comportamiento humano
3. Las convenciones sociales como regularidades arbitrarias e indeterminadas
4. Las convenciones como regularidades estables
5. El carácter normativo de las convenciones sociales
6. Conclusión
C a p í t u l o 5
1. Introducción
2. Elección social, liberalismo y libertad
3. Voluntad general y libertad interior
4. Teoría de la negociación y teoría del contrato
5. Evolución de la moral y teoría de juegos
6. Conclusión
C a p í t u l o 6
1. Introducción
2. La originalidad de la teoría de juegos en la historia de la ciencia social
3. La teoría de juegos como teoría social
4. Problemas de la interpretación de la teoría de juegos como teoría social
5. Las réplicas
6. Interpretación formal
7. Conclusión
Segunda Parte
C a p í t u l o 7
1. Introducción
2. Etapas de la investigación experimental
3. Áreas de investigación experimentales en teoría de juegos
4. Conclusión
C a p í t u l o 8
1. Introducción
2. El modelo de Plum (1992)
3. El modelo de MR (2000)
4. Modelo de LRWZ (2001)
5. Conclusión
C a p í t u l o 9
1. Introducción
2. Los objetivos de los partidos
3. Cómo afectan las expectativas sobre las elecciones a las estrategias de los partidos
4. Conclusión
C a p í t u l o 10
1. Introducción
2. Confianza, dilema del prisionero y otros juegos
3. Confianza y señales
4. Conclusión
C a p í t u l o 11
1. Introducción
2. Qué dicen los partidarios de la teorías de las ventanas rotas
3. Nuevas respuestas a críticas a la teoría de las ventanas rotas
4. Ventanas rotas, negocios rotos (broken windows, broken business)
5. Juegos dinámicos, ventanas rotas y negocios rotos
6. Conclusión
Glosario
Sobre los autores
Bibliografía
Economía,Sociedad y Teoría de Juegos Coordinadores
FERNANDO AGUILAR JULIA BARRAGÁN NELSON LARA
ECONOMÍA, SOCIEDAD Y TEORÍA DE JUEGOS
ECONOMÍA, SOCIEDAD Y TEORÍA DE JUEGOS Coordinadores FERNANDO AGUIAR JULIA BARRAGÁN NELSON LARA
MADRID • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • LISBOA • MÉXICO NUEVA YORK • PANAMÁ • SANTIAGO • SÃO PAULO AUCKLAND • HAMBURGO • LONDRES • MILÁN • MONTREAL • NUEVA DELHI • PARÍS SAN FRANCISCO • SIDNEY • SINGAPUR • ST. LOUIS • TOKIO • TORONTO
ECONOMÍA, SOCIEDAD Y TEORÍA DE JUEGOS. Primera edición No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro u otros métodos, sin el permiso previo y por escrito de los titulares del Copyright. DERECHOS RESERVADOS © 2008, respecto a la primera edición en español, por MCGRAW-HILL/INTERAMERICANA DE ESPAÑA, S. A. U. Edificio Valrealty, 1. ª Planta Basauri, 17 28023 Aravaca (Madrid) ISBN: 978-84-481-6695-3 Depósito legal: ¿? Editor: José Ignacio Fernández Soria Técnico editorial: Blanca Pecharromán Narro Compuesto en: Gesbiblo, S. L. Impreso por: IMPRESO EN ESPAÑA – PRINTED IN SPAIN
Contenido
Presentación ......................................................................
PRIMERA
xi
PARTE
CUESTIONES GENERALES Capítulo 1 Economía y juegos 1. 2. 3. 4. 5. 6.
Introducción .............................................................................. Economía sin juegos................................................................... Juegos sin economía................................................................... La economía con juegos ............................................................. El futuro de la economía con juegos ............................................. Conclusión ................................................................................
1 2 3 9 16 24
Capítulo 2 La teoría de juegos y el lenguaje institucional 1. 2. 3. 4.
Introducción .............................................................................. Un problema complejo que siempre ha despertado interés.............. Criterios para la evaluación de soluciones..................................... Las instituciones como mecanismo de transformación de las preferencias individuales en colectivas ................................ 5. Las instituciones son algo más que un buen arreglo ........................ 6. Conclusión ................................................................................
27 28 30 34 39 44 v
vi
Contenido
Capítulo 3 Sociología y teoría de juegos. Una relectura de la obra de Neil Smelser 1. Introducción .............................................................................. 2. El punto de partida en la teoría social. La obra de Neil Smelser ...... 3. El problema de los microfundamentos........................................... 3.1.
El grano fino: los dilemas de la acción colectiva .............................
4. El problema de las normas sociales.............................................. 4.1.
¿Qué son las normas sociales? .....................................................
4.2.
La aportación de la teoría de la lógica de la acción colectiva a la explicación de la emergencia de las normas sociales.................................................................
5. Normas sociales y comportamiento colectivo................................. 5.1.
El pánico....................................................................................
5.2.
La revuelta..................................................................................
5.3.
El movimiento revolucionario ........................................................
5.4.
El movimiento social reformista .....................................................
5.5.
La moda o el “boom” ..................................................................
6. Conclusión ................................................................................
45 46 49 50 54 54
55 59 59 61 62 64 65 66
Capítulo 4 Coordinación y convención 1. Introducción .............................................................................. 2. David Lewis y las convenciones como regularidades de hecho en el comportamiento humano ......................................................... 3. Las convenciones sociales como regularidades arbitrarias e indeterminadas........................................................................... 4. Las convenciones como regularidades estables .............................. 5. El carácter normativo de las convenciones sociales ........................ 6. Conclusión ................................................................................
69 70 76 79 84 87
Capítulo 5 Libertad, justicia y juegos 1. Introducción .............................................................................. 2. Elección social, liberalismo y libertad ........................................... 3. Voluntad general y libertad interior ..............................................
89 90 96
Contenido
4. Teoría de la negociación y teoría del contrato ............................... 5. Evolución de la moral y teoría de juegos....................................... 6. Conclusión ................................................................................
vii
99 103 106
Capítulo 6 La teoría de juegos: ¿una teoría social? 1. Introducción .............................................................................. 2. La originalidad de la teoría de juegos en la historia de la ciencia social .................................................................... 3. La teoría de juegos como teoría social.......................................... 4. Problemas de la interpretación de la teoría de juegos como teoría social...................................................................... 5. Las réplicas ............................................................................... 6. Interpretación formal .................................................................. 7. Conclusión ................................................................................
SEGUNDA
109 111 114 115 120 127 130
PARTE
APLICACIONES CONCRETAS Capítulo 7 Economía experimental y teoría de juegos 1. Introducción .............................................................................. 2. Etapas de la investigación experimental........................................ 2.1.
Elaboración de una pregunta económica .......................................
2.2.
Diseño de un experimento ............................................................
2.3.
Selección de sujetos experimentales ..............................................
2.4.
La sesión experimental .................................................................
2.5.
El análisis de los datos .................................................................
2.6.
Publicación de los resultados y nuevas preguntas ............................
3. Áreas de investigación experimentales en teoría de juegos.............. 3.1.
¿Cómo valoran los individuos el bienestar de otros individuos? .........
3.2.
¿Cómo razonan los individuos?.....................................................
3.3.
¿Cómo aprenden los individuos?...................................................
4. Conclusión ................................................................................
137 141 141 142 144 145 146 146 147 147 149 150 150
viii
Contenido
Capítulo 8 Subastas asimétricas: modelos y experimentos 1. Introducción .............................................................................. 2. El modelo de Plum (1992) ........................................................... 2.1. 2.2. 2.3.
Caracterización general del modelo.............................................. Predicciones de estática comparativa ............................................ Evaluación experimental ..............................................................
3. El modelo de MR (2000) ............................................................ 3.1. 3.2. 3.3.
Caracterización general del modelo.............................................. Predicciones de estática comparativa ............................................ Evaluación experimental ..............................................................
4. Modelo de LRWZ (2001) ............................................................ 4.1. 4.2. 4.3.
Caracterización general del modelo.............................................. Predicciones de estática comparativa ............................................ Evaluación experimental ..............................................................
5. Conclusión ................................................................................
153 155 155 155 156
156 156 156 157 157 157 158 158 158
Capítulo 9 El efecto de las expectativas sobre las estrategias electorales de los partidos 1. Introducción .............................................................................. 2. Los objetivos de los partidos ........................................................ 3. Cómo afectan las expectativas sobre las elecciones a las estrategias de los partidos................................................... 4. Conclusión ................................................................................ APÉNDICE ....................................................................................
161 163 165 172 173
Capítulo 10 Confianza, elección racional y teoría de juegos 1. Introducción .............................................................................. 2. Confianza, dilema del prisionero y otros juegos............................. 3. Confianza y señales ................................................................... 4. Conclusión ................................................................................ APÉNDICE ....................................................................................
175 176 181 185 186
Contenido
ix
Capítulo 11 Teoría de juegos, ventanas rotas y negocios rotos 1. Introducción .............................................................................. 2. Qué dicen los partidarios de la teorías de las ventanas rotas........... 3. Nuevas respuestas a críticas a la teoría de las ventanas rotas.......... 3.1.
Las críticas de Harcourt................................................................
3.2.
La falsa promesa de mantenimiento del orden ................................
3.3.
La ausencia de evidencias empíricas .............................................
3.4.
Una genealogía del mantenimiento del orden.................................
3.5.
Las críticas de Levitt y Dubner .......................................................
189 190 192 192 194 195 197 197
4. Ventanas rotas, negocios rotos (broken windows, broken business) ........................................................................ 5. Juegos dinámicos, ventanas rotas y negocios rotos ......................... 6. Conclusión ................................................................................
198 199 202
Glosario ................................................................................
205
Sobre los autores ...........................................................
219
Bibliografía .........................................................................
223
Índice analítico y de autores ...................................
241
Presentación
En 1959, cuando la amenaza de un enfrentamiento nuclear entre los EEUU y la Unión Soviética era bien real, el filósofo y matemático Bertrand Russell trataba de entender la actitud de los dirigentes de ambas potencias, aparentemente irracional, comparándola con la de los jóvenes que participaban en un juego de moda: se trataba de trazar una larga línea blanca en una carretera, de forma que dos coches se precipitaran uno contra otro sin dejar de pisar la línea; el jugador que se asustase primero, el gallina, se separaría de la línea blanca para evitar el choque y perdería la apuesta. En este juego puede resultar fatal que ambos jugadores sean muy arriesgados, pues si ninguno se desvía de su trayectoria ambos pueden morir al chocar los coches de frente. Unos años antes, en 1956, James Dean había hecho famoso un juego parecido (los coches se lanzan en la película de Nicholas Ray hacia un acantilado) en Rebelde sin causa. Russell estaba convencido de que la estrategia de los EEUU y la URSS era similar a la de los jugadores más arriesgados del juego del gallina, y que la irresponsable conducta de ambas naciones llevaría al mundo a la destrucción. En un juego del gallina como el que enfrenta a los jóvenes de Rebelde sin causa o a soviéticos y norteamericanos durante la Guerra Fría, cada jugador tiene dos estrategias puras —ceder o no ceder al reto del otro— que pueden conducir a su vez a dos situaciones de equilibrio: que ningún jugador ceda o que cedan ambos. En los puntos de equilibrio ningún jugador tiene motivo para cambiar de estrategia de forma unilateral, pues si lo hace saldrá perdiendo: es lo que se conoce como equilibrio de Nash. La teoría de juegos es una teoría matemática que permite analizar formalmente las decisiones estratégicas de los sujetos (ya sean “jugadores” individuales o colectivos, como empresas, naciones, partidos políticos, etc.). John Nash le dio a la teoría en los años cincuenta el impulso que la ha llevado a convertirse en una herramienta imprescindible para las ciencias sociales, muy lejos ya de sus orígenes en plena Guerra Fría, cuando los pioneros de esta teoría matemática la aplicaban, entre otras cosas, a las estrategias de las dos superpotencias. Sin embargo, pese al destacado papel que desempeñó en su desarrollo, esta teoría no surgió ex novo de la cabeza de John Nash. Apoyándose en algunas ideas del matemático francés Emile Borel sobre la estructura formal de un juego de estrategia como el póquer, John von Neumann demostró en 1928 un teorema —el teorema minimax— que le proporcionó a la teoría de juegos el respaldo que necesitaba para convertirse en una nueva rama de las Matemáticas. Von Neumann, verdadero padre de la teoría, demostró en su trabajo que los denominados juegos de suma cero (en los que los jugadores tienen intereses diametralmente opuestos, pues lo que gana uno lo pierde el otro y viceversa) xi
xii
Presentación
siempre tienen solución. Esa solución consiste en elegir el resultado menos malo, el mínimo de los máximos. El hallazgo convenció a von Neumann de que su aportación estaba llamada a revolucionar la teoría económica, y que en el futuro la teoría de juegos sería la verdadera matemática de la economía. Con esa idea escribió en 1948, junto con el economista Oskar Morgenstern, Teoría de juegos y comportamiento económico, pues a su modo de ver el comportamiento económico es formalmente idéntico a ciertos juegos de estrategia. Sin embargo, la teoría de juegos, tal y como se presentó en la obra de von Neumann y Morgensten, pasó prácticamente desapercibida para los economistas. Von Neumann no había conseguido demostrar que los juegos más interesantes para la economía, aquellos en que los intereses de los jugadores no son diametralmente opuestos, tienen también solución matemática. Éste fue, precisamente, el problema que abordó John Nash. En un artículo de 1950, Nash sentó las bases de la teoría de juegos cooperativos y de la teoría de la negociación, que analizan aquellas situaciones estratégicas en las que los intereses en conflicto de los jugadores no son totalmente opuestos y pueden coligarse o negociar para llegar a un resultado aceptado por todos. En 1953, en su tesis doctoral, propone la solución —el equilibrio de Nash— de los juegos no cooperativos, que analizan conflictos de intereses insolubles mediante coaliciones o negociaciones, pues éstas no tienen un carácter vinculante. Nash hizo posible el futuro desarrollo de la teoría de juegos, si bien habrían de pasar aún muchos años para que la teoría se convirtiera, como soñaba von Neumann, en una herramienta imprescindible para los economistas. Mientras tanto, los hallazgos de Nash encontraron un inesperado refugio en otras ciencias sociales, en especial la ciencia política, pues la Guerra Fría se prestaba bien al análisis estratégico formalizado 1. Una vez terminada su tesis, John Nash coincidió en la RAND Corporation con un grupo de científicos de primera fila que mostraron un gran interés en el desarrollo de la nueva teoría. Entre otros, Nash tuvo ocasión de trabajar con el propio von Neumann, con Melvin Dresher y Merrill Flood, que analizaron matemática y empíricamente por primera vez el conocido dilema del prisionero, con Thomas Schelling, pionero en la aplicación de la teoría a problemas políticos y sociales y con Lloyd Shapley, nombre crucial en la teoría de juegos cooperativos. En 1960 habían abandonado ya la RAND casi todos los colegas de John Nash, que vivió a partir de esa fecha un largo peregrinar de hospital en hospital aquejado de esquizofrenia2. La teoría de juegos, por otra parte, quedó prácticamente confinada al terreno de las matemáticas durante veinte años, sin que casi nadie se interesara por su aplicación a las ciencias sociales. Incluso Thomas Schelling, unos de sus principales valedores, llegó a afirmar en 1980 que no tenía ya esperanza alguna de que la teoría se pudiera aplicar ni 1
Sobre el contexto político en que surge la teoría de juegos véase William Poundstone, El dilema del prisionero. John von Neumann, la teoría de juegos y la bomba (Madrid, Alianza Editorial, 1995), que puede servir, además, como introducción básica a la teoría.
2
Silvia Nasa escribió una emotiva biografía de Nash (A Beautiful Mind, Simon & Shuster, 1998) que a diferencia del libro de Poundstone no basta, sin embargo, como introducción sencilla a la teoría de juegos, pues tiene muchos errores. Martin Osborne resalta los valores de esta obra sin olvidar sus errores en una reseña que se puede consultar en http://www. economics.utoronto.ca/osborne/misc/nasar.htm.
Presentación
xiii
a la economía ni a ningún problema político o social importante 3. Sin embargo, precisamente en los años 80, cuando casi nadie lo esperaba, la teoría de juegos resurge con tal fuerza que el sueño de Schelling empieza a ser real. La obra de Reinhard Selten y John Harsanyi, que compartieron con Nash el Premio Nobel de Economía de 1994, da un formidable impulso al trabajo de los viejos pioneros y coloca la teoría de juegos en el centro de los debates más renovadores no sólo en economía, sino también en ciencia política, sociología y filosofía. De la mano de la teoría de juegos, la economía ha vivido una auténtica revolución, y en el terreno de la sociología y la ciencia política las viejas cuestiones relacionadas con la naturaleza de las normas sociales, la explotación, la división de la sociedad en clases, las estrategias de los partidos o el comportamiento electoral no se entienden hoy sin un conocimiento básico de teoría de juegos. La reflexión sobre justicia y ética se ha dejado influir, a su vez, por los juegos de estrategia y por la moderna economía que se apoya en la teoría de juegos, convirtiéndose en una de las áreas más innovadoras de la Filosofía. E incluso una ciencia como la biología, de la que no cabía esperar en un principio que pudiera beneficiarse de la teoría de juegos, ha sabido explicar la conducta reproductora de algunas especies como si se tratara de un juego de estrategia. De esta forma, la brillante y veloz carrera de la teoría de juegos, pese a sus titubeantes inicios, nos hace ver una vez más que la elaboración de un cuerpo teórico implica necesariamente el nacimiento de nuevas perspectivas en relación con un objeto de conocimiento, el cual a través de la teoría pasa a revelarnos aspectos que antes estaban ocultos o resultaban opacos. En este sentido, la potencia de una teoría puede medirse por su capacidad de generar consecuencias deductivas que enriquezcan la interpretación del mundo. Recíprocamente, la tensión que ejercen los objetos de conocimiento constituye un factor que desafía a las teorías, y las convoca a imaginar respuestas conceptuales de mayor nivel de maduración, más amplia cobertura explicativa, y que sean capaces de resistir con éxito pruebas de consistencia y derivabilidad bajo las más diversas condiciones. A pesar de que esta regla de crecimiento y desarrollo simultáneo se expresa de manera reiterada en todos los campos, hay pocos ejemplos en las ciencias sociales y humanas que como la teoría de juegos sean capaces de hacer evidente de manera tan clara esa tensión constructiva. Poco a poco, el número de consecuencias deductivas de la teoría permitió construir relaciones con otros campos de conocimiento, los cuales a su vez operaron como estímulo para el desarrollo de nuevas aristas teóricas desde las cuales se descubren importantes facetas de otros múltiples objetos. Asimismo, la incorporación 3
En el prefacio a la edición de 1980 de su obra The Strategy of Conflict —publicada originalmente en 1960— Thomas Schelling afirma lo siguiente: “Quería mostrar [en los años 60] que una teoría muy básica que atravesara la economía, la Sociología y la Ciencia Política, incluso el Derecho y la Filosofía y quizá la Antropología podía ser útil no sólo para los teóricos formales, sino también para la gente interesada en problemas prácticos. Asimismo, tenía la esperanza —y ahora creo que me equivocaba— de que la teoría de juegos se pudiera redirigir hacia cuestiones aplicadas en todos aquellos campos. Con notables excepciones como las de Howard Raiffa, Martin Shubik y Nigel Howard, los teóricos de juegos se han quedado en la frontera de las matemáticas”. Del mismo modo, al pronunciar el discurso de aceptación del Premio Nobel de Economía en diciembre de 1994, John Harsanyi señala que hasta fechas recientes “la teoría de juegos era tan poco conocida por el público ilustrado que en el índice de la biblioteca de una distinguida Universidad el libro de von Neumann y Morgenstern estaba catalogado bajo el sorprendente epígrafe de Juegos y Ejercicios Físicos”.
xiv
Presentación
del uso normativo de la teoría como alternativo o complemento de su uso analítico sirvió para trazar rutas racionales a diversas formas de acción que procuran optimizar los resultados de las decisiones. El hecho de que la teoría de juegos haya generado relaciones tan complejas, constructivas y prometedoras animó a los coordinadores de este libro —miembros de la Asociación Venezolana de Derecho y economía (VELEA) y del Instituto de Estudios Sociales Avanzados (IESA-CSIC), con sede en Córdoba (España)— a promover una obra colectiva que sirviera tanto para despertar interés por la teoría de juegos en el mundo de las ciencias sociales en general, como de estímulo para los especialistas que desean explorar y someter a discusión los logros más desafiantes. Para ello hemos divido el libro en dos partes. En la primera se recogen una serie de capítulos en lo que se muestra que las esperanzas de von Neumann o Schelling comienzan a cumplirse: la teoría de juegos es hoy una herramienta indispensable para abordar toda clase de cuestiones económicas, sociales, políticas y filosóficas. Así, en el primer capítulo Antonio Morales repasa la evolución de la economía en los últimos sesenta años y analiza los cambios radicales a los que se ha visto sometida por obra de la teoría de juegos. El capítulo de Morales sirve además como introducción a los conceptos básicos de la teoría. Julia Barragán aborda por su parte en el segundo capítulo una cuestión que atraviesa todas las ciencias sociales, a saber, la de la naturaleza de las instituciones, sin las cuales no es posible la vida social en general. En los siguientes capítulos se ahonda en dicha cuestión al analizar las normas sociales y el comportamiento colectivo (Francisco Linares), las convenciones sociales (Luis Miguel Miller), que organizan buena parte de la vida social, y las normas morales y de justicia (Fernando Aguiar), que establecen límites a lo que se debe o no se debe hacer en sociedad. La Primera Parte se cierra con un capítulo (el sexto, de Félix Ovejero) en el que, si no se cuestiona la capacidad de la teoría de juegos como herramienta formal, sí se discute su valor como teoría social, esto es, como una teoría “que abarca —y subsume—a distintas disciplinas clásicas”. Teniendo en cuenta, por ejemplo, que para el politólogo John Ordeshook la teoría de juegos es teoría política, y para John Harsanyi la Ética es una parte de la teoría de la decisión, el debate con el que se cierra la primera sección de Economía, sociedad y teoría de juegos es más que pertinente. En la Segunda Parte se prueba la utilidad de la teoría de juegos para el desarrollo y solución de problemas concretos. Si en el primer capítulo se revisan los vínculos entre economía y teoría de juegos, los capítulos séptimo (Pedro Rey) y octavo (Alexander Elbittar) se detienen en el uso de la teoría en el terreno de la economía experimental —que permite, en palabras de Rey, “observar cómo interactúan los individuos en situaciones estratégicas ante incentivos reales”— y en el análisis de las subastas, que desempeñan un papel destacado en las economías de los países desarrollados. Ahora bien, el estudio teórico y empírico del comportamiento estratégico de los actores sociales —individuales y colectivos— no ha influido sólo en economía, sino que ha tenido un enorme peso en la moderna ciencia política. En el tercer capítulo, Linares introducía ya aspectos concretos del comportamiento político como la participación en manifestaciones, revueltas, revoluciones o movimientos reformistas; en el noveno, Henar Criado aborda una cuestión central de los sistemas democráticos: las estrategias de los partidos para ganar elecciones. Mediante modelos de formación de expectativas y de aprendizaje bayesiano, Criado analiza en su capítulo las estrategias de los partidos para movilizar a los votantes. Por último, Francisco Herreros
Presentación
xv
(Capítulo 10), presenta las fuentes de la confianza social que, como las convenciones y las normas, permiten un funcionamiento fluido de la sociedad, y Nelson Lara (Capítulo 11) estudia la falta de confianza social a través del caso de las “ventanas rotas”: si alguien rompe una ventana y nadie la arregla se produce un efecto de dominó que genera desconfianza y desorden social. El análisis estratégico de las “ventanas rotas” puede inspirar no sólo políticas públicas ligadas a la delincuencia, sino a otros muchos campos. El libro incluye un Glosario que servirá de ayuda, eso esperamos, a quienes se acerquen a la teoría de juegos por primera o segunda vez. Sin embargo, este no es un libro de divulgación sin más, pues a los expertos en teoría de juegos les interesará valorar una serie de aplicaciones de la teoría que quizá no conozcan bien o que desconozcan. Más tampoco es un libro sólo para expertos, pues quien apenas sepa nada de teoría de juegos encontrará aquí un amplio panorama sobre su naturaleza y usos. Expertos y no expertos hallarán, en cualquier caso, que el espíritu que anima Economía, sociedad y teoría de juegos —el “espíritu de Schelling”, como lo podríamos llamar— no es otro que avanzar hacia una ciencia social unificada. La teoría de juegos está contribuyendo como pocas a esa labor. No podemos terminar esta presentación sin agradecer a McGraw-Hill la confianza que puso desde el principio en este libro y en sus autores, y, en especial, queremos reconocer la profesionalidad de José Ignacio Fernández, Amelia Nieva y Blanca Pecharromán, así como su empeño para que todo saliera bien.
Fernando Aguiar (IESA-CSIC) Julia Barragán (VELEA) Nelson Lara (VELEA)
PRIMERA
PARTE
CUESTIONES GENERALES
Capítulo
1
Economía y juegos Antonio J. Morales
1. Introducción No seré yo quien diga que todo en el mundo es un juego (dado que soy parte interesada tengo incentivos para “mentir” y, por tanto, este anuncio no sería creíble), pero lo que sí me atrevo a decir es que casi todo en el mundo es un juego1. Si no lo crees, piensa atentamente en lo siguiente: no importa dónde estés o lo que hagas, lo más normal es que tu confort o bienestar dependa de elementos ajenos a tu control. Es posible que esos elementos sean decididos por alguien que no piensa en ti —entonces te enfrentas a un problema de decisión2—. Sin embargo, es más que posible que ese alguien sí piense en ti, sobre todo si su bienestar depende de elementos que tú controlas. Si es así, entonces tú y ese alguien estáis, incluso sin saberlo, “atrapados” en un juego, es decir, en una situación con interdependencia estratégica en donde las decisiones de los individuos son reacciones estratégicas a las decisiones de los demás. Ahora que ya entiendes por qué casi todo en el mundo es un juego, puedes ver que ésa es la razón de la existencia del libro que tienes en tus manos: como los juegos están presentes en cualquier aspecto de la vida, su estudio es relevante para muchísimas disciplinas, desde la Filosofía hasta la economía, pasando por el derecho o la biología. En este capítulo, me centraré en la relación entre la teoría de juegos y la economía. La idea de este capítulo es ver los progresos de la teoría de juegos y te irás dando cuenta de que su relación con la economía ha sido de excitación/decepción hasta que finalmente, en los años 80 del siglo XX, se ha producido la aceptación plena de la teoría de juegos como herramienta fundamental del análisis económico. A día de hoy, no hay prácticamente ningún campo de la economía que no utilice la teoría de juegos y no hay ningún programa (serio) de doctorado en economía en el que la enseñanza de la teoría de juegos no ocupe un lugar central. Podemos adelantar que la razón para tal éxito ha sido doble: (i) la teoría de juegos ha proporcionado a la economía un lenguaje muy preciso con el que describir multitud de 1
No está nada mal empezar el capítulo enfatizando el aspecto lúdico del mundo.
2
Un claro ejemplo es cualquier tipo de lotería en la que compras un boleto y se sortea cuál es el número ganador.
1
2
Economía, sociedad y teoría de juegos
situaciones económicas y una metodología muy precisa para poder analizarlas. Con la ayuda de este lenguaje, la economía ha podido analizar una gran variedad de situaciones económicas y las ha podido clasificar en función de sus características estratégicas. Y (ii) el concepto básico de solución para juegos —el equilibrio de Nash— puede ser interpretado de múltiples formas, dando lugar cada una de ellas a diversas y excitantes ramas de análisis económico. Necesariamente algunos lectores encontrarán lagunas imperdonables en este capítulo, o que algunos temas apenas son tratados según sus preferencias; pero, como dice la economía clásica, los recursos son escasos (mis neuronas y la extensión finita del capítulo) y sus usos múltiples (el análisis de 50 años de investigación en economía), así que para eso está la economía y quién mejor para utilizarla que un economista.
2. Economía sin juegos Piensa en el siguiente problema puramente económico que ha estado presente en la humanidad desde sus comienzos: dos personas tratando de decidir en qué términos establecer el intercambio de un bien por otro. Para mis propósitos, me resulta más fácil pensar que uno de los bienes es dinero por lo que, en el fondo, estamos hablando de un problema de determinación del precio de intercambio. En la medida en que la valoración del comprador sea menor que la valoración del vendedor, no tiene sentido que se produzca el intercambio; pero, ¿qué ocurre si la valoración del comprador es mayor que la del vendedor? Pues que existen oportunidades asociadas al intercambio. La pregunta entonces es: ¿cuál será la relación de intercambio? O dicho de otro modo, ¿cuál será el precio de venta? La teoría económica anterior a 1950 no tenía ninguna respuesta para este problema tan genuinamente económico. Piensa ahora en otro problema que está en la base de la economía: la competencia entre empresas. Imagínate que estás compitiendo con otra empresa: ¿cuál será tu política comercial, es decir, cuántas unidades debes sacar a la venta y a qué precio cada una? La respuesta depende de lo que tú creas que será la política comercial de la otra empresa. Así que tu política depende de tu creencia acerca de la política de tu rival. La otra empresa, al tratar de predecir tu política comercial, debe por tanto tener en cuenta tu creencia acerca de su comportamiento, es decir, debe tener una creencia acerca de tu creencia acerca de su política comercial. Así pues —ahora te toca a ti— tu predicción acerca del comportamiento de tu rival debe incluir una creencia acerca de su creencia acerca de tu creencia acerca de su política comercial. Espero que te hayas dado cuenta del terrible problema que tenemos entre manos: vamos a tener que ir considerando creencias sobre creencias sobre creencias y nunca vamos a poder terminar nuestro razonamiento. Conclusión: si no podemos escribir el problema, ¿cómo vamos a ser capaces de resolverlo? El problema de las dos situaciones consideradas es que el número de agentes económicos es muy reducido, por lo que cada agente debe tener en cuenta la influencia de sus acciones en las creencias de los demás y por tanto en su comportamiento. Dado que la teoría económica no sabía cómo abordar estos problemas, buscó refugio en situaciones en las que la interacción estratégica no estuviese presente: se negó a los consumidores la capacidad de negociar el precio de venta (los consumidores son precio-aceptantes) y a las
Economía y juegos
3
empresas la capacidad de establecerlo (las empresas son también precio-aceptantes). Te preguntarás quién establece entonces el precio: pues el mercado. Aquel mercado en el que tanto las empresas como los consumidores son precio-aceptantes se denomina competitivo y suele estar asociado a mercados en los que existe un gran número de empresas. Así pues durante la primera mitad del siglo XX la teoría económica centra sus esfuerzos en el análisis de las decisiones de producción y consumo en mercados competitivos. La culminación de todo este magno edificio ocurre en la década de los 50, denominada la década del equilibrio general (el análisis conjunto de todos los mercados de bienes de una economía), con el trabajo de Kenneth Arrow y Gerard Debreu “Existence of an Equilibrium for a Competitive Economy” de 1954. La idea básica que surge del análisis de los mercados competitivos es que ningún agente económico puede afectar unilateralmente al precio al que se intercambian los bienes, que por otra parte refleja toda la información relevante. El precio competitivo, determinado por la intersección de las curvas de demanda agregada y oferta agregada, se encarga de explotar todas las ganancias asociadas al intercambio, por lo que el resultado competitivo es eficiente, es decir, la asignación del mercado maximiza el bienestar de la sociedad. Este triunfo de la teoría económica (el llamado Primer Teorema del Bienestar) es una bella formalización de una idea muy vieja en economía: la mano invisible de Adam Smith en su libro Inquiry into the Nature and Causes of the Wealth of Nations de 1776. Francis Ysidro Edgeworth resume muy bien la situación de la teoría económica frente al problema de la interacción estratégica en su libro Mathematical Psychics de 1881: La cuestión es fácil de establecer: fuera de los confines de los simples modelos de competencia perfecta y monopolio, los mecanismos económicos normalmente se muestran incapaces de seleccionar un único resultado. La indeterminación es la norma. La cuestión es por tanto: ¿cómo vamos a aprender a vivir con esto?
3. Juegos sin economía Las distintas situaciones estratégicas pueden dividirse en dos grandes grupos: los juegos cooperativos y los no cooperativos; y la clave para distinguirlos reside en la posibilidad de que los jugadores puedan firmar acuerdos vinculantes en relación con las acciones que se van a jugar 3. En los juegos no cooperativos no existen acuerdos vinculantes, por lo que la unidad básica de análisis es el jugador individual. La descripción completa de un juego no cooperativo debe especificar el conjunto de acciones que puede elegir cada jugador y el pago para cada jugador en función de las distintas acciones elegidas por los participantes en el juego. El caso de las dos empresas es un ejemplo de situación no cooperativa. Una vez que las empresas deciden sus políticas comerciales, sus beneficios vienen determinados por los ingresos procedentes de la venta menos los costes de producción4. 3
“Vinculante” significa que se puede denunciar el no cumplimiento del acuerdo ante un Tribunal.
4
Es cierto que pueden establecer algún tipo de acuerdo, pero éste nunca podrá ser llevado ante un Tribunal, puesto que las coaliciones entre empresas para pactar políticas de precios están prohibidas por ley.
4
Economía, sociedad y teoría de juegos
En un juego cooperativo se permite la firma de acuerdos vinculantes entre los jugadores. Ello hace que la unidad básica de análisis deba ser la coalición o grupo de jugadores. A nivel general, la representación de esta clase de juegos debe especificar, para cada coalición posible, el pago que recibe cada integrante de la coalición5. Observa que en los juegos cooperativos no se especifican las acciones que pueden elegir los distintos jugadores, ni siquiera el tipo de negociación que pueden hacer para que se formen las coaliciones. Todo esto queda en un segundo plano puesto que el énfasis se pone en los resultados que pueden surgir de la negociación. El intercambio bilateral considerado anteriormente es un ejemplo de juego cooperativo: los dos individuos conversan y pactan, mediante un apretón de manos, un intercambio que luego están obligados a realizar. En los años 50 y de manos matemáticas, se desarrollan los principales conceptos de solución para ambas clases de juegos: el equilibrio de Nash para los no cooperativos y el núcleo para los cooperativos. Y la lógica de ambos es la misma: se busca una situación estable, es decir, una situación en la que nadie encuentre beneficioso desviarse. Dado que en los juegos no cooperativos la unidad básica de análisis es el jugador individual, el concepto de solución “natural” debe ser por tanto un perfil de estrategias, una para cada jugador, de tal forma que cada una ellas sea mejor respuesta a las demás. De esta forma, si los jugadores juegan dichas estrategias, ninguno de ellos tendrá el más mínimo incentivo para desviarse de forma unilateral y jugar una estrategia distinta. Dichas estrategias reciben el nombre de equilibrio de Nash, en honor de John Nash, quien propuso tal concepto de solución en 1950. En cuanto a los juegos no cooperativos, el análogo al equilibrio de Nash es el núcleo. Dicha solución fue propuesta por Donald B. Gillies en 1953 y se define como aquella situación que está libre de incentivos a la desviación. Ahora bien, como la unidad básica de análisis son las coaliciones de jugadores, ahora el concepto de estabilidad debe aplicarse también a las coaliciones. Así pues, un resultado del juego será estable —y por tanto estará en el núcleo del juego— siempre que ningún jugador resulte perjudicado en relación con la situación inicial del juego (racionalidad individual) y ningún grupo de jugadores pueda, desviándose y formando otra coalición, conseguir pagos mayores (racionalidad colectiva). Ahora bien, una cosa es tener un concepto matemático de solución y otra distinta es que sea útil para la economía, pues su utilidad reside en su capacidad para analizar, entender y predecir el comportamiento humano en situaciones económicas estratégicas. Y para ello es importante tener en cuenta las siguientes dos preguntas. La primera de ellas es sobre su rango de aplicabilidad, es decir, para cuántas situaciones estratégicas existen soluciones estables. La segunda cuestión se refiere al número de soluciones estables que existen en cada situación estratégica. Y aun cuando ambos conceptos de solución se basen en el mismo principio, hay algo profundo en la distinción entre situaciones cooperativas y no cooperativas que hace que la respuesta a estas preguntas sea bastante diferente. Así, mientras el equilibrio de Nash tiene asegurada su existencia prácticamente en cualquier juego no cooperativo, no ocurre 5
Si el número de jugadores es n, entonces el número de coaliciones que se pueden formar es 2n. Como ves, dicho número será en general muy grande, por lo que el estudio de los juegos cooperativos es una cuestión ardua.
Economía y juegos
5
lo mismo con el núcleo6. Y lo que es peor, allí donde el núcleo no está vacío es muy normal que exista una multiplicidad. Esta asimetría es básicamente la responsable de la evolución tan dispar que han tenido la teoría de juegos cooperativa y no cooperativa dentro de la economía. La no aplicabilidad universal del núcleo ha generado el nacimiento de una enorme cantidad de conceptos de solución (entre todos el valor de Shapley, propuesto por Lloyd Shapley en 1953 es el más importante). Además, cualquier juego cooperativo puede ser descrito como un juego no cooperativo sin más que hacer explícito el proceso de negociación. Esta forma de entender los juegos cooperativos, denominada programa de Nash, no hace sino desplazar el énfasis de los juegos al terreno no cooperativo, en donde el concepto de equilibrio de Nash es el claro dominador. La razón que hizo que los economistas recibieran con mucho alborozo el equilibrio de Nash era que, además de su aplicabilidad universal, tenía una interpretación en términos de la racionalidad de los jugadores. La clave del asunto reside en que el magno edificio del equilibrio general competitivo estaba construido sobre la base de agentes económicos que se comportan de una forma racional; es decir, que se comportan como si maximizaran unas funciones objetivo —la utilidad para los consumidores y el beneficio para las empresas— sujetas a un conjunto de restricciones —la presupuestaria para el consumidor y la tecnológica para la empresa—. Considera el ejemplo de dos empresas que deben decidir sus políticas comerciales. Considera un perfil de políticas, una para cada empresa, tal que ninguna empresa tenga incentivos para desviarse unilateralmente. ¿Por qué refleja este perfil de estrategias un comportamiento racional? Pues porque la empresa 1 elige su política comercial de equilibrio porque predice que la empresa 2 elegirá la suya y hace esta predicción porque anticipa que la otra empresa realizará este mismo cálculo mental. Así pues, a mediados de los 50, la economía tenía a su disposición, gracias a John Nash, un programa para representar cualquier situación estratégica como un juego no cooperativo y un concepto de solución, con justificación racional incluida, que siempre existía. La pregunta que surge es por qué entonces la teoría de juegos no hizo su entrada triunfal en la economía en la década de los 50, sino que tuvo que esperar 20 años. La respuesta a esta pregunta hay que encontrarla en varios hechos: (i) los sesgos generados por John von Neumann y (ii) las limitaciones del equilibrio de Nash. En la profesión existía un sesgo hacia las situaciones cooperativas, porque el padre de la teoría de juegos, John von Neumann, había dedicado dos tercios de su libro The Theory of 6
El siguiente juego es posiblemente el más simple de ellos. Tres personas pueden repartirse 100 dólares sobre la base de que cualquier acuerdo que cuente con el apoyo de la mayoría simple es vinculante. En este caso, tenemos que ninguna persona individualmente puede asegurarse un pago positivo, mientras que cualquier coalición de al menos dos jugadores puede asegurarse un pago conjunto de 100. Es relativamente fácil demostrar que, para cualquier reparto de los 100 dólares, siempre es posible encontrar una coalición que encuentre beneficioso un reparto alternativo. Supongamos un reparto en el que los tres jugadores reciben una cantidad positiva. En este caso, dos jugadores pueden desviarse y votar por una asignación en la que mantienen su reparto y adicionalmente se reparten la cantidad anteriormente asignada al tercer jugador. Supongamos alternativamente un reparto que asigna 0 dólares a un jugador. En este caso, este jugador puede ofrecer una asignación alternativa a uno de los dos jugadores restantes en la que ambos mantienen su reparto y adicionalmente se reparten la cantidad asignada anteriormente al tercer jugador.
6
Economía, sociedad y teoría de juegos
Games and Economic Behaviour, escrito conjuntamente con Oskar Morgenstern en 1944, a las situaciones cooperativas. Y este sesgo dirigió la atención de los economistas matemáticos hacia los juegos cooperativos y esta rama murió de éxito en los años 60. Recuerda que la forma en la que la teoría económica aborda el proceso de formación de precios y de producción y distribución de los bienes era mediante la imposición de una institución económica particular: el mercado competitivo. En él, y siguiendo el espíritu de Leon Walras, se postulaba que los agentes económicos eran precio-aceptantes y se suponía la existencia de un agente económico ficticio, el subastador walrasiano, que se encargaba de ir estableciendo los precios de los bienes para así conseguir la igualdad simultánea entre la oferta y demanda de cada uno de los bienes de la sociedad. En 1964, y siguiendo una línea de investigación iniciada por Martin Shubik en 1959, Robert Aumann demuestra que, cuando se analiza una economía de intercambio en donde el conjunto de agentes económicos es un continuo, el núcleo coincide con el equilibrio competitivo. La consideración de un continuo de agentes en el mercado es la forma de representar la idea tan tradicional en economía de la competencia perfecta: el hecho de que ningún agente pueda individualmente afectar al mercado. Lo que Aumann demostró por tanto es que el equilibrio competitivo es el único resultado de los procesos de negociación cuando cada agente económico tomado individualmente es “despreciable” en comparación con la economía en su conjunto. En el fondo, lo que se había demostrado es que un modelo tan artificial como el walrasiano arroja el mismo resultado que el modelo más realista basado en los procesos de libre negociación entre los participantes en el mercado. Por tanto, la economía podía simplemente quedarse con el modelo walrasiano para describir la interacción en el seno de los mercados. En cuanto a las limitaciones del equilibrio de Nash, estas se encuentran tanto a nivel teórico como a nivel práctico. Muy pronto surgen voces críticas acerca de la relevancia del equilibrio de Nash como predictor del comportamiento humano. El más claro ejemplo es el dilema de presos7. El juego está diseñado de tal forma que cada jugador tiene una estrategia dominante8, que cuando es jugada por ambos conlleva un pago pequeño en comparación con el pago que hubiese conseguido si ambos hubieran jugado la estrategia dominada9. Lo curioso de este juego es que la forma evidente de jugar lleva a que ambos jugadores obtengan menores pagos que si ambos hubiesen jugado la estrategia dominada. Observa cómo el comportamiento egoísta no lleva a una situación eficiente, como habría pronosticado la mano invisible de Adam Smith. Poco a poco, una de las bases más sólidas 7
8
9
A principios de los 50 se realizaron experimentos en la RAND Corporation que mostraban que el equilibrio de Nash no era jugado en el dilema de presos. “Dominante” significa que dicha estrategia proporciona, para cualquier estrategia del rival, un pago mayor que la otra estrategia. Fíjate en que no jugar estrategias dominadas es una de las bases del juego “inteligente”. El dilema de presos es una representación muy sencilla de muchos problemas económicos, que suelen agruparse bajo el nombre genérico de bienes públicos o externalidades. Dos vecinos de un mismo portal deben decidir si colocar una luz encima de su puerta para poder ver durante la noche. Ambos prefieren que exista bombilla a que no exista, pero ambos prefieren que sea el otro vecino el que la coloque. El juego “inteligente” lleva a ambos vecinos —a la pequeña sociedad que forman— a no poner la bombilla y por tanto a tener que abrir su puerta a oscuras.
Economía y juegos
7
de la economía neoclásica —el principio de no intervención en los mercados producto de la eficacia de la mano invisible de Smith— se fue viniendo abajo. Y la culpa la tuvo la consideración de elementos estratégicos. Las limitaciones a nivel teórico del equilibrio de Nash vienen del hecho de que estaba diseñado para lo que ahora conocemos como juegos estáticos con información completa sin repetición. Una vez que se consiguió extender el análisis a juegos sin esos tres apellidos, la teoría de juegos estuvo lista para entrar a formar parte del conjunto de herramientas de la economía. Centrarse en situaciones estratégicas estáticas, sin repetición, es una gran limitación, porque muchas de las interacciones económicas tienen lugar de forma repetida en el tiempo. Por ejemplo, la competencia entre empresas les lleva a tener que elegir precios o cantidades de forma repetida en el tiempo. Para poder analizar la naturaleza de las relaciones a largo plazo es por tanto necesario un análisis teórico de un juego repetido. El problema es que, cuando un determinado juego se repite un número finito de veces, los resultados son decepcionantes, puesto que el equilibrio del juego repetido es simplemente repetir en cada etapa un equilibrio de Nash del juego estático. Por tanto, si queremos encontrar resultados de equilibrio en los que los jugadores cooperen en el dilema de presos por ejemplo, es necesario analizar repeticiones infinitas. La idea básica es que cada período tenga un mañana en el que poder castigar comportamientos no deseados. Y claro para que el castigo futuro sea efectivo a la hora de reprimir traiciones presentes se necesita que los jugadores valoren el futuro lo suficiente. Así la teoría de juegos ha encontrado los llamados teoremas Folk, que determinan lo que se puede conseguir si los jugadores son suficientemente pacientes. La segunda limitación del análisis de juegos en la década de los 60 era que estaba limitada a la llamada forma normal10. Esta forma de representar la situación estratégica es apropiada siempre y cuando las acciones se tomen de forma simultánea y los jugadores dispongan de la misma información acerca del juego. El dilema de presos es un buen ejemplo de este caso. Sin embargo, no todas las interacciones relevantes para la economía son simultáneas. En esta década se empezó a utilizar la forma extensiva de un juego, propuesta en 1953 por Harold Kuhn. Esta permite una gran riqueza de análisis, puesto que se puede especificar el orden exacto en el que los jugadores han de tomar sus decisiones y la información que cada uno de ellos posee cada vez que tienen que elegir sus acciones. El problema con los juegos en forma extensiva es que el concepto de equilibrio de Nash se muestra muy débil, y no sólo porque aparezcan un número elevado de equilibrios, sino porque algunos de ellos incorporan un comportamiento “irracional” que no puede tolerarse en una teoría que trate de describir el comportamiento de individuos racionales. El mejor ejemplo para ver estos comportamientos irracionales encubiertos es la siguiente situación dinámica. Yo decido cómo repartir entre tú y yo 100 euros y tú decides si aceptas el reparto. En caso de que no lo aceptes, los 100 euros desaparecen. Un equilibrio de Nash de este juego está formado por el siguiente par de estrategias: “Yo te ofrezco 100 euros” y “Tú aceptas un ofrecimiento de 100 euros y rechazas cualquier otro ofrecimiento”. Pero, ¿qué tiene de raro? 10
De nuevo es von Neumann el responsable de este sesgo. En el citado libro, los autores enfatizan que la forma correcta de representar un juego es mediante su forma normal o estratégica.
8
Economía, sociedad y teoría de juegos
Pues que incorpora un comportamiento irracional que no es detectado por el concepto de equilibrio de Nash. Y no es detectado porque si ambos jugamos estas estrategias, nunca se observará la irracionalidad. La irracionalidad es que yo creo que tú rechazas cualquier ofrecimiento distinto de 100, cuando de hecho debería creer que lo vas a aceptar. Por ejemplo, si te ofrezco 99, tu estrategia de equilibrio dice que lo rechaces mientras que un jugador racional maximizador de beneficios debería aceptarlos y ganar 99 euros antes que rechazarlos y ganar 0. Este tipo de equilibrio de Nash incorpora una amenaza no creíble y por tanto debe ser excluido como predicción del comportamiento de jugadores racionales. Excluir estas amenazas veladas es la base de la perfección en subjuegos, un refinamiento ideado por Reinhart Selten en 1965. Actualmente, la perfección en subjuegos es un refinamiento del equilibrio de Nash plenamente aceptado en economía. Exige que las acciones elegidas por los jugadores maximicen su utilidad no sólo en la historia que sigue el juego (que es lo que verifica el equilibrio de Nash) sino en cualquier historia posible11. La tercera y última limitación estaba relacionada con una característica común que tienen todos los juegos analizados hasta el momento: todos los jugadores conocen los pagos de los distintos jugadores para cada perfil de estrategias12. Observa que esto es clave para que el equilibrio de Nash sea un predictor del comportamiento racional. Piensa si no en el problema de competencia en precios. Obviamente tiene todo el sentido del mundo que cada empresa conozca sus pagos, puesto que esto es simplemente que conozcan su función de costes. Pero supongamos que la empresa A no conoce el coste marginal de la empresa B, mientras que ésta última sí conoce que el coste marginal de la empresa A es c. En este caso, dado que la empresa A es incapaz de escribir la matriz de pagos del juego, no puede hacer los cálculos racionales para llegar al equilibrio de Nash del juego. Y, aunque la empresa B sí que pueda hacerlos —porque sí puede escribir la matriz de pagos del juego— de nada le sirve, porque no puede creer que la empresa A lo jugará, porque sabe que la empresa A no puede calcularlo porque sabe que la empresa A no conoce su función de costes. En el bienio 1967/68 John Harsanyi propone una metodología para analizar situaciones estratégicas con información incompleta, que es como se llama al hecho de que algún jugador desconozca la función de pagos de algún rival. La clave del asunto es modelizar esta asimetría de la información mediante la introducción de distintos tipos posibles de jugadores. Así, desde la perspectiva de la empresa A, ésta se podría enfrentar a distintos tipos de empresas B, que se diferenciarían en el tamaño del coste marginal. El truco consiste en agrandar el juego original y suponer que hay un jugador ficticio llamado Naturaleza que elige, siguiendo una distribución de probabilidad conocida por los jugadores, los tipos de cada jugador. Una vez que la naturaleza ha elegido un tipo para cada jugador, se lo comunica de forma individual y privada a cada jugador. A partir de ese momento, los jugadores se enfrentan al juego original. Observa que distintas configuraciones de la distribución de probabilidad de la naturaleza nos van a describir distintas situaciones acerca de la información de la que 11
12
Si hablamos técnicamente, el equilibrio perfecto en subjuegos exige racionalidad en cualquier subjuego, y no sólo en aquellos que pertenecen a la senda de equilibrio, que es lo que exige el equilibrio de Nash. Es decir, son capaces de escribir la matriz de pagos del juego. Esto básicamente significa que cada jugador conoce la función de pagos de todos sus rivales.
Economía y juegos
9
disponen los jugadores en el juego. Por ejemplo, en el ejemplo anterior tenemos que el espacio de tipos para la empresa A tiene un solo elemento mientras que el espacio de tipos para la empresa B tiene dos elementos, uno correspondiente a un coste marginal alto y otro correspondiente a un coste marginal bajo. Así pues, aunque la naturaleza sólo revele a cada jugador su tipo, dado que el tipo de la empresa A es único, la empresa B lo conoce mientras que la empresa A lo único que sabe son las probabilidades con las que la naturaleza elige el tipo de la empresa B. Y estas probabilidades deben ser por tanto sus creencias acerca del tipo de la empresa B. Ahora la empresa A sí puede escribir la matriz de pagos del juego, porque sabe que puede vivir en ciertos mundos con ciertas probabilidades y en cada posible mundo sabe la función de pagos del rival. Así pues, esta metodología permite completar una estructura de pagos incompleta. Una vez que el juego está completado, se puede aplicar el equilibrio de Nash al nuevo juego, que pasa a denominarse equilibrio bayesiano. Ahora bien, el precio que Harsanyi pagó (y la teoría de juegos en general, puesto que la metodología de Harsanyi es la estándar para modelizar información incompleta) es tener que convivir con juegos con información imperfecta. Y éstas son palabras mayores. Un juego tiene información imperfecta si algún jugador, cuando le toca jugar, no conoce cuál ha sido la historia del juego; es decir, no conoce alguna de las acciones elegidas por los jugadores que han jugado antes que él. En nuestro ejemplo, la empresa A no conoce la acción elegida por la naturaleza al comienzo del juego. El concepto de equilibrio de Nash, y su refinamiento más aceptado, la perfección en subjuegos, al estar diseñados para juegos con información perfecta, no tienen el poder suficiente para excluir comportamientos irracionales en juegos con información imperfecta. La búsqueda de un concepto de solución apropiado para juegos con información imperfecta fue la mayor búsqueda teórica en teoría de juegos durante la década de los 70 y la de los 80.
4. La economía con juegos Es a partir de los años 70 cuando la teoría de juegos empieza a colarse de forma sigilosa en la teoría económica y lo hace al relajarse uno de los supuestos implícitos del equilibrio general competitivo: la simetría de la información. La pregunta que se planteó George Akerlof, y que inició una revolución en economía, es qué ocurriría en un mercado competitivo si la información no estuviese distribuida simétricamente entre los agentes del mercado. ¿Seguiría éste explotando todas las ganancias asociadas al intercambio? Es decir, ¿seguiría siendo eficiente? Y la verdad es que la respuesta que encontró fue especialmente devastadora: es posible que desaparezca el mercado. El modelo que analizó fue el famoso mercado de coches de segunda mano en el que existen dos clases de coches: los de calidad alta y los de calidad baja (o trastos)13. Supongamos que la mitad de los coches son trastos y la mitad restante son de calidad alta. Supongamos que la valoración de un trasto para un vendedor es 1 y 13
En inglés se denomina lemon al producto de mala calidad que se intenta vender como si fuera bueno. Se trataría entonces de dar limones por naranjas como en castellano damos gato por liebre. Como la traducción de lemon por “gato” no se entendería, se suele traducir como “trasto” o “cacharro”. El trabajo clásico de Akerlof (1970), se titula “The market for lemons”, esto es, un mercado de trastos en el que el consumidor puede ser engañado si no sabe que está comprando un producto de mala calidad.
10
Economía, sociedad y teoría de juegos
para un comprador es 2, mientras que para los coches de alta calidad la valoración es 10 y 14 respectivamente 14. Existen dos configuraciones con información simétrica: o bien todos conocen la calidad de los coches o nadie la conoce. En el primer caso aparecen dos mercados de coches de segunda mano, uno para los de calidad alta y otro para los de calidad baja, y en ambos, tal y como predice la teoría clásica, aparece un precio al que se venden todos los coches. En el segundo caso, y tal y como predice la teoría clásica, aparece un único mercado en el que todos los coches de nuevo se venden, a un precio comprendido entre la valoración media de los compradores y la valoración media de los vendedores. Ahora bien, si la información acerca de la calidad de los coches fuese asimétrica, es decir, conocida por los vendedores y desconocida por los compradores, entonces las cosas serían bastante diferentes. Dado que un coche puede ser un trasto o no con probabilidad ½, un comprador no estaría dispuesto a pagar por un coche del que desconoce la calidad una cantidad mayor que la media de sus valoraciones, es decir, 8. Sin embargo, ese precio máximo es inferior al mínimo que exige un vendedor de un coche de calidad alta, que es 10. Así las cosas, los vendedores de coches de calidad alta se retirarían del mercado y en él sólo quedarían los trastos. Conclusión: el precio que surgiría en el mercado estaría entre 1 y 2, y no se aprovecharían todas las ganancias asociadas al intercambio, tal y como predeciría la teoría convencional, puesto que no se vendería ningún coche de calidad alta. El artículo de Akerlof muestra con toda su crudeza los efectos de la información asimétrica: el posible colapso de los mercados. Hoy en día el problema de la selección adversa forma parte de la formación básica de un economista, puesto que es aplicable a multitud de situaciones económicas. Es más, tal y como adelantaba Akerlof en su artículo, es posible que el problema de selección adversa sea la razón por la que en el mundo real han aparecido una serie de instituciones económicas que no tienen explicación en el marco convencional de la teoría económica. Una de ellas, por ejemplo, es la existencia de garantías asociadas a la venta de los coches de segunda mano. Esta es la forma que tienen los dueños de coches de buena calidad de señalizar a los compradores que su coche es bueno. De forma complementaria al análisis de Akerlof aparecen simultáneamente dos trabajos adicionales: el de Spence (1973) aplicado al mercado laboral y el de Rothschild y Stiglitz (1976) aplicado al mercado de seguros. Michael Spence complementó el análisis de George Akerlof al realizar un análisis detallado de la señalización como forma de superar el problema de selección adversa. Y lo hizo en el mercado laboral, donde la información asimétrica reside en la capacidad productiva de los trabajadores. Esta es información privada de cada trabajador y, por tanto, es desconocida por los empresarios. Sin embargo, es muy relevante, puesto que un trabajador con una alta capacidad productiva produce más y, por tanto, el empresario estará dispuesto a pagarle un salario más alto que a un trabajador con una capacidad productiva baja. En términos clásicos, si pensamos por ejemplo en la teoría de la distribución de la renta, cada trabajador debería tener un salario igual a su producto marginal. Sin embargo, desde la perspectiva del empresario, al no conocer la capacidad productiva de los trabajadores, éste debería ofrecer un salario igual a la productividad esperada de los trabajadores (la productividad media de un trabajador). Y entonces podemos encontrarnos, tal y como nos enseñó Akerlof, con un colapso del mercado de trabajo en el que solamente los trabajadores con capacidad productiva baja formasen la oferta de trabajo. 14
Piensa que las valoraciones vienen medidas en miles de dólares.
Economía y juegos
11
¿Qué puede hacer un trabajador para “convencer” el empresario de que es de calidad alta? Obviamente no puede simplemente decir que tiene calidad alta, puesto que entonces todos los trabajadores, tanto de capacidad alta como baja, lo dirían y, por tanto, dicha señal no sería reveladora de la capacidad del trabajador. Lo que Spence intuyó es que para que una señal tuviera “éxito” y permitiese a los empresarios discriminar entre tipos de trabajadores, debería incorporar distintos costes para distintos tipos de trabajadores. Y la señal que propuso fue la educación, bajo el supuesto de que a mayor capacidad productiva, menor es el esfuerzo requerido para conseguir un determinado nivel de educación. Lo curioso del modelo de Spence es que supuso que la educación no afecta en absoluto a la capacidad productiva. De esa forma, la inversión en educación sólo sirve para señalizar la capacidad productiva de un trabajador. Y Spence mostró que, efectivamente, algo tan improductivo como la educación desempeña un papel clave en la señalización de la capacidad productiva, puesto que demostró la existencia de equilibrios en su modelo en los que las empresas establecían un perfil salarial en función de la educación de los trabajadores. Hay por último un tercer trabajo que completa el dibujo de la información asimétrica de los años 70, que es el realizado por Joseph Stiglitz, conjuntamente con Michael Rothschild, en 1976. Éste debe verse como el complemento natural a los dos anteriores: Akerlof pone de relieve el problema, Spence analiza qué puede hacer un agente con información superior y Stiglitz analiza qué puede hacer un agente con información inferior para remediar los problemas de la información asimétrica. El marco analizado es el mercado de seguros, en donde las empresas no conocen el riesgo de accidente de los consumidores, que puede ser alto o bajo. Rothschild y Stiglitz demuestran que la política óptima de precios por parte de las aseguradoras es ofrecer dos tipos de contratos de seguro distintos: uno de ellos con cobertura completa y otro, más barato, pero con cobertura parcial. Y los consumidores deben elegir por tanto qué seguro encuentran más beneficioso. En equilibrio, los consumidores se autoseleccionan: aquellos con una alta probabilidad de accidente eligen el seguro con cobertura completa, mientras que los consumidores con baja probabilidad de accidente eligen el seguro más barato con cobertura parcial. Rothschild y Stiglitz demuestran que este es el único equilibrio del modelo y que es socialmente eficiente. Como estamos viendo, en los años 70 aparece una corriente que empieza a resolver problemas asociados al reparto asimétrico de la información en la economía. Pero estos problemas no eran nuevos en economía, sino que llevaban años esperando una solución. A modo de ejemplo veremos dos situaciones en las que el Estado tiene un papel fundamental: la provisión óptima de bienes públicos y el nivel de imposición óptima. Paul Samuelson en la década de los 50 ya había alertado de que uno de los problemas básicos a los que se enfrenta el sector público a la hora de determinar la provisión óptima de un bien público es el hecho de que desconoce las preferencias de los ciudadanos; es decir, desconoce cuál es la cantidad de dinero que cada individuo está dispuesto a pagar por el bien público. Es más, según señala Samuelson, los individuos tendrán incentivos para falsear sus preferencias, es decir, a dar falsas señales para hacer creer que tienen poco interés en el bien público. Paul Samuelson no encontró respuesta a su pregunta, pero sí lo hicieron Clarke y Groves a principios de la década de los 70.
12
Economía, sociedad y teoría de juegos
Por otro lado, William Vickrey (1945) también había alertado de las dificultades del cálculo de la imposición óptima por parte del Estado derivadas de su desconocimiento de las preferencias de los ciudadanos. En general, cualquier Estado debe preocuparse por dos cuestiones fundamentales: la eficiencia y la equidad. La eficiencia se refiere al tamaño del pastel que genera la sociedad, mientras que la equidad tiene que ver con el reparto del pastel entre los miembros de la sociedad. En relación con estas cuestiones tan importantes, la ortodoxia económica del equilibrio general competitivo daba unas respuestas muy claras: el primer Teorema del Bienestar dice que cualquier asignación realizada por el mercado será eficiente, por lo que el Estado no debe preocuparse por la eficiencia. En relación con la equidad, el segundo Teorema del Bienestar dice que toda asignación eficiente puede ser el resultado de un equilibrio competitivo sin más que reajustar las dotaciones iniciales de todos los participantes en el mercado de una forma conveniente. Así pues, el Estado podía elegir la asignación eficiente que considerase más justa (a partir de una determinada función de bienestar social) y calcular cómo debía redistribuir las dotaciones iniciales mediante impuestos y subvenciones. Así, por ejemplo, Francis Ysidro Edgeworth, dada su visión utilitarista, argumentaba que las rentas de los individuos de la sociedad deberían ser igualadas mediante impuestos. Sin embargo, el problema que tiene este tipo de transferencias es que dependen de características que no son observadas por el Estado (preferencias, dotaciones iniciales,...) Por tanto, los requerimientos informacionales son tan elevados que la utilidad práctica del segundo Teorema del Bienestar es bastante escasa. Así las cosas, los impuestos deberían imponerse sobre el comportamiento de los individuos, más que sobre las características de los individuos. Uno de los más utilizados es el impuesto sobre la renta de las personas, dado que la renta sí que puede ser observada por el Estado. Sin embargo, este tipo de impuestos introducen distorsiones puesto que afectan a las decisiones de trabajo de la personas 15. William Vickrey fue el primer economista en advertir que no podría conseguirse una distribución eficiente de la renta dado el problema de incentivos inherente a los impuestos. Por tanto, el diseño óptimo de un sistema impositivo debía tener en cuenta la condición de compatibilidad de incentivos, y en dicho diseño debe ser tenida en cuenta la relación de intercambio entre eficiencia y equidad. Ahora te pregunto: ¿resolvió William Vickrey el problema de la imposición óptima? No. La resolución tuvo que esperar 26 años, ya que vino de la mano de James Mirrlees en 1971. ¿Qué tenía nuevo la teoría económica en los años 70 que no estaba disponible en los 50 y que permitía abordar con éxito problemas relativos al reparto desigual de la información? Pues la teoría de juegos basada en el equilibrio de Nash y ampliada por Reinhart Selten y John Harsanyi. De hecho, los modelos de Akerlof, Spence, Stiglitz y Rothschild, de Clarke y Groves y James Mirrless se describen como un juego y se resuelven mediante el concepto de equilibrio de Nash y/o sus extensiones, el perfecto en subjuegos y el bayesiano. De hecho, forman parte del bagaje normal de un curso de microeconomía avanzada. La teoría de juegos empezaba a convertirse, por tanto, en una herramienta muy útil a la hora de representar y estudiar los problemas de incentivos inherentes a situaciones con 15
Un mayor nivel de impuestos hace que las personas dediquen menos tiempo a trabajar y más tiempo al ocio. Por tanto, tiene una repercusión negativa en la producción de la economía.
Economía y juegos
13
información asimétrica. Pero claro, ofrecía aún más posibilidades, y es que podía utilizarse para estudiar el comportamiento de agentes racionales en cualquier situación estratégica. Y estas son palabras mayores porque claro, si uno es capaz de describir el comportamiento de los agentes económicos en cualquier situación estratégica, entonces se abre la posibilidad de poder diseñar instituciones tales que el resultado de la interacción estratégica tuviese determinadas propiedades deseables desde algún punto de vista. Piensa, por ejemplo, en el problema de la provisión de un bien público por parte del Estado considerado por Paul Samuelson en los años 50. El Estado no conoce los beneficios sociales asociados a la provisión del bien público puesto que desconoce las preferencias de los miembros de la sociedad acerca del bien público. Evidentemente, si las conociera entonces podría tomar la decisión eficiente desde el punto de vista social: proveerlo siempre que los beneficios sociales superen al coste y no proveerlo en caso contrario. La pregunta relevante es por tanto: ¿puede el Estado diseñar un juego de tal forma que el resultado del juego siempre arroje la decisión eficiente independientemente de cuáles sean las preferencias de los miembros de la sociedad? Es decir, ¿puede el Estado diseñar un juego que no sea estratégicamente manipulable por los miembros de la sociedad? Preguntas de este tipo son las que caen dentro de la teoría de la implementación de funciones de elección social. No hace falta que nos vayamos a la teoría de la elección social para tomar conciencia de la relevancia del diseño de juegos para la economía. Por ejemplo, imagínate que tienes un objeto que quieres vender, pero no conoces la valoración del objeto por parte de los posibles compradores. ¿Puedes diseñar un juego que te permita maximizar tus beneficios? O imagínate que estás interesado en tomar la decisión eficiente, es decir, venderlo al comprador que tenga la valoración más alta. ¿Cómo diseñar un juego que te asegure la eficiencia? En los años 70 se empieza a desarrollar una importante rama de la teoría económica destinada a dar respuesta a estas preguntas. Su nombre genérico es teoría del diseño de mecanismos y tiene como objetivo fundamental el diseño de instituciones que satisfagan determinados objetivos deseables independientemente de la información que desconozca el diseñador de la institución. El supuesto básico es que la interacción estratégica por parte de los individuos participantes se modeliza mediante las herramientas de la teoría de juegos. El esquema básico de un mecanismo es relativamente fácil y se lo debemos a Leonid Hurwicz (1972). En su versión más simple, se trata de que cada individuo participante elija un mensaje perteneciente a un conjunto y a partir de los mensajes recibidos, el mecanismo tome su decisión, es decir, decida los pagos que recibirán cada uno de los participantes. De hecho, ya hemos visto un mecanismo en funcionamiento: la subasta de segundo precio analizada por William Vickrey en los años 60. En dicha institución, los mensajes que envían los participantes son sus pujas, y la decisión de la institución es entregar el objeto al mayor pujador, siendo el precio la segunda mayor puja. La dificultad del diseño de mecanismos es que, en principio, existen infinidad de mecanismos imaginables, por lo que tratar de responder a la pregunta de si existe un mecanismo que implemente la decisión eficiente puede parecer excesivamente complejo. Sin embargo, Roger Myerson demostró uno de los resultados fundamentales de esta disciplina a finales de los 70: el llamado principio de revelación. Este principio nos dice que
14
Economía, sociedad y teoría de juegos
podemos centrarnos simplemente en mecanismos directos. Recuerda que la forma en la que se modeliza la información asimétrica en teoría de juegos es mediante la especificación de Harsanyi de asignar tipos a los distintos jugadores, que son elegidos en el momento inicial por la naturaleza a partir de un espacio de tipos. Pues bien, un mecanismo directo es aquel en el que el espacio de mensajes disponible para los participantes es precisamente el espacio de tipos. De esta forma, la tarea de los participantes del juego es decir cuál es su tipo (obviamente pueden mentir acerca de su tipo). Lo que Roger Myerson demostró es que, para cualquier mecanismo que se nos pueda ocurrir, siempre podemos encontrar un mecanismo directo equivalente —es decir, que genere el mismo resultado de equilibrio— en el que revelar el tipo verdadero sea el equilibrio del mecanismo. De esta forma, la búsqueda de mecanismos (instituciones) que tengan determinada propiedad deseable podía restringirse al conjunto de mecanismos directos compatibles con los incentivos (es decir, aquellos en los que decir la verdad acerca del tipo es equilibrio). El principio de revelación deja abierta, sin embargo, una pequeña rendija por la que podría escaparse todo su poder: a veces un mecanismo admite más de un equilibrio y, aunque sepamos que uno de ellos cumple con la propiedad deseada, la eficiencia por ejemplo, es posible que el resto de equilibrios sean muy ineficientes. Por lo tanto, no tenemos la seguridad de que la institución económica que describe el mecanismo realmente nos ayude a la hora de conseguir la eficiencia económica. La cuestión relevante es, por tanto, acerca del diseño de mecanismos tales que todos sus equilibrios —y no sólo uno— tengan la propiedad deseada. La primera respuesta general a esta pregunta, que fue el comienzo de la teoría de la implementación, vino de la mano de Eric Maskin en 1977. Es a finales de la década de los 70 cuando la teoría de juegos había encontrado definitivamente su lugar en la economía. Por fin, los años 80 asisten a la consolidación definitiva de la teoría de juegos dentro de la economía. En 1982 Kreps y Wilson desarrollan el concepto de equilibrio secuencial que no es sino la extensión de la perfección en subjuegos a juegos con información imperfecta y completan el kit de herramientas que todo economista necesita para analizar con éxito cualquier situación estratégica. La revolución fue tan grande que se necesitaba organizar la disciplina en torno al nuevo lenguaje de la teoría de juegos y presentar a los economistas la nueva herramienta. Así, para finales de la década, en 1988, apareció The Theory of Industrial Organization de Jean Tirole, el primer libro que se ocupa de la llamada nueva economía industrial, la organización industrial basada exclusivamente en teoría de juegos16. En 1990, David Kreps publica A Course in Microeconomic Theory, el primer libro de texto que describe el análisis microeconómico desde la perspectiva de la teoría de juegos. Finalmente, en 1991, Drew Fudenberg y Jean Tirole publican el libro Game Theory, donde presentan los principios básicos de la teoría de juegos no cooperativos y su aplicación a la economía. Si la búsqueda de la eficiencia económica es el santo grial de la economía, entonces la teoría de juegos es el sancta sanctorum. Piensa que en el fondo, es relativamente fácil 16
The Economist (24 de diciembre de 1988), sobre Jean Tirole: “Drawing on game theory and another strange techniques, Tirole’s approach began to make sense of strategic behaviour that had seemed theoretically unmanageable” [Haciendo uso de la teoría de juegos y de otras técnicas inusuales, la aproximación de Tirole empieza a dar sentido a la conducta estratégica, que parecía teóricamente inmanejable].
Economía y juegos
15
conseguirla: lo único que se necesita es que los incentivos individuales estén alineados con los objetivos sociales. Hay veces que esa alineación surge de forma espontánea. Eso ocurre en los mercados competitivos. Ya hemos visto que Adam Smith hace dos siglos y medio así lo proclamaba, y que aparece en letras mayúsculas en el Primer Teorema del Bienestar: todo equilibrio competitivo es eficiente. El problema es que no siempre podemos conseguir que el mercado para la asignación de un bien o servicio sea competitivo. Hay bienes para los que no existe un número elevado de demandantes y oferentes, por lo que simplemente el mercado no puede ser competitivo. ¿Cómo podemos entonces conseguir la necesaria alineación de los incentivos individuales con los objetivos sociales? Esta pregunta no podía responderse hasta que tuviésemos la herramienta para poder realizar el análisis de los incentivos individuales. Y esa herramienta es la teoría de juegos. Esta nos ha enseñado a los economistas cómo, mediante la utilización de recompensas y castigos, podemos conseguir el alineamiento de los incentivos individuales con los objetivos sociales. Y hay básicamente dos formas de implementar los esquemas de incentivos: o bien mediante la redacción de contratos formales que pueden ser llevados ante un juez o bien mediante el establecimiento de relaciones a largo plazo. La teoría del diseño de mecanismos se ocupa de cómo diseñar esos contratos o instituciones óptimas mientras que la teoría de los juegos repetidos se ocupa de la segunda forma, en donde las recompensas y castigos vienen determinados por las interacciones futuras entre los jugadores. La transformación de la economía con la ayuda de la teoría de juegos fue total. En sólo 30 años pasó de ser una disciplina dedicada al estudio de las decisiones de producción y consumo en un marco competitivo a convertirse en una disciplina dedicada al análisis de los incentivos en cualquier institución social. De hecho, la profesión ha reconocido el papel fundamental desempeñado por la teoría de juegos al conceder los correspondientes premios Nobel de economía a la mayoría de los economistas que han ido apareciendo en este capítulo. En 1994 se otorgó el Nobel a John Nash, Reinhart Selten y John Harsanyi por “su análisis pionero de los equilibrios en la teoría de los juegos no cooperativos”. En 1996 fue otorgado a James Mirrless y William Vickrey por “sus contribuciones esenciales a la teoría económica de los incentivos bajo información asimétrica”. En 2001 fue otorgado a George Akerlof, Michael Spence y Joseph Stiglitz por sus “análisis de los mercados con información asimétrica”. En 2005 a Robert Aumann y Thomas Schelling por “haber mejorado nuestra comprensión del conflicto y la cooperación mediante la teoría de juegos” y, finalmente, en 2007, a Leonid Hurwicz, Eric Maskin y Roger Myerson por “sentar las bases de la teoría del diseño de mecanismos”. La siguiente sección está dedicada al presente y futuro de la economía con juegos. Buena parte de su contenido está relacionado con los Premios Nobel en economía concedidos en el año 2002: Daniel Kahneman y Vernon Smith. Al primero de ellos “por haber integrado los avances de la investigación psicológica en el análisis económico, especialmente los relativos al juicio humano y a las decisiones bajo incertidumbre”, y al segundo “por haber establecido los experimentos de laboratorio como un instrumento en el análisis económico empírico, especialmente en el estudio de mecanismos de mercado alternativos”.
16
Economía, sociedad y teoría de juegos
5. El futuro de la economía con juegos Hasta el momento hemos revisado la simbiosis del enfoque neoclásico de la economía con la teoría de juegos bajo su justificación racional. El paradigma actual en economía se asienta sobre tres pilares fundamentales —la maximización de la utilidad, la noción de equilibrio y la eficiencia—, y ya hemos visto cómo la teoría de juegos ha ayudado ha desarrollar los dos últimos. Pero de un tiempo a esta parte estamos asistiendo a una revolución silenciosa que es posible que en unos años transforme la forma de hacer economía, de la misma forma que la adopción de la teoría de juegos transformó la ciencia económica en los años 70 y 80. Dicha revolución es consecuencia natural de la propia evolución de la economía como ciencia. Hubo un tiempo en el que el supuesto de competencia perfecta reinaba en economía. Y más tarde la ciencia económica progresó mediante la consideración de la competencia imperfecta. Hubo un tiempo en que el supuesto de información perfecta reinaba en economía. Y la ciencia económica progresó al extender su análisis a la información imperfecta. Y hasta hace unos años, el supuesto de racionalidad perfecta dominaba en economía. Y la ciencia económica avanzará al eliminarla. La cuestión es qué camino debe seguirse porque es muy fácil definir qué es racionalidad perfecta, pero es muy complicado definir la racionalidad imperfecta17. Y como hay muchos caminos, en los últimos años hemos asistido a varios intentos en diversas direcciones. Pero el que parece más prometedor es la llamada Economía del Comportamiento, cuyo objetivo es dotar de más realismo psicológico a la economía, mediante la relajación del supuesto de racionalidad perfecta siguiendo la inspiración de la psicología. Lo curioso del asunto es que la idea de combinar economía y psicología no es nueva. El propio Adam Smith, uno de los padres de la economía y acuñador del concepto de la mano invisible, escribió un libro llamado The Theory of Moral Sentiments publicado en 1759 en el que trataba extensivamente los aspectos psicológicos de los sujetos económicos. Uno de ellos, por dar un ejemplo, se conoce actualmente como aversión a las pérdidas, y es uno de los temas centrales de la teoría prospectiva de Daniel Kahnemann y Amos Tversky (1979), pilar indiscutible de la economía del comportamiento. Adam Smith comentaba en el citado libro: Sufrimos más cuando pasamos de una situación buena a una peor en comparación con el gozo que experimentamos cuando pasamos de una situación mala a una buena.
Es más, en la segunda mitad del siglo XIX, cuando la revolución neoclásica estaba germinando, los aspectos psicológicos estaban muy presentes en las discusiones sobre el comportamiento de los sujetos económicos. Sin embargo, poco a poco estas ideas fueron expulsadas de la economía no se sabe muy bien por qué. Es posible que fuese porque en aquellos tiempos la psicología no estuviese más que naciendo como disciplina científica o bien porque en un intento por equiparar a la economía con las ciencias naturales, los aspectos psicológicos de la elección debían obviarse ya que toda la atención debía centrarse en los aspectos 17
Por supuesto que no vale con decir que es todo lo que no sea perfecto. En ciencia tenemos que ser más precisos si queremos avanzar.
Economía y juegos
17
observables: la elección del sujeto económico que nos revela las preferencias subyacentes. En este sentido, son muy elocuentes las siguientes palabras de Wilfredo Pareto, uno de los fundadores de la economía neoclásica, en un escrito de 1897. Es un hecho empírico que las ciencias naturales han progresado cuando han partido de segundos principios, en lugar de descubrir la esencia de las cosas. Conviene a la política económica pura por tanto asentarse lo menos posible en el dominio psicológico.
El efecto final fue que hacia la mitad del siglo XX, el objeto de estudio de la economía, el homo economicus, ya no tenía ninguna traza psicológica. A grandes rasgos, el homo economicus tiene una función de utilidad bien definida, en condiciones de incertidumbre maximiza la utilidad esperada (propuesta por von Neuman y Morgenstern en los años 40) y en decisiones intertemporales las utilidades futuras se descuentan de forma exponencial (propuesto por Paul Samuelson en 1937). Pero las ideas psicológicas están haciendo su reentrada en la economía 50 años después de que fuesen desterradas. Y esto ha sido posible porque del modelo basado en el homo economicus se derivan implicaciones muy precisas que pueden contrastarse utilizando datos, ya sean obtenidos en el mundo real o generados en un laboratorio mediante el método de la economía experimental18. Y a lo largo de años de contrastación empírica y experimental, la economía se ha ido dando cuenta que muchas veces los datos no se ajustan al modelo estándar. Y cuando los datos no se ajustan de forma persistente (la profesión ha necesitado 50 años para convencerse), entonces es necesario proponer modelos alternativos. Y el candidato más serio a modelo alternativo es el enfoque del comportamiento. Muy a grandes rasgos este enfoque persigue varias direcciones en las que los seres humanos se desvían del homo economicus tan perfectamente racional. Pasaremos revista a algunas de ellas y luego mostraremos un par de ejemplos de economía del comportamiento antes de ver cómo la revolución del comportamiento ha afectado a la teoría de juegos. El primer punto central de la economía del comportamiento es la constatación del hecho de que los seres humanos tenemos limitaciones cognitivas y de cálculo. El primero en advertirlo fue Herbert Simon en la década de los 50 en su artículo “A Behavioral Model of Rational Choice”, quien acuñó del término racionalidad limitada, aunque la economía ha tardado mucho tiempo en incorporar estas ideas. Y claro está, si existen límites cognitivos y de cálculo entonces tiene mucho sentido que los seres humanos utilicemos reglas simples a la hora de tomar nuestras decisiones en lugar de tratar de resolver óptimamente el problema. La toma de conciencia de estas “irracionalidades” (desde la perspectiva neoclásica) ha hecho florecer una enorme literatura sobre la racionalidad limitada. Uno de los campos en los que más está influyendo es en las finanzas. Hay dos motivos principales: en primer lugar porque los supuestos neoclásicos ofrecen predicciones muy precisas acerca del comportamiento de los inversores y, en segundo lugar, porque es un campo en donde existe una abundancia de datos que hace posible contrastar empíricamente las conclusiones neoclásicas. Hay todo un conjunto de anomalías en el comportamiento de los inversores que se ha tratado de explicar recurriendo a argumentos psicológicos. Por ejemplo, los inversores 18
El Capítulo 7 de este libro se ocupa de la economía experimental.
18
Economía, sociedad y teoría de juegos
suelen vender acciones ganadoras (las que están teniendo una revalorización) y mantener acciones perdedoras (las que se están devaluando); justamente lo contrario de lo que deberían hacer desde la óptica neoclásica (sobre todo teniendo en cuenta el tratamiento fiscal favorable de las pérdidas realizadas). Las finanzas del comportamiento achacan este comportamiento a la aversión a las pérdidas. Un segundo ejemplo: los inversores suelen negociar en demasía cuando el paradigma neoclásico nos dice que dado que los mercados son eficientes —es decir, los precios recogen toda la información disponible— sólo se debería negociar en presencia de información nueva. La economía el comportamiento achaca este comportamiento a un exceso de confianza de los inversores. Un segundo pilar de la economía del comportamiento es el llamado sesgo hacia el presente, es decir, el hecho de que los seres humanos no siempre elegimos teniendo en cuenta las consecuencias a largo plazo de nuestras decisiones. Esto implica que suele pesar más lo inmediato que el futuro distante. Una forma elegante de capturar este sesgo es el llamado descuento hiperbólico: todos los momentos futuros son descontados de igual forma mientas que se penaliza cualquier momento futuro con respecto al momento presente. Este sesgo hacia el presente ha sido postulado desde la economía del comportamiento para explicar una de las anomalías más clásicas de las teorías neoclásicas por excelencia sobre el consumo intertemporal: la hipótesis del ciclo vital y la hipótesis de la renta permanente. Según estas teorías, a lo largo de la vida de las personas deberíamos observar un nivel de consumo constante, puesto que las decisiones de consumo no deben hacerse teniendo en cuenta los ingresos presentes, sino todos los ingresos esperados en la vida del consumidor. Sin embargo, los datos de la vida real muestran una obstinada relación positiva entre el consumo y la renta presente. David Laibson en su artículo de 1997 “Golden Eggs and Hyperbolic Discounting” achaca esta relación positiva al sesgo hacia el presente. Dicho sesgo hace que en cada momento, al valorarse más el presente que cualquier momento futuro, el incentivo para ahorrar sea mínimo. Cuando un consumidor es consciente de dicho sesgo, puede buscar alguna fuente de compromiso externo como forma de superar su falta de autocontrol. Una solución puede ser ahorrar con instrumentos muy poco líquidos que limiten la capacidad de consumo en el futuro. De esta forma, en cada momento del tiempo y fruto del ahorro líquido, los consumidores pueden tener restricciones de liquidez que hagan que el consumo esté relacionado positivamente con la renta presente. Por último, un tercer pilar de la economía del comportamiento es que los seres humanos a veces sacrificamos pagos propios para ayudar a los demás; es decir, no somos tan egoístas como supone el homo economicus tradicional19. Es cierto que el enfoque de la economía del comportamiento es de momento una pequeña revolución que está en sus comienzos y que más o menos puede fecharse con cierta precisión: 1980, con la publicación del artículo “Toward a Positive Theory of Consumer Choice” de Richard Thaler. Pero también es cierto que está empezando a tener mucha importancia en la literatura económica. Para que tengas una idea de cómo la economía del comportamiento ayuda a entender el comportamiento real de los sujetos económicos, vamos a analizar otros dos ejemplos: el comportamiento de los taxistas de Nueva York y el efecto de las multas 19
Esta línea la trataremos más adelante puesto que es un pilar indiscutible de la teoría de juegos del comportamiento.
Economía y juegos
19
en las guarderías de Israel. Después de ver los ejemplos, finalizaremos este capítulo con el análisis de cómo la revolución de la economía del comportamiento ha alcanzado a la teoría de juegos, de tal forma que en la actualidad ya podemos hablar de teoría de juegos del comportamiento. La teoría estándar de oferta de trabajo predice cómo cambia ésta ante variaciones en los salarios. Dado que dedicar más horas al trabajo disminuye el número de horas dedicadas al ocio, en un entorno intertemporal un trabajador debería dedicar más horas al ocio el día en que su salario disminuye y dedicar más horas al trabajo el día en que el salario aumenta. La idea fundamental es que trabajo y ocio se sustituyen intertemporalmente. Sin embargo, Colin Camerer y otros autores en su artículo de 1997 “Labor Supply of New York City Cabdrivers: One Day at a Time” analizaron el número de horas que los taxistas de Nueva York dedican a trabajar diariamente y encontraron exactamente la relación contraria. Aquellos días en los que la demanda de viajes en taxi es mayor, y por lo tanto los taxistas tienen un salario mayor, éstos trabajan menos horas mientras que trabajan más horas los días en que la demanda de viajes en taxi es menor. ¿Cómo puede explicarse esta desviación con respecto al modelo estándar? La economía del comportamiento puede hacerlo relajando el supuesto de que los taxistas son perfectamente racionales. La idea es que los taxistas son miopes, no tienen en cuenta el carácter intertemporal del problema, y se fijan un objetivo de ingresos cada día. Teniendo en cuenta la aversión a las pérdidas, es decir, a ingresar menos del objetivo, la conclusión es que los taxistas trabajan más horas aquellos días en los que sus salarios son menores para evitar ganar menos dinero del objetivo marcado. Piensa ahora en las guarderías. Tienen un horario fijo y los padres deben recoger a sus hijos antes de que cierren. Pero no son raros los casos en que los padres llegan tarde, provocando que la guardería no pueda cerrar a su hora y generando una pérdida de bienestar en los trabajadores de la guardería. Ante esa situación, la guardería puede plantearse cómo proveer los incentivos adecuados para que los padres recojan a su hora a sus hijos. Uri Gneezy y Aldo Rustichini analizaron en el año 2000 esta problemática en su artículo “A Fine is a Price”. Observaron que en Israel impusieron una multa por recoger tarde a los hijos. Y el resultado fue justo el contrario del que se esperaba: el número de padres que recogían tarde a sus hijos aumentó. La economía del comportamiento puede explicar este resultado sin más que incluir componentes morales en la toma de decisiones de los agentes económicos. El coste moral de llegar tarde fue cuantificado por la multa y algunos padres encontraron beneficioso pagar la multa y quedar así liberados del coste moral. En los últimos años, la economía del comportamiento también ha impregnado a la teoría de juegos hasta el punto de que ya existe la llamada teoría de juegos del comportamiento. De nuevo el punto de partida es exactamente el mismo, aunque en este caso la evidencia es mucho mayor. Dado el desarrollo de la economía experimental, a día de hoy existe una multitud de experimentos que nos ayudan a ver si las predicciones de la teoría de juegos tradicional se cumplen. Dado que existe una apabullante evidencia experimental que nos muestra que tales predicciones no siempre se cumplen, es lógico que la ciencia económica se embarque en una búsqueda de un modelo alternativo que sea capaz de explicar las violaciones de la teoría de juegos clásica. Hay muchas líneas de investigación dentro de la teoría de juegos del comportamiento, pero en este capítulo sólo consideramos tres: las
20
Economía, sociedad y teoría de juegos
funciones de utilidad social, el análisis de la primera jugada y el análisis de cómo evoluciona el comportamiento conforme se repite el juego. En todas ellas, el paradigma de la teoría de juegos tradicional es modificado. El supuesto de egoísmo con el que la ciencia económica dotó al homo economicus deja fuera temas tan importantes como la revancha, la reciprocidad, la venganza, la justicia, etc. Y, sin embargo, estos temas son importantes a la hora de entender el comportamiento de los agentes económicos. Piensa por ejemplo en el dilema de presos. La teoría de juegos tradicional predice (simplemente, como recordarás, a partir del hecho de que no es racional jugar estrategias estrictamente dominadas) que los jugadores no deben cooperar. Sin embargo, la economía experimental nos dice que los jugadores cooperan (puesto que esperan que sus rivales cooperen) durante la primera mitad del experimento. Piensa ahora en la versión más reducida de un juego de negociación: el juego del ultimátum. Un jugador ofrece a un segundo jugador un reparto de una cantidad de dinero, éste último puede aceptar el reparto —en cuyo caso el reparto se hace— o puede rechazarlo, en cuyo caso ambos jugadores no consiguen nada. La perfección en subjuegos nos dice que el primer jugador no debe ofrecer nada, mientras que el segundo jugador debe aceptar cualquier propuesta de reparto. La economía experimental nos revela que ofertas inferiores al 30% del pastel son rechazadas y que se suele ofrecer (y por tanto aceptar) casi la mitad del pastel. Estos resultados nos indican que un reparto 50-50 es considerado justo por los jugadores. La forma de racionalizar estos resultados es la consideración de funciones de utilidad social, en las que los pagos de los rivales tienen un peso. En los últimos años ha aparecido una enorme cantidad de funciones de utilidad social, que van desde la aversión por la desigualdad (Fehr y Schmidt, 1999) hasta las que priman la reciprocidad (Rabin, 1993). Las teorías de la aversión a la desigualdad suponen que los individuos prefieren configuraciones de pagos simétricas entre los jugadores, por lo que encuentran beneficioso sacrificar pagos propios por conseguir distribuciones más igualitarias. Fíjate que este tipo de preferencias sociales explican el comportamiento en juegos como el del ultimátum. Por otro lado, las teorías basadas en la reciprocidad suponen que los individuos están dispuestos a tratar bien al rival siempre que éste lo haya tratado bien y están dispuestos a tratar mal al rival en caso contrario. Fíjate que estas teorías pueden explicar por qué los sujetos experimentales cooperan en el dilema de presos. El segundo punto de atención de la teoría de juegos del comportamiento se refiere al estudio de la toma de decisiones de los jugadores cuando se enfrentan a un juego por primera vez. La teoría de juegos tradicional justifica el equilibrio de Nash en el hecho de que los jugadores, mediante la introspección, hacen los cálculos necesarios para encontrar el equilibrio de Nash y lo juegan porque suponen que los rivales también harán un razonamiento similar. Sin embargo, la economía experimental nos enseña que no siempre es el caso. De hecho, desarrollar una buena teoría acerca de cómo los jugadores se enfrentan a un juego por primera vez es uno de los objetivos de la teoría de juegos del comportamiento. Uno de los mejores ejemplos lo encontramos en el juego denominado Concurso de Belleza. Cada persona de un grupo debe elegir un número entre 0 y 100, siendo el ganador aquel que más se acerque a dos tercios de la media de todos los números. La estrategia
Economía y juegos
21
de equilibrio de Nash del juego es decir 0 20. Sin embargo, a nivel experimental, como encontró Rosemarie Nagel en su artículo “Unraveling in Guessing Games: An Experimental Study” de 1995, los números que más aparecen suelen ser 33 y 22. La explicación aportada por la teoría de juegos del comportamiento es que las personas tienen distintos niveles de profundidad en su razonamiento. Una persona que piense que los demás elegirán los números de forma aleatoria debe, por tanto, esperar que la media sea 50. Por todo lo anterior, ante una media de 50 la mejor respuesta es decir dos tercios de la media, es decir, 33. Una persona que piense que los demás harán el razonamiento anterior, debe esperar que la media sea 33, y por tanto la mejor respuesta, es decir, dos tercios de 33, 22. Y así podemos seguir con distintos niveles de profundidad. Cuando consideramos una profundidad infinita en el razonamiento, la secuencia converge a 0, precisamente el equilibrio de Nash del juego. En este juego vemos cómo la presencia de límites en la capacidad de razonamiento, es decir, de límites cognitivos, se esconde detrás de la elección de los jugadores. Y vemos además que el nivel de profundidad exhibido por las personas casi nunca va más allá de tres, reforzando la existencia de límites cognitivos. Lo curioso del asunto es que al repetir el juego unas cuantas veces —con 10 es suficiente— los números convergen hacia el cero, el equilibrio de Nash del juego. Y ésta es precisamente la tercera línea de investigación de la teoría de juegos del comportamiento: analizar cómo a medida que los jugadores van ganando experiencia van modificando su comportamiento; es decir, entender cómo aprenden a jugar. En la literatura económica existen muchísimos modelos de aprendizaje puesto que ha sido un campo muy activo de investigación en economía en los últimos quince años. A grandes rasgos podemos decir que casi todos los modelos de aprendizaje suponen que cada una de las estrategias disponibles para un jugador tiene un número asignado, que puede interpretarse como la atracción que el jugador siente por jugar dicha estrategia. Distintos modelos de aprendizaje se diferencian en la forma en la que las atracciones de cada una de las estrategias son actualizadas conforme el jugador va jugando el juego. El objetivo último de esta literatura es analizar en qué situaciones el comportamiento generado por los modelos de aprendizaje converge hacia algún concepto de equilibrio tradicional (piensa por ejemplo en el equilibrio de Nash). La importancia de este tipo de análisis es muy grande para la economía, puesto que proporciona un argumento alternativo para resaltar la importancia del equilibrio de Nash en economía. Ya no hace falta suponer que los jugadores encuentran el equilibrio mediante la introspección, sino que éste puede surgir como el resultado de un proceso de aprendizaje basado en el ensayo y error. Fíjate que esta aproximación libera al equilibrio de Nash del supuesto de racionalidad tradicional y por tanto nos enseña que puede ser relevante como descripción del comportamiento de seres con límites en la racionalidad. En general, encontramos en la literatura tres grandes grupos de modelos de aprendizaje: modelos evolutivos, modelos de aprendizaje por refuerzo y modelos basados en creencias. Los modelos evolutivos son los que establecen un menor requerimiento sobre la “racionalidad” de los jugadores. Simplemente suponen que cada jugador está determinado genéticamente para jugar una estrategia y mediante el emparejamiento aleatorio 20
También es la única estrategia que sobrevive al proceso de eliminación iterativa de estrategias estrictamente dominadas.
22
Economía, sociedad y teoría de juegos
entre distintos jugadores de una población, aquellas estrategias que consiguen unos pagos mayores se hacen relativamente más frecuentes en la población. La dinámica que genera en la población se denomina dinámica del replicador y puedes pensar en ella como una especificación de la dinámica darwinista de la supervivencia del más fuerte. La teoría de juegos evolutivos ha sido un campo de investigación muy activo en teoría de juegos durante los años 90 por dos razones fundamentales: porque implica un refinamiento del equilibrio de Nash y porque ayuda a seleccionar equilibrios en problemas de coordinación 21. El segundo grupo de modelos de aprendizaje se basa en el aprendizaje por refuerzo, y tuvo una gran tradición en psicología conductista en la primera mitad del siglo XX hasta que fue adoptado en economía en los años 70. Dicho modelo supone que los jugadores no se forman creencias acerca del juego de sus rivales, sino que simplemente responden al estímulo que es el pago recibido tras jugar una estrategia. La clave de estos modelos es que sólo se actualiza la atracción de la estrategia jugada dejando las demás inalteradas. El último grupo de modelos de aprendizaje implica un mayor grado de sofisticación de los jugadores. Los jugadores se forman creencias acerca del juego de sus rivales y responden de forma óptima a estas creencias. Sin embargo, no son bayesianos a la hora de formar las creencias, como supone el modelo estándar neoclásico. El modelo más simple de esta clase es el denominado juego ficticio, en el que cada jugador supone que sus rivales seleccionan sus estrategias a partir de una distribución de probabilidad estacionaria. Así las cosas, la frecuencia histórica con que cada estrategia ha sido elegida por los rivales es una buena aproximación de la distribución de probabilidad estacionaria. Cada jugador por tanto elige la estrategia que maximiza su pago esperado dadas las frecuencias históricas (que son las creencias). Si bien la literatura teórica se ha centrado en averiguar las propiedades de convergencia de distintos modelos plausibles de aprendizaje, la teoría de juegos del comportamiento pone el énfasis en averiguar qué modelo de aprendizaje describe mejor la evolución del comportamiento de los individuos en una situación estratégica. Y en este sentido, los modelos evolutivos no son especialmente relevantes para poder explicar el comportamiento real en experimentos, así que tienen un papel menor en la teoría de juegos del comportamiento. Con respecto a las otras dos formas de modelizar el aprendizaje, la economía experimental ha encontrado evidencias mixtas. En algunas situaciones los modelos de refuerzo son superiores a la hora de predecir el comportamiento de los jugadores, por ejemplo en juegos con equilibrios en estrategias mixtas, mientras que son inferiores a los modelos basados en creencias en otros, por ejemplo, en juegos de coordinación. Así pues, la evidencia experimental nos indica que el camino tiene que estar en algún punto intermedio y eso es precisamente el camino seguido por Colin Camerer y Teck-Hua Ho con su artículo de 1999 “Experience-weighted Attraction Learning in Normal Form Games”. Su modelo de aprendizaje (denominado EWA 22) es un híbrido entre los de refuerzo y los de creencias, y es de momento que más éxito ha tenido a la hora de predecir la evolución del comportamiento en experimentos. Hay un último avance dentro de la teoría de juegos del comportamiento que quisiera mencionar antes de terminar esta sección. Se refiere a lo que podríamos llamar la 21
Muchos de estos modelos generan una convergencia hacia el equilibrio dominante en riesgo.
22
La traducción sería “modelo de aprendizaje con atracciones ponderadas por la experiencia”.
Economía y juegos
23
versión de racionalidad limitada del equilibrio de Nash. Hasta ahora toda la atención de la teoría de juegos se ha centrado en el equilibrio de Nash. Originalmente éste descansaba sobre el supuesto de racionalidad perfecta y hace unos años se abrieron argumentos alternativos basados en la racionalidad limitada de los agentes económicos. Recientemente ha aparecido en la literatura una extensión del concepto de equilibrio de Nash ideada por Richard McKelvey y Thomas R. Palfrey en 1995, el Quantal-Response Equilibrium (QRE), que podemos traducir por equilibrio de respuestas estocásticas. La idea básica es que los jugadores pueden cometer errores a la hora de elegir su estrategia23, pero que no todos los errores son igualmente probables: los errores más probables son los que tienen un menor coste asociado, es decir, un mayor pago esperado. Así las cosas, los individuos son más proclives a elegir buenas estrategias, aunque no necesariamente la mejor estrategia, que es básicamente lo que exige el equilibrio de Nash. Un QRE es aquel en el que las creencias de los jugadores acerca del juego de los rivales coinciden con las probabilidades con las que estos eligen sus estrategias. La versión más extendida del QRE es la basada en un modelo logit, en donde las probabilidades son proporcionales a los pagos esperados24. Lo interesante es que el factor de proporcionalidad puede interpretarse como un factor que mide la racionalidad de los individuos. Si es muy pequeño, entonces el individuo prácticamente elige de forma aleatoria, mientras que en el extremo contrario, cuando es muy grande, los jugadores son muy sensibles a los pagos esperados y, por tanto, se aproximan muchísimo a jugar la mejor respuesta. En el límite, como vemos, el modelo QRE tiende al concepto de equilibrio de Nash y por eso se le suele denominar como la extensión del equilibro de Nash hacia la racionalidad limitada. Actualmente, el equilibrio de respuestas estocásticas es un concepto muy utilizado en economía del comportamiento para explicar el comportamiento de los individuos en entornos estratégicos, puesto que es capaz de predecir el comportamiento mejor que el equilibrio de Nash. El repaso que hemos realizado en esta sección de la economía del comportamiento es bastante sugerente. Hemos visto cómo la introducción de componentes psicológicos en economía y particularmente en la teoría de juegos aporta luz a la hora de explicar el comportamiento real de los seres humanos en situaciones estratégicas. Sin embargo, es un enfoque que no predomina en la disciplina y tiene sus detractores importantes dentro de la ortodoxia económica. Citaré un par de ejemplos. Stephen A. Ross, uno de los creadores de las finanzas modernas con el modelo de valoración basado en el arbitraje (APT), es un luchador innato contra la enorme oleada de “conductismo” que recorre la profesión. Muchos de sus pensamientos puedes encontrarlos en su libro Neoclassical Finance. En él se esfuerza por mostrar que las finanzas neoclásicas pueden explicar la mayoría de las anomalías que han dado origen al campo de las finanzas del comportamiento. Ariel Rubinstein, uno de los más grandes impulsores de la teoría de juegos desde los años 80 y precursor de la introducción de modelos de racionalidad limitada, no acepta el enfoque de la economía del comportamiento. Hay un magnífico 23
Esta idea no es nueva, recuerda el concepto de equilibrio de la mano temblorosa de Reinhart Selten.
24
Específicamente, las probabilidades son proporcionales a la exponencial del pago esperado.
24
Economía, sociedad y teoría de juegos
artículo suyo titulado “Discussion of Behavioral Economics” en donde expone sus críticas. Finalmente, el artículo “The Rhetoric of Inequity Aversion” de Avner Shaked, de 2005, contiene una crítica muy ácida de los modelos de aversión a la desigualdad de Fehr y Schmidt25. Mi visión particular es que no sabemos cuánto tiempo tardará en germinar la semilla del “conductismo” en economía (si es que lo hace), o si es realmente necesario para entender el comportamiento de los agentes económicos el conocimiento preciso de los procesos que ocurren en la mente humana, como recientemente ha empezado a estudiar la neuroeconomía. Pero lo que si está más o menos claro es que existen evidencias claras de que los ingredientes psicológicos forman parte importante del comportamiento económico. Como estamos al comienzo de la revolución, todavía hay demasiado polvo en suspensión. Citando a Ariel Rubinstein (2005), es cierto que el artículo típico de economía del comportamiento empieza observando una anomalía neoclásica, recurre a algún tipo de evidencia psicológica o animal, cambia un par de supuestos y explica la anomalía. Y eso hace que a día de hoy haya casi tantos modelos como anomalías. Encontrar unos pocos principios básicos (psicológicos) que expliquen casi la totalidad del comportamiento económico va a llevar años. Pero cuando se encuentren, la ciencia económica habrá dado un paso de gigante hacia la comprensión del comportamiento del ser humano.
6. Conclusión Este capítulo ha mostrado la enorme influencia que la teoría de juegos ha tenido sobre la economía. Ha abierto su campo de estudio al poder analizar cualquier situación estratégica. Conceptos como equilibrio de Nash o perfección en subjuegos ya forman parte de la jerga común de los economistas. Y también hemos visto cómo los economistas estamos influyendo en la forma de hacer teoría de juegos, como lo ejemplifica la teoría de juegos del comportamiento. Actualmente, conceptos como racionalidad limitada, descuento hiperbólico, EWA y QRE se están utilizando ampliamente en economía. Por si este capítulo te ha parecido poco y tienes ganas de más, entonces te recomiendo el siguiente recorrido. Para una introducción rápida a la teoría de juegos con algunos ejemplos económicos puedes leer el artículo de Robert Gibbons “An Introduction to Applicable Game Theory” de 1997. Este artículo es una versión muy reducida del libro del mismo autor A Primer in Game Theory, que es un libro muy recomendado para aprender teoría de juegos y para ver muchas aplicaciones a la economía. Una vez que te sientas impresionado por el poder de la teoría de juegos, entonces debes leer el artículo de Jacob K. Goeree y Charles A. Holt “Ten Little Treasures of Game Theory and Ten Intuitive Contradictions”, de 2001. Este artículo pasa revista a 10 juegos muy simples en donde un pequeño cambio en un parámetro del juego que no afecta al equilibrio 25
Si quieres estar al día sobre el enfoque de la economía del comportamiento y la economía experimental, Alvin Roth tiene un apartado en su página web de la Universidad de Harvard donde puedes encontrar vínculos a importantes artículos que ejemplifican el debate. La dirección es la siguiente: http://kuznets.fas.havard.edu/~aroht/critiques%20of20experimental%20econ.html.
Economía y juegos
25
de Nash sí provoca un enorme cambio en el comportamiento de los individuos. Además, dichos cambios vienen predichos por el equilibrio de respuestas estocásticas (QRE). Finalmente, para saber más acerca de la revolución conductista en economía tienes dos libros muy recientes (ambos publicados en el año 2003). Advances in Behavioral Economics te ofrece una colección de los mejores artículos de la economía del comportamiento desde 1990, mientras que Behavioral Game Theory, escrito por uno de los máximos exponentes de este enfoque, Colin Camerer, pasa revista a los mayores logros de esta “rama” de la teoría de juegos.
Capítulo
2
La teoría de juegos y el lenguaje institucional Julia Barragán
1. Introducción Las instituciones que ha ido configurando el hombre a lo largo de su compleja historia cumplen un papel cuya relevancia no hace falta resaltar; para apreciar tal importancia en toda su magnitud, bastaría con imaginar un mundo sin instituciones, y ciertamente ese escenario aunque sólo sea planteado hipotéticamente resulta aterrador. Tanto las instituciones que regulan nuestras relaciones familiares, como las comerciales, y las que enmarcan nuestra vida en interrelación social constituyen los mecanismos que nos permiten separarnos de la barbarie expresada en el uso irrestricto de la fuerza. Sin embargo, este ejercicio de imaginar un mundo sin instituciones no es sencillo, ya que nuestra existencia está tan determinada por ellas que hasta para poder pensar en su desaparición tendríamos que situarnos en un marco institucional, aunque sólo sea cultural o lingüístico. Es que, tal como sucede con los recursos del mundo natural, estamos tan envueltos en ese medio propiamente humano llamado instituciones, que resulta imposible liberarnos de sus condicionamientos. Como en el caso de los recursos naturales, también las instituciones soportan nuestro maltrato y abuso; unas veces mediante decisiones que las condenan a muerte desde su nacimiento, en otras ocasiones ejerciendo actos deliberados de destrucción o aberración y muy frecuentemente erosionándolas hasta tornarlas en fantasmas utilizando el sutil mecanismo de las autoexcepciones1. Del mismo modo que no es tarea fácil imaginar un mundo sin instituciones, tampoco es demasiado simple someterlas a evaluación y mucho menos a crítica, ya que como dijimos ellas impregnan todo nuestro hacer y también condicionan nuestro modo de pensar, con lo que frecuentemente tanto la evaluación como la critica no llegan a cumplir con el importante papel que les corresponde; esto sucede en todos los casos, pero se hace especialmente perceptible cuando se trata de instituciones políticas. Por esta razón es muy importante contar con herramientas que ayuden a establecer criterios 1
Sobre este modo sutil de atacar las instituciones me permito sugerir la lectura de Barragán (2003).
27
28
Economía, sociedad y teoría de juegos
coherentes y sistemáticos para llevar adelante tales objetivos de evaluación y crítica; en esta actividad, que es básicamente normativa, la teoría de juegos ha realizado una importante contribución, dirigida principal (aunque no exclusivamente) a caracterizar inconsistencias lógicas en las soluciones institucionales, así como a constatar el modo en que tales inconsistencias se reflejan en el mundo empírico. El carácter sistemático de las contribuciones de la teoría de juegos ha hecho que en sus cortos años de existencia2 haya logrado acumular un conjunto conceptual e instrumental, especialmente valioso, dirigido a la evaluación y crítica de los arreglos institucionales en el campo político, como así también de gran utilidad en el análisis de las repercusiones sociales y conductuales de tales arreglos.
2. Un problema complejo que siempre ha despertado interés Las disonancias que produce la coordinación de comportamientos individuales dentro del marco colectivo constituyen uno de los problemas centrales y de mayor relevancia en las ciencias sociales y políticas, la economía y el derecho. Dichas disonancias han sido en diferentes épocas objeto de reflexión por parte de los estudiosos de la interacción humana, aunque hay que reconocer que estos estudiosos han coincidido mucho más en la descripción de la situación que en los conceptos explicativos o las soluciones propuestas. Esta recurrencia constituye en sí misma una prueba del interés del problema; y también evidencia que las dificultades que se presentan para armonizar las utilidades individuales con el bienestar colectivo no parecen tener una respuesta técnica inequívoca que pueda ser aceptada universalmente. En las diferentes épocas se ha considerado este dilema desde los ángulos conceptuales y técnicos propios de cada tiempo, lo cual ha dado lugar a cuerpos de supuestos y baterías de preguntas que han contribuido a ir perfeccionando la apreciación del problema; como es natural, las soluciones propuestas dependen también del aparato conceptual desde el cual se ha reconstruido el objeto de estudio. La traza histórica de este trabajo intelectual constituye un importante aporte a la compresión de un dilema que no permanece invariable en el tiempo, sino que ha ido cobrando complejidad y densidad a medida que se presentan nuevos escenarios de interacción que demandan decisiones colectivas; por esta razón, resulta de interés revisar algunos enfoques que muestran tanto la preocupación general que este tema convoca, como las diversas ópticas desde las cuales es posible establecer una lectura del mismo. En el siglo XVII, un autor de la importancia de Hobbes orientaba su atención hacia el tema considerando que el origen de las dificultades para construir acuerdos de interés colectivo entre actores individuales se debe a la existencia de un combate permanente entre los agentes sociales, combate que es animado por los sentimientos de competencia, desconfianza y afán de gloria que se encuentran presentes de manera inevitable en todos 2
Aunque fue desarrollada por von Neumann desde 1928, puede considerarse que la fecha oficial del nacimiento de la teoría de juegos coincide con la publicación en primera edición de la obra de von Neumann y Morgenstern (1944).
La teoría de juegos y el lenguaje institucional
29
los hombres. Estos sentimientos generan pugnas que dan lugar a constantes enfrentamientos, y a un estado de guerra generalizada que sólo puede ser controlado por un ente superior que logre articular esos sentimientos antagónicos en un organismo social3. Es evidente que el supuesto que atribuye al hombre determinados sentimientos corresponde al ámbito de la filosofía moral como lo es también la solución propuesta, la cual busca incorporar a un superactor cuya misión tiene el significado moral de ser correctora de aquellas perniciosas tendencias propias de la condición humana. Este camino nos lleva a considerar al superpoder como algo no sólo imprescindible sino intrínsecamente “bueno”, en la medida en que es el mecanismo para eliminar rasgos “malos” propios de los actores; es decir, no se lo presenta como una herramienta para resolver un dilema de coordinación entre actores en conflicto de intereses, sino como el corrector de un auténtico vicio social. Desde luego, la índole de la precondición establecida (perteneciente al plano moral) coloca la discusión en un terreno de base deontológica que no contribuye a caracterizar la verdadera índole del problema. Sin embargo, la salida propuesta por Hobbes (dejar en manos de un superpoder la solución del conflicto) va a marcar toda una línea en la historia de la eventual superación de los dilemas de decisión colectiva, y va a penetrar en el escenario político contemporáneo mucho más de lo que se hace explícito. Si buscamos un ejemplo de esta misma preocupación entre pensadores políticos del siglo XVIII, podemos ver que en el Papel Federalista No. 10, Madison expresa sus objeciones en relación con ciertos comportamientos de actores colectivos, a los que llama “facciones”, considerando que las mismas pueden conspirar negativamente sobre los derechos de otros actores y sobre el bienestar general 4. 3
Hobbes (1985: 185-186): “... in the nature of the man we find three principal causes of quarrel: first, competition; secondly, diffidence; thirdly, glory. The first makes men invade to gain, the second for safety and the third for reputation. [...] Hereby it is manifest that, during the time men live without a common power to keep them all in awe, they are in that condition which is called war, and such a war is of every man against every man”. [“...encontramos tres causas principales de riña en la naturaleza del hombre. Primero, competición; segundo, inseguridad; tercero, gloria. [...] Por ello es manifiesto que durante el tiempo en que los hombres viven sin un poder común que les obligue al respeto, están en aquella condición que se llama guerra; una guerra de todo hombre contra todo hombre”. Hobbes, Leviatán, Madrid, Editora Nacional, 1983, p. 223; traducción de Antonio Escohotado].
4
Véase Madison (Kramnick, ed., 1987 [1787]): “By faction I understand a number of citizens, whether amounting to a majority or a minority of the whole, who are united and actuated by some common impulse of passion, or of interest, ad versed to the rights of other citizens, or to the permanent and aggregated interests of the community. [...] There are... two methods of removing the causes of faction: the one, by destroying the liberty which is essential to its existence; the other, by giving to every citizen the same opinions, the same passions, and the same interests. It could never be more truly said than of the first remedy, that it is worse than the disease”. [“Entiendo por facción un número de ciudadanos, ya ascienda a una mayoría o a una minoría del total, que están unidos y actúan mediante algún impulso pasional o interés común contra los derechos de otros ciudadanos, o contra los intereses permanentes y agregados de la comunidad. [...]. Hay dos métodos de suprimir las causas de la facción: uno consiste en destruir la libertad que es esencial para su existencia; el otro consiste en otorgar a los ciudadanos la mismas opiniones, las mismas pasiones y los mismos intereses. El primer remedio, nunca mejor dicho, es peor que la enfermedad”].
30
Economía, sociedad y teoría de juegos
Madison constata dos hechos de enorme importancia para las decisiones colectivas; por una parte, que las pasiones e intereses de los actores sociales no tienen por qué ser idénticos, y por la otra, que tales pasiones e intereses de un individuo o grupo pueden entrar en conflicto entre sí y con los intereses colectivos. El enfoque de Madison está menos cargado de valoración deontológica que el de Hobbes, pero claramente apuesta por la necesidad y conveniencia de construir un espacio común de convivencia pública, donde tengan suficiente cabida todos los derechos. En lo que concierne a la solución del dilema que constata, sí hay un alejamiento neto de Hobbes; para Madison, la construcción de dicho espacio no puede quedar encomendada a un superagente, sino que debe hacerse efectiva mediante el ejercicio amplio de la libertad de cada individuo, sólo condicionada por los derechos de los demás individuos. Ya en el siglo XIX William Forster Lloyd (1833) va a mostrar un ángulo diferente y conceptualmente muy avanzado del dilema que emerge por las contradicciones entre el interés individual y el colectivo. Lo hará mediante una parábola que en el siglo XX será universalizada por Garrett Hardin (1968) en un trabajo publicado en Science en 1968 y que se ha convertido con buenas razones en un clásico sobre el tema. William Forster Lloyd presenta el llamado escenario de la tragedia de los predios comunes (the tragedy of the commons), el cual nos dibuja un campo de pastura cuyo uso es compartido por un grupo de pastores quienes tienen derecho a llevar allí su ganado para que se alimente. Desde el punto de vista individual, hay un incentivo para que cada pastor agregue más cabezas de ganado, pero llevado a la sobreexplotación el campo de pastura común inexorablemente desaparecerá. El carácter inexorable (trágico) de este proceso pone en clara evidencia que el ejercicio de la libertad individual guiada por los intereses particulares tiene un efecto tremendamente erosivo sobre el bienestar colectivo; es decir, que la racionalidad individual que invita al actor social a obtener el mejor resultado posible en cada escenario, produce al mismo tiempo una consecuencia perversa si se la juzga en términos del bienestar general. Tal como puede apreciarse, estos análisis de los dilemas de decisión colectiva evidencian el recurrente interés que el mismo ha despertado en diferentes etapas históricas, en contextos sociopolíticos plurales y en el marco de diversas tradiciones intelectuales. Desde luego, esta recurrencia en pensadores de tanta envergadura no podría ser atribuida al azar, y la misma más bien parece evidenciar que estamos frente a un tema central desde el punto de vista teórico, que adicionalmente en términos prácticos tiene una fuerte capacidad para afectar el desenvolvimiento de la vida colectiva.
3. Criterios para la evaluación de soluciones Si hacemos una lectura comparada de las inquietudes expresadas por los pensadores que hemos considerado, podemos caracterizar dos tipos de dificultades que parecen estar siempre presentes en las relaciones que se escenifican entre actores sociales. Por un lado se hace evidente que no es posible colocar en un mismo continuo todas las preferencias individuales y con ello obtener como solución técnica, una única preferencia colectiva que las exprese completamente. Por otro lado, la coordinación de comportamientos llevada a cabo por los actores individuales se va a mover siempre en el marco de alguna variedad de conflicto de intereses en el que estén en pugna las racionalidades individuales;
La teoría de juegos y el lenguaje institucional
31
la combinación de ambas características conduce a pobres resultados en términos de bienestar colectivo. Las dificultades señaladas sirven para poner de manifiesto que el bienestar de una sociedad es diferente del de cada individuo, y más aún, que esa diferencia no es cuantitativa, sino cualitativa. Esto, desde luego, tiene un efecto importante en los aspectos prácticos de la interacción social, dando lugar a numerosos dilemas de decisión. La presencia de estas dificultades ha estimulado diferentes frentes de trabajo desde las más diversas perspectivas intelectuales. Entre ellos, uno de los más fecundos es el de la teoría de juegos cuyas importantes contribuciones, si bien no se plasman en soluciones directas a algunos de los problemas en consideración, es indudable que han contribuido a una caracterización más clara del tema y a la exploración de caminos que eventualmente conducen a reinventar mejores aproximaciones a la superación de los dilemas. Así se ha podido caracterizar que el origen de la incapacidad de los individuos para construir espontáneamente un orden colectivo que produzca bienestar social no se debe a “vicios” inherentes a su condición humana, sino que más bien está asociado a la propia dinámica de la libertad humana (libre albedrío) y a la tendencia de los actores a buscar en todas las situaciones el máximo de beneficio para sí mismos (racionalidad). Asimismo, mediante el análisis de los métodos de transformación de las preferencias individuales en colectivas, la teoría de juegos ha contribuido a distinguir entre los mecanismos activados por los propios actores de manera directa, de los que requieren de la decisión de una autoridad, y de los que se apoyan en la mediación de las instituciones. Por el momento, dejaremos de lado los mecanismos que utilizan la mediación de las instituciones y nos centraremos en sendos trabajos seminales producidos por John Nash, por Keneth Arrow y por John Harsanyi respectivamente, los cuales no sólo constituyen contribuciones fundamentales al estudio de las dificultades inherentes a la elección colectiva y a la toma de decisiones sociales, sino que nos colocan frente al alcance y las limitaciones de las reglas de transformación activadas bien por los individuos o por la autoridad. El aporte de John Nash se basa en la clásica estructura de pagos del dilema de los prisioneros, pero en lugar de vedar toda comunicación entre los jugadores construye el concepto de rational self-interest que sirve de nutriente a la comunicación entre las partes llevada a cabo antes del juego, la cual permite establecer compromisos y eventualmente lleva a producir modificaciones en la matriz de pagos mediante procesos de negociación. Nash establece cuatro condiciones que son extremadamente razonables, dadas las cuales es posible demostrar que existe una única solución cuando se desarrollan procesos de negociación. Si expresamos los requisitos de Nash en lenguaje ordinario, es fácil apreciar que son altamente plausibles en cualquier escenario de negociación o arbitraje. 1º. Las utilidades deben ser medidas cardinalmente a fin de permitir las transformaciones lineales. 2º. Toda solución que mejore la condición de uno o ambos actores es preferible a otra que no modifique las utilidades (Pareto superior u óptimo). 3º. Los actores que tienen iguales utilidades al comienzo del proceso y papeles simétricos deben recibir iguales pagos de utilidad. 4º. Independencia de alternativas no relevantes. Este requisito permite que, si un juego comienza en posiciones asimétricas, la atención pueda centrarse en mejorar las condiciones y no en la corrección de las asimetrías.
32
Economía, sociedad y teoría de juegos
Establecidas estas condiciones, Nash enuncia el teorema que puede expresarse así: En espacios prospectivos convexos y limitados que incluyen sus límites, para un juego de negociación entre dos jugadores existe un único punto de solución que satisfaga los cuatro requisitos establecidos; es el punto donde se maximiza el producto de las diferencias de utilidad en relación con el punto de partida en desacuerdo5.
Independientemente de toda la polémica que se ha desarrollado alrededor de la solución de Nash, hay un hecho que es relevante en relación con el método de transformación de las preferencias individuales: Nash deja en manos de los propios jugadores los mecanismos para la búsqueda y la construcción de la solución; es decir que a pesar de que reconoce que los agentes sociales tienen intereses diferentes, y que se sitúan inicialmente en un punto de desacuerdo o conflicto, ellos son también portadores del potencial que les permite ir construyendo acuerdos que conduzcan a una solución, la cual exprese suficientemente bien las utilidades individuales y las colectivas. Además de dejar fijado un criterio para la evaluación de la calidad de los procesos de negociación, Nash muestra que la construcción de métodos de medición más finos (cardinales) puede ayudar a resolver situaciones que de otro modo resultan insolubles. En cuanto a la contribución de Arrow, no es menos importante; su preocupación está dirigida a preguntarse si es posible combinar las preferencias de los individuos de modo que se logre generar una única preferencia colectiva del grupo social al cual pertenecen estos individuos (función de bienestar colectivo). El llamado Teorema de imposibilidad de Arrow orienta su análisis hacia una paradoja que ya había llamado la atención de estudiosos de las Ciencias Políticas en el siglo XVIII, siendo especialmente conocido el planteamiento sobre el tema hecho por Condorcet. Conocida como la Paradoja de la votación o de la Democracia, en ella se expresa el hecho de que a pesar de que exista consistencia racional (transitividad) en las preferencias individuales, la misma no se trasmite de manera automática a las decisiones colectivas hechas por tales individuos. Esto hace que las preferencias de los individuos no conduzcan por sí mismas a definir una alternativa socialmente deseable; este hecho se presenta con independencia del sistema que sea utilizado para expresar las preferencias. Arrow establece las siguientes condiciones: 1. Para un número de alternativas igual o mayor que tres, la función de bienestar colectivo está definida para todos los ordenamientos individuales posibles. 2. Asociación positiva de los valores individuales y sociales. 3. Independencia de las alternativas no relevantes. 4. Soberanía de los ciudadanos. 5. Carácter no dictatorial de la decisión. Estas condiciones son a todas luces plausibles y no despiertan en principio grandes suspicacias; sin embargo, Arrow demuestra que no existe ninguna función de utilidad colectiva que satisfaga tales condiciones. En otras palabras no es posible dentro de ese marco (que podríamos llamar no dictatorial o democrático) lograr un mecanismo que trasforme los n-vectores de las preferencias individuales en un único vector de preferen5
John Harsanyi ha efectuado generalizaciones de estos resultados a juegos de n-jugadores en Harsanyi (1963).
La teoría de juegos y el lenguaje institucional
33
cias sociales. Siendo así las cosas, pareciera confirmarse la creencia de que la actividad de articular las utilidades individuales en utilidades colectivas es compleja, y desde luego escapa a lo que se denomina una respuesta técnica. Como puede notarse, mientras John Nash apuesta por un mecanismo de solución que puede ser manejado por los propios jugadores mediante procesos de intercambio, Kenneth Arrow considera imposible tener una regla de transformación sin una intervención externa (no democrática). Aquí convendría destacar que mientras el primero trabaja con medidas cardinales de preferencias que hacen posible los intercambios, el segundo lo hace con preferencias expresadas sólo ordinalmente que no los permiten. Ambos criterios de evaluación de soluciones muestran la importancia operacional que tiene el modo en que las preferencias son expresadas, y su influencia en el logro o no de las soluciones6. En la búsqueda de un criterio que permita la transformación de las preferencias individuales en una función de bienestar colectivo John Harsanyi considera la conveniencia de dotar a cierto sujeto con la capacidad de efectuar las combinatorias necesarias para llegar a la construcción de tal función. Para Harsanyi, este sujeto superdecisor tiene la obligación de tomar en cuenta todas las preferencias que pretende incluir en la función de bienestar colectivo; a modo de garantía de que esta operación será fair (insesgada) se postula el principio de equiprobabilidad de todas las preferencias individuales, de modo que ellas tendrán el mismo peso en la regla de transformación de las preferencias individuales en colectivas. El hecho irrefutable de que no pueden ser ponderados de igual manera el interés por la preservación de la vida y el deseo de dañarla cruelmente o eliminarla lleva a Harsanyi a introducir ciertos matices al principio de equiprobabilidad que en algunos casos llega a ser sustituido. Estos son los casos de las preferencias heteroorientadas y el de las preferencias desinformadas. En las primeras las utilidades del sujeto no se derivan de la satisfacción de sus propias preferencias, sino de sentimientos irracionales de simpatía o antipatía hacia otros; mientras que las preferencias desinformadas que también serían eliminadas por el superdecisor de Harsanyi corresponden a ciertos actores que no pueden construir adecuadamente su función de utilidades por ignorar algunos aspectos fundamentales de la realidad7. Es evidente que la eliminación de estas preferencias no obedece a razones técnicas que puedan ser universalmente aceptadas, sino que quedan en manos del superdecisor, lo cual entraña un riesgo considerable para el carácter fair que se supone debe ser el rasgo medular de la regla de transformación. Harsanyi considera que en términos prácticos este es un riesgo menor, ya que según él, en los puntos fundamentales, la gran mayoría de los sujetos racionales estarían de acuerdo. Sin embargo, cada vez se hace más evidente que la 6
Recientemente se ha producido un conflicto entre Uruguay y Argentina con motivo de la instalación de una papelera en la costa uruguaya del río Uruguay. Tal parece que los ambientalistas argentinos se oponen a dicha instalación para preservar las aguas del río. Hasta el momento las preferencias han sido expresadas en términos ordinales, con lo cual no ha logrado producir ningún avance en la situación de conflicto, y antes bien, el escenario se deteriora día a día. Es evidente, que si los daños y los beneficios se cuantificaran cardinalmente, sería posible avanzar negociaciones rumbo a una solución.
7
Es el caso de quien se niega a ser vacunado porque ignora el poder inmunológico de las vacunas, las cuales quedan completamente ausentes de su función de utilidad.
34
Economía, sociedad y teoría de juegos
definición de racionalidad no tiene carácter universal, y en consecuencia existen aspectos sustanciales acerca de los cuales no es posible lograr un acuerdo, especialmente cuando se trata de asuntos vinculados al mundo de las creencias, de los patrones culturales y los derivados de las identidades. En términos generales cuando un decisor está inmerso en una determinada cultura utiliza de manera natural un universo simbólico y le resulta difícil pensar en utilizar un lenguaje diferente a aquél que le ofrece no sólo un medio de comunicación, sino también el marco de determinación de su manera de ver las cosas 8. Por lo que hemos podido apreciar, el problema de definir un método de transformación de las preferencias individuales en preferencias colectivas constituye un tema que no ha logrado una respuesta inequívoca. Los tres autores cuyos análisis hemos considerado, tres Premios Nobel en economía9, difieren en sus soluciones. Mientras que Nash apuesta por los mecanismos de negociación para efectuar esta transformación, Arrow nos hace notar la imposibilidad de conseguir tal regla de decisión a través de métodos democráticos, y Harsanyi define dicha regla como aditiva de preferencias individuales equiprobables, dejando su aplicación en manos de un decisor de nivel superior. A pesar de la ausencia de una solución técnica que sea aceptada por todos, la consideración del problema en el marco de la teoría de juegos nos permite avanzar en una crítica más detallada de las inconsistencias lógicas de algunas soluciones, al tiempo que hace posible evaluar sistemáticamente las interacciones empíricas sobre la materia.
4. Las instituciones como mecanismo de transformación de las preferencias individuales en colectivas Tal como hemos visto, la armonización de las utilidades de los individuos para producir una función de bienestar colectivo es un proceso lleno de dificultades; éstas derivan por una parte del clima de incertidumbre que gobierna las relaciones interpersonales, hecho que contribuye a que la desconfianza surja en dichas relaciones, empujando el proceso a resultados socialmente subóptimos. Por otra parte pareciera que no existe una regla de transformación que permita hablar de una respuesta técnica aplicable a todos los casos, lo cual adiciona un nuevo factor de incertidumbre; la presencia de estas condiciones produce un importante incremento en los costos de las transacciones sociales y, adicionalmente, un sensible costo social. 8
Cada vez es mayor el número de autores que acepta que la relación entre autonomía del sujeto y la pertenencia a una identidad cultural es muy intensa e indisoluble. La propia naturaleza de tal relación hace que no resulte sencillo para quienes participan de una determinada identidad comprender las restricciones de perspectiva que ella les incorpora. No es entonces extraño que desde una cierta arista cultural se minimicen las posibilidades de que alguien no llegue a comprender el significado de un asunto determinado. En relación con este tema, que tiene una crucial importancia para la construcción de un espacio público, puede consultarse Kymlicka (2001).
9
Kenneth Arrow fue laureado con el Premio Nobel en 1972, mientras que John Nash y John Harsanyi lo fueron en 1994.
La teoría de juegos y el lenguaje institucional
35
En la búsqueda por resolver tales onerosas dificultades nacen los arreglos institucionales, que se originan en acuerdos iniciales que establecen cuerpos de restricciones básicas tendentes a regular las interrelaciones sociales. Desde este punto de vista, las instituciones tienen su razón de ser en la necesidad de crear escenarios en los que la incertidumbre (tanto la derivada de las reglas como de los comportamientos de los actores) sea minimizada; esto contribuiría a disminuir la probabilidad de fricciones en las relaciones interpersonales, bajando de este modo el costo, tanto social como individual de las transacciones entre los sujetos. La dinámica del razonamiento es simple: si las instituciones son capaces de producir reglas de juego formuladas con claridad, y mecanismos de acceso a la información que permitan disminuir la incertidumbre, surgirán escenarios en los que los desgastes producidos por las fricciones serán mínimos, y los costos de las transacciones interpersonales bajos, con lo que aumentarán simultáneamente las utilidades individuales y las colectivas10. Como existe una coincidencia general acerca de las razones por las que los hombres generan y utilizan instituciones, tenemos que aceptar que una institución puede ser considerada eficaz cuando a través de un diseño apropiado logra disminuir la incertidumbre originada en las reglas, y mediante un sistema de incentivos controla la incertidumbre derivada de las interacciones. Sin embargo, los mecanismo para validar la eficacia son diferentes cuando el origen de la institución está localizado en una traza cultural, o si por el contrario ella es el resultado de un acto de voluntad normativa. En el caso de las primeras, se observa que las mismas no nacen en una fecha específica, sino que van asentándose paulatinamente como consecuencia de los llamados usos sociales, cuyas facetas negativas tienden a ser corregidas gradualmente en lo que podríamos llamar un proceso ecológico. Este proceso va sometiendo a prueba la calidad de cada respuesta institucional, y al mismo tiempo permite el reemplazo de instituciones ineficientes por otras que logren un mejor desempeño frente a los problemas de fricciones interpersonales. Estas instituciones prueban normalmente su eficacia en el terreno de la práctica social, y se transforman, y aun desaparecen, en la medida en que no cumplen con su cometido de hacer más fáciles las transacciones entre los individuos de un colectivo determinado. En este sentido decimos que existe un “método ecológico” de validación de la eficacia que se encuentra ligado al modo en que las instituciones sociales o culturales nacen y se desenvuelven. En el caso de las instituciones derivadas de actos de voluntad normativa, ellas carecen de ese recurso natural de validación de la eficacia, por lo que es necesario diseñar métodos tanto para lograr los arreglos iniciales más adecuados y estables, como para hacer que tales instituciones cumplan eficazmente su cometido; estos métodos deberían facilitar tanto los análisis teóricos rigurosos como los seguimientos empíricos sistemáticos. En lo relativo al logro de acuerdos iniciales, capaces de producir reglas para facilitar que las utilidades individuales sean armonizadas con las colectivas, el método de negociación de Nash (generalizado por Harsanyi para n-jugadores) ya expuesto brevemente constituye un mecanismo eficiente, que permite guiar la búsqueda de una solución mediante procesos de intercambio que van ampliando el espacio de soluciones factibles. Una vez acordado este cuerpo de restricciones institucionales parece natural 10
Acerca de este punto puede verse Coase (1960).
36
Economía, sociedad y teoría de juegos
que el desenvolvimiento de las interacciones que se produzcan en ese marco resulte social e individualmente satisfactorio. No obstante, hay que tener en cuenta que quienes desarrollan las negociaciones y llegan a los acuerdos que constituyen la base de las instituciones no son sino un subconjunto de los miembros de la sociedad; sin embargo, las soluciones a las que llegan adquieren un carácter normativo para todo el conjunto del cuerpo social. Esta estratificación genera la existencia de un plano de actores supraordinados (quienes participan de la formación de los acuerdos institucionales) y los subordinados que deben aceptarlos como marco necesario de sus interacciones; el hecho de que quienes efectúan los arreglos institucionales hayan sido elegidos como representantes de todo el universo de actores sociales no suele ser suficiente para resolver este problema de “extrañamiento”, ya que la representación formal no siempre equivale a una auténtica representación de los intereses. Este hecho ha dado lugar a uno de los temas cuyo tratamiento y análisis ha despertado una gran atención en el campo de las decisiones públicas: el de encontrar una justificación suficiente para el asunto de “por qué los sujetos deben obedecer los arreglos institucionales que han sido acordados”. Desde luego que este tema posee una rica textura conceptual; pero adicionalmente los hechos a los que concierne tienen un poderoso efecto práctico sobre la fortaleza del tejido social. En efecto, cuando los sujetos subordinados no encuentran las razones suficientes y consistentes que justifiquen la aceptación de los arreglos institucionales se puede llegar a diversas formas de desconocimiento generalizado de las instituciones, lo cual por una parte afecta el bienestar colectivo y por la otra perjudica la sustentabilidad de los bienes comunes y públicos11. Esta capacidad de desconocer los arreglos institucionales es inherente al hombre que como sujeto racional y autónomo puede libremente optar entre obedecer o desobedecer los acuerdos, y si no encuentra razones suficientes para actuar en el marco de dichos arreglos institucionales puede seguir el camino del no acatamiento. Si tal conducta se generaliza se produce un efecto negativo sobre las instituciones que dejan de ser un mecanismo eficiente de articulación de lo individual en lo colectivo. Las conductas de desconocimiento de los acuerdos institucionales a veces son evidentemente transgresoras, pero en otros momentos se presentan bajo la forma de pequeñas autoexcepciones o complicidades colectivas que actúan de un modo sutil. En estos últimos casos, por lo general, no despiertan fuertes sentimientos de rechazo, ya que no existe una clara conciencia de su carácter destructivo del bienestar colectivo; estas consecuencias erosivas suelen hacerse evidentes sólo cuando los efectos acumulados toman una forma manifiesta, y muchas veces ya son irreversibles12. Los resultados socialmente indeseables que producen los comportamientos generalizados de desobediencia de los acuerdos institucionales muestran que, más allá del indiscutible interés teórico que posee el tema de las razones por las cuales tales decisiones deben ser obedecidas, su relevancia práctica es tal, que puede llegar a incidir sobre la vida 11
El efecto demoledor que los comportamientos generalizados de desconocimiento de los arreglos institucionales produce sobre los bienes comunes ha sido expuesto de manera muy explícita por Hardin en la obra ya citada, mientras que el efecto de dichos comportamientos sobre los bienes públicos ha sido presentado por Barragán (2003), ya citado.
12
Casos de la historia reciente de países como Argentina y Venezuela constituyen ejemplos concretos de las situaciones que fueron modeladas por Hardin y Barragán.
La teoría de juegos y el lenguaje institucional
37
misma de la sociedad. El modelo del dilema de los prisioneros jugado por n personas pone en clara evidencia el efecto que sobre el tejido social producen las conductas de incumplimiento generalizado de las restricciones institucionales13, y que los mecanismos tradicionales establecidos por las formas democráticas de gobierno no han sido por sí mismos suficientes para evitar estos resultados, como tampoco han sido completamente eficaces los diseños de instituciones basados en sanciones14. A pesar de que la decisión de no respetar los acuerdos institucionales se expresa en una amplia gama de comportamientos, todas estas conductas tienen un patrón común, y representan una opción estratégica que puede ser analizada en el marco de la estructura lógica conocida como el dilema del prisionero 15. Esta estructura se expresa en una matriz que muestra las utilidades que cada uno de los actores logra si decide cumplir o no cumplir con lo acordado en los arreglos institucionales, bajo los supuestos de que la otra parte cumpla o no cumpla. Tabla 2.1
ACTOR B
ACTOR A NO CUMPLE
SÍ CUMPLE
NO CUMPLE
2,2
10,0
SÍ CUMPLE
0,10
8,8
Desde el punto de vista formal, el dilema del prisionero define una red de relaciones y establece una serie de condiciones relativas a los jugadores y la estructura de pagos. El marco de estas restricciones muestra que el dilema del prisionero es un dilema lógico. • La primera condición establece el supuesto de que los actores son racionales; es decir, que procuran maximizar sus utilidades esperadas. 13
El modelo del dilema de los prisioneros muestra cómo bajo ciertas restricciones y con una estructura de pagos determinada, los comportamientos racionales irrestrictos llevan el juego a un resultado social no óptimo. Aunque el modelo ha sido elaborado inicialmente con dos jugadores, cuando se lo expande a n jugadores, los mencionados resultados indeseables también se expanden y llegan a cubrir todo el espacio social.
14
Probablemente uno de los aspectos en los que se hace más visible esta ineficacia y alto costo de transacción es el de la corrupción en las altas esferas, cuyos efectos tanto en el terreno material como en el de la moral pública constituyen la más seria amenaza que pesa sobre la estabilidad de los sistemas democráticos. La capacidad para hacer mínima la probabilidad de recibir una sanción que poseen quienes detentan el poder político representa hoy por hoy uno de los mayores desafíos a los expertos en el diseño de incentivos.
15
Este dilema fue formulado originalmente por Merrill Flood y Melvin Dresher, de la Rand Corporation, y más tarde fue formalizado por Albert Tucker; el mismo muestra el panorama de dos prisioneros que son entrevistados separadamente por un fiscal, quien les propone un acuerdo que queda reflejado en una matriz de utilidades con una estructura semejante a la que presentamos, y restringido por las condiciones que se expresan en nuestro texto.
38
Economía, sociedad y teoría de juegos
• La segunda condición se refiere a la estructura de pagos, según la cual las utilidades de las casillas se ordenan del siguiente modo para cada jugador: (no-sí) > (sí-sí) > (no-no) > (sí-no) Esta condición hace que la mejor situación posible para un jugador sea la de no respetar los arreglos institucionales mientras las otras partes si los respetan. • La tercera condición se refiere a que los acuerdos no pueden ser reforzados por ningún medio diferente al juego mismo. Esta condición expresa la autonomía intelectual de cada actor para conocer, evaluar y seleccionar la mejor estrategia, así como también la autonomía de su voluntad para dirigir su acción en un determinado sentido. Si analizamos la plausibilidad de estas condiciones podemos afirmar que no parecen contradecir lo que puede considerarse razonable en un escenario en el que aun habiéndose logrado un acuerdo acerca del marco institucional, se mantiene la posibilidad de cumplirlo o no cumplirlo. Por estas razones, el modelo del dilema del prisionero resulta altamente plausible en estos escenarios. Bajo las restricciones establecidas en el modelo, la estrategia dominante de cada jugador es la de “no cumplir”, en la esperanza de que la otra parte sí cumpla (pero aceptando que el resultado no es del todo malo, aún si el otro no cumple), y evitando así ser la víctima en la casilla (sí-no) cuyo pago es sólo 0. Sin embargo, cuando esta estrategia dominante es seguida por los dos jugadores, ambos convergen a la casilla (no-no) que es ineficiente. Por esta razón suele decirse que en el marco del dilema del prisionero el jugar racionalmente desde el punto de vista individual conduce a resultados irracionales (más estrictamente subóptimos) desde el punto de vista colectivo. Tratando de lograr una solución al dilema, algunos autores han intentado relajar el concepto de racionalidad (primera condición), mientras que otros consideran que la única solución sería la de modificar el sistema de pagos (segunda condición)16 . Naturalmente que no podemos dejar de señalar la aproximación de Nash, que relajando la tercera condición de incomunicación demuestra la existencia de una solución fair. Es indudable que, si se mantienen constantes las condiciones previamente aceptadas para el dilema del prisionero, las cuales se refieren a la racionalidad maximizadora de los jugadores, a la no comunicación y a la estructura de pagos según la relación (no-sí) > (sí-sí) > (no-no) > (sí-no), no habría modo de eludir el dilema; y si por el contrario tales condiciones son alteradas, el dilema en realidad no sería eludido, sino que habría dejado de existir. Por esta razón los intentos de escapar del dilema se han visto sistemáticamente frustrados, aunque hay quienes sostienen que han alcanzado alguna forma de éxito; pero en realidad, en estos casos exitosos lo que se ha hecho es construir otra estructura formal alternativa a la del dilema del prisionero. Esto obligaría a quienes deseen postular tal estructura formal alternativa a defender su plausibilidad, y demostrar en esta arena la superioridad de la nueva estructura. Sobre este punto, Harsanyi (1976) nos provee de una óptica especialmente lúcida y portadora de una gran fecundidad; si uno supone un mundo en el que los jugadores son especialmente decentes, a quienes el no cumplir con 16
En la primera vía de acceso al problema (modificación del concepto de racionalidad) se encuentran los ya clásicos enfoques desarrollados por Howard (1971), Nozick (1969) o Gauthier (1986), entre otros. En la segunda vía de acceso (modificación de la estructura de pagos) se alinean los también clásicos trabajos de Hoerster (1975) y Harsanyi (1976).
La teoría de juegos y el lenguaje institucional
39
lo acordado les produce un desagrado tal que lo consideran una desutilidad mensurable, automáticamente esto modificaría la estructura de pagos de la matriz. Si, por ejemplo, el actor evalúa la inconveniencia de no cumplir con los acuerdos en 3 unidades (utils), la utilidad neta que le produciría la casilla (no-sí) quedaría reducida a 7, lo cual lo empujaría a escoger la estrategia (sí). Pero entonces tendríamos que aceptar que estamos incorporando un supuesto adicional acerca de cómo es este nuevo mundo (otro juego), lo cual involucra el compromiso intelectual y práctico de someter a escrutinio la plausibilidad del nuevo supuesto. Pero, aunque sólo tomemos la consideración de Harsanyi como una hipótesis, ella nos ayuda a descubrir que cuando se logra un buen arreglo institucional sólo hemos comenzado a recorrer un largo y complejo camino rumbo a la construcción de una cultura institucional.
5. Las instituciones son algo más que un buen arreglo La solución de Nash que ya fue analizada, nos muestra a los actores ubicados en un escenario en el que están en condiciones de intercambiar de manera autónoma sus utilidades con el propósito de obtener un arreglo que sea aceptable para todos; este escenario de negociación es un juego que consta de sucesivas interacciones enmarcadas en un sistema de reglas cuyo propósito es ir ampliando el espacio de posibles soluciones. Este proceso de negociaciones muy bien puede ser considerado como un mecanismo adecuado para producir acuerdos institucionales que las partes consideren obligatorios para sus futuras interacciones. Sin embargo, para que dicho mecanismo se convierta en un autentico método de conversión de las utilidades individuales en utilidades colectivas es adicionalmente necesario generar un clima general de confianza recíproca y de confianza en el carácter fair del propio mecanismo; en caso contrario, por las razones que hemos analizado, aunque se logren los acuerdos institucionales, la probabilidad de encontrarnos en un escenario de dilema de los prisioneros es alta. En otras palabras, es necesario contar con aquel actor “decente” al que alude Harsanyi, el cual internamente aplica una tasa de descuento a las utilidades individuales que pueda lograr mediante el no acatamiento de los acuerdos institucionales; esto sólo se produce cuando los actores sociales han hecho propias las restricciones derivadas de esos acuerdos. El proceso de construcción y consolidación de un agente de tales características no sólo depende de arreglos institucionales que establezcan sistemas adecuados de incentivos, sino también de la capacidad de las instituciones para generar una acertada cultura institucional. En esta nueva dimensión las instituciones no sólo deben ser un factor de conversión de utilidades, sino también una instancia mediadora en la generación del clima de confianza colectiva necesario para evitar la recurrencia de los escenarios que hacen imposible la cooperación o la coordinación entre actores con intereses individuales en conflicto. Algunos autores consideran que la confianza colectiva es el resultado de la confianza individual, o al menos que una dosis de confianza individual es imprescindible para la generación de la confianza colectiva; sin embargo, si se analizan cuidadosamente sus
40
Economía, sociedad y teoría de juegos
propuestas, se puede advertir que muy difícilmente se genera un espacio estable de confianza colectiva sin la existencia previa de un marco institucional implícito que le sirva de respaldo17. Sin la menor duda es muy necesario construir diseños que contengan sistemas de incentivos dirigidos a estimular el respeto por los acuerdos institucionales; tales diseños pueden contribuir en buena medida a controlar los comportamientos de los actores. Sin embargo, dicho control será siempre externo, ya que se basa en un cálculo de utilidades que incluye los incentivos (positivos y negativos) como parte de la matriz de pagos; no es para nada infrecuente que los sistemas de incentivos tengan que ser reiteradamente reforzados con importantes costos sociales derivados del control y del propio proceso de reforzamiento. Por esta razón, en el campo de la teoría de juegos se han explorado modelos que permiten caracterizar las condiciones que harían posible la construcción de una cultura institucional en la que se hayan instalado de manera estable lo que Harsanyi denominó actores “decentes”; es decir, aquéllos que incluyen en sus cálculos de manera espontánea las desutilidades individuales implicadas en las conductas que no respetan los acuerdos institucionales. La característica de estos enfoques es que no se dirigen sólo a producir cambios en el nivel de la confianza individual, que evidentemente en los hechos corre grandes riesgos de ser traicionada, sino a generar un auténtico cambio en la cultura institucional. A fin de analizar este tema es bueno destacar que en las sociedades contemporáneas complejas la actividad de construir los acuerdos institucionales está siempre a cargo de pequeños grupos que en el caso de las democracias están investidos del carácter de representantes de la voluntad del colectivo. Por lo general, estos grupos desarrollan procesos que se ajustan al esquema de negociación de Nash generalizado por Harsanyi, en los que básicamente mediante intercambios de utilidades se procura avanzar hacia la solución, que en este caso es el logro del acuerdo institucional. Visto de esta manera el propio proceso contiene una serie de caracteres de importancia para lo que hemos llamado la construcción de una cultura institucional. En primer lugar, los actores que llevan adelante los procesos de negociación son sólo un subconjunto del universo de aquéllos a quienes estará dirigido el arreglo institucional; en segundo lugar, dicho arreglo, una vez consolidado posee un carácter normativo de las relaciones interpersonales para todo el universo de actores sociales al que concierne; finalmente, quienes asumen la actividad negociadora que conduce al arreglo institucional actúan como autoridad normativa, tanto por la delegación que reciben del resto de los actores como por la índole de la solución a la que arriban. Tal como ya hemos señalado, aunque los acuerdos hayan sido elaborados por los propios actores, éstos pueden tener la tentación de irrespetarlos, ya que el irrespeto les produce sin duda mayores utilidades en el nivel individual. Esta situación se hace más probable cuando los arreglos institucionales fueron acordados por terceros, aun cuando éstos hayan sido investidos legítimamente de representatividad. Son muchos los factores 17
Uno de los trabajos más meticulosos sobre la posibilidad de generar un ambiente estable de confianza colectiva producido en el terreno de la teoría de juegos es el de Axelrod (1984) y el más reciente Axelrod (1997). Un recuento de aportes relacionados con el tema se encuentra en Braithwaite y Levy (1998).
La teoría de juegos y el lenguaje institucional
41
que favorecen esta situación de desaliento hacia el arreglo institucional; pero los más frecuentes son la disconformidad basada en que los actores consideran que sus utilidades no han sido suficientemente defendidas en los procesos de negociación, o en la existencia de un conflicto de intereses oculto con quien ejerció su representación18. Sin la menor duda estas razones no pueden ser desdeñadas como causa para acciones de desconocimiento de los arreglos logrados. La formalización del concepto de common knowledge llevada a cabo por Aumann y axiomatizada por Milgrom nos ha dotado de una importante herramienta para comprender y guiar los procesos de decisiones interactivas 19. Sobre esta base conceptual, en un trabajo anterior he analizado la posibilidad de expandir la cobertura del common knowledge como mecanismo de construcción de cultura institucional (Barragán, 2003). El common knowledge se da cuando todos los jugadores conocen previamente todos los a-priori y a-posteriori del juego, y adicionalmente cada uno de ellos sabe que el otro los conoce 20. Es razonable pensar que los negociadores de un arreglo institucional tienen una probabilidad alta de llegar a construir un escenario de common knowledge, ya que parte del trabajo de negociación consiste en informarse acerca de todos los a-priori y a-posteriori, que son los que permiten calcular los equilibrios y las soluciones 21. Ahora bien, si los destinatarios de los arreglos institucionales no comparten ese conocimiento, por una parte harán un cálculo erróneo de los equilibrios, no tendrán ningún elemento corrector de tales cálculos y finalmente tenderán a considerar arbitrarias o interesadas las selecciones realizadas por el decisor normativo; sin duda, ésta es una vía de acceso fácil a la autojustificación del no acatamiento de los arreglos acordados. Es posible argumentar que esta situación puede ser corregida mediante un adecuado sistema de controles y sanciones que desestimulen los comportamientos de no acatamiento y hagan que las conductas individuales converjan al acatamiento. Sin embargo, esta solución además de producir altos costos de transacción, resulta siempre inestable. Si lo que deseamos es la estabilidad de la aceptación de los arreglos institucionales, parece evidente que es necesario que los destinatarios de las instituciones puedan compartir 18
Recientemente, después de un largo proceso de negociación, han sido firmados los acuerdos del ALCA (Área de Libre Comercio de las Américas) entre Estados Unidos y Colombia. A juzgar por las declaraciones hechas públicas, el sector textil colombiano considera que sus intereses han sido bien representados, mientras que los arroceros opinan lo contrario. Con el fin de aceptar internamente el acuerdo, el Representante de los Arroceros se preguntaba a cambio de qué había sido entregado el arroz en la negociación. Es natural que si, no encuentra una respuesta que le satisfaga, su relación con el acuerdo será del todo externa.
19
La formalización del common knowledge fue realizada por Aumann (1976). La axiomatización se debe a Milgrom (1981).
20
“When we say that an event is ‘common knowledge’, we mean more than just the both 1 and 2 know it; we require also that 1 knows that 2 knows it, 2 knows that 1 knows it, 1 knows that 2 knows that 1 knows it, and so on” (Aumann, 1976: 1236). [“Cuando decimos que un acontecimiento es de ‘conocimiento común’, no queremos decir sólo que tanto 1 como 2 lo conocen; exigimos también que 1 sepa que 2 lo conoce y que 2 sepa que 1 lo conoce, que 1 sepa que 2 sabe que 1 lo conoce y así sucesivamente”].
21
En una revisión de este trabajo efectuada con el Profesor Jaime Barcón, me hacía notar el papel crucial que ha desempeñado el common knowledge en el logro de la llamada Gran Coalición que actualmente gobierna Alemania.
42
Economía, sociedad y teoría de juegos
el common knowledge que hizo posible los acuerdos; pero, ¿cuál sería el mecanismo para que quienes han delegado la construcción del arreglo en una autoridad normativa pasen a ser usuarios del common knowledge que dio origen en tal arreglo, y que a su vez constituye el lenguaje del arreglo institucional? La teoría de juegos también ha efectuado importantes contribuciones para la compresión de este punto, las cuales llegan a través del concepto de “eventos públicos”, debido a Milgrom; tales eventos son la base para que todos los actores de un juego conozcan los a-priori y los a-posteriori. En el escenario de la construcción de arreglos institucionales quien está en las mejores condiciones para producir eventos públicos es la autoridad normativa en razón de su propia condición de actor del proceso negociador, y a raíz del carácter inevitablemente público de sus acciones; de allí surge la importancia de la autoridad normativa como trasmisor de información tanto expresa como implícita. La información expresa concierne principalmente a las situaciones de hecho que permiten a los jugadores conocer los a priori y a-posteriori del juego y con ello estar en condiciones de producir la asignación de probabilidades a los escenarios y a las soluciones; también es una información expresa aquélla que permite a los usuarios conocer los mecanismos aptos para llevar adelante tales asignaciones. Sin embargo, cuando un arreglo institucional se hace propio, y con ello se aleja la probabilidad de desconocerlo es porque también se ha llevado adelante un proceso basado en percepciones complejas acerca del valor, la eficacia y el carácter fair de tal arreglo. Si la autoridad normativa, además de producir una solución llamada “arreglo institucional” es la primera en aceptar la vocación de corrección normativa de dicha solución, y mediante su conducta trasmite este mensaje implícito, habrá producido un evento publico que echa a andar el proceso de construcción de common knowledge no ya entre los negociadores del acuerdo, sino entre la institución y sus destinatarios. Desde luego éste es un excelente marco para que la institución sirva como transformador de los intereses individuales en colectivos. Ahora bien, el common knowledge es una suerte de lenguaje, y como tal su aprendizaje sólo se hace efectivo mediante el uso; por eso para que tal lenguaje sea compartido e internalizado por los destinatarios de las instituciones no es suficiente con que el decisor normativo produzca el hecho público consistente en la información expresa y la trasmisión implícita. Para lograr tal propósito resulta necesario que en las interacciones que se llevan a cabo dentro del marco institucional de nuevo todos los jugadores (o una gran mayoría) se involucren en el desarrollo y afianzamiento de las reglas de ese lenguaje. Tal como sucede con todos los lenguajes, el propio uso del mismo es factor de desarrollo y reforzamiento de sus reglas, puesto que éstas, a diferencias de otras reglas de juego, son “reglas en formación” o “reglas en desarrollo”22; este hecho nos lleva a pensar que el lenguaje utilizado para lograr los arreglos institucionales no puede quedar aislado del que luego se emplee dentro del marco institucional. No podemos tener en el nivel de la construcción de los arreglos un lenguaje complejo y sutil como lo es el del intercambio de utilidades, para luego en el nivel de los destinatarios despojarlo de esas sofisticadas cualidades reduciéndolo a las opciones bivalentes de obedecer o no. 22
Para una exposición analítica sobre los diferentes tipos de reglas y normas, puede verse el Capítulo 1 de von Wright (1970).
La teoría de juegos y el lenguaje institucional
43
Una respuesta muy interesante que la teoría de juegos ha dado para orientar la búsqueda de continuidad del lenguaje más allá de los procesos que conducen al acuerdo es la desarrollada por los denominados modelos de “acuerdos laxos”, los cuales han sido analizados de manera detallada en la literatura reciente, tanto desde el punto de vista teórico como de sus eventuales aplicaciones experimentales (Maskin y Tirole, 1999; Hart y Moore, 1999; Ben-Shahar, 2004). Como el concepto de laxitud puede llamar a algunos equívocos, es útil señalar de manera general en qué consisten los llamados “acuerdos laxos”. Desde un punto de vista técnico un arreglo institucional está formado por n-pares ordenados o n-soluciones; cada par o solución constituye la culminación de un proceso de negociación que han desarrollado los actores normativos sobre un tema específico. En virtud del carácter supraordinado de los negociadores, el grupo de soluciones toma finalmente el carácter de un cuerpo de restricciones a los comportamientos individuales, el cual busca armonizar el interés de cada sujeto con el bienestar colectivo. Si lo consideramos de esta manera, todo arreglo institucional constituye un “cierre”, en cierta forma arbitrario, de los temas que van a formar parte de dicho arreglo; expresado en otros términos, todo arreglo institucional es necesariamente “incompleto”, ya que sólo puede definir un conjunto de acuerdos que no son de momento renegociables, mientras queda abierto un infinito número de temas que pueden ser objeto de ulteriores negociaciones dentro del mismo marco. Este carácter necesariamente incompleto de los arreglos institucionales obedece a dos tipos de factores, los exógenos y los endógenos. El primer grupo de factores deriva de la imposibilidad material que tienen los negociadores de conocer todos los estados de cosas, los nuevos descubrimientos científicos, las necesidades sociales emergentes, etc. tanto presentes como futuras; en este sentido, ningún arreglo institucional podría ser perfectamente completo. Pero asimismo podría suceder que los propios negociadores incorporen por alguna razón al arreglo institucional de manera deliberada diversos grados de flexibilidad, que permitan y hasta estimulen el desarrollo de acuerdos ulteriores (véase Hart y Moore, 2004). Vistos de esta manera los arreglos institucionales no tienen por qué ser acuerdos que una vez cerrados por las autoridades normativas sólo ofrezcan a los usuarios la posibilidad dicotómica de aceptarlos o rechazarlos, sino que más bien pasarían a constituir la solución necesaria para la construcción de nuevas soluciones; un arreglo institucional de este nuevo tipo debería tener un núcleo sólido y polivalente como para que no sea necesario renegociarlo, sino excepcionalmente, y al mismo tiempo debería ser suficientemente flexible a fin de permitir sucesivos acuerdos que amplíen el espacio con nuevas soluciones acerca de asuntos contingentes. En este sentido los arreglos institucionales fijarían los acuerdos necesarios para estar en condiciones de acordar más tarde. Bajo este nuevo esquema, es posible concebir una continuidad en el common knowledge, que a pesar de estar originado en los eventos públicos producidos por la autoridad normativa es capaz de generar recursivamente nueva información sobre los a-priori y a-posteriori del juego, es decir, que se desarrolla como lenguaje, reforzándose permanentemente a sí mismo (Scott, 2003). Este lenguaje se apoyaría en dos aspectos; por una parte en el hecho de compartir todos los a priori y a-posteriori del juego, y por la otra en el compartir la creencia en su vocación de corrección normativa; el primer aspecto hace posible que todos los jugadores estén en condiciones de efectuar la asignación de probabilidades en el marco del juego social y el segundo aspecto permite poseer la suficiente claridad moral para identificar aquellos usos que afianzan el lenguaje y aquéllos que lo deterioran.
44
Economía, sociedad y teoría de juegos
6. Conclusión A lo largo de la historia del pensamiento filosófico y ético-político el tema de cómo articular los intereses individuales y el bienestar colectivo ha despertado siempre un profundo interés, y ha sido objeto de estudio desde diferentes perspectivas. Las exploraciones efectuadas en diversas épocas y en el marco de muy variadas tradiciones intelectuales han demostrado que no sólo existen grandes dificultades para lograr soluciones estables que logren una aceptación más o menos amplia, sino que también es muy difícil establecer criterios para la evaluación y crítica de tales soluciones. Esto desde luego constituye un obstáculo importante para las posibilidades de avance tanto desde el punto de vista intelectual como práctico. La teoría de juegos es una disciplina que ha logrado acumular un importante número de contribuciones, las cuales pueden ser utilizadas tanto para guiar los procesos prácticos de construcción de soluciones como para someterlos a evaluación crítica desde un ángulo normativo. Entre las contribuciones que hemos revisado destacamos los conceptos de solución de Nash, que hasta hoy constituye tanto un modelo teórico de negociación, como un criterio de evaluación de tales procesos. Asimismo, el concepto de imposibilidad de Arrow ha permitido caracterizar por qué no se puede incluir en un vector colectivo de manera automática los n-vectores de las selecciones individuales. Por su parte la contribución de Harsanyi no sólo representa un interesante intento de lograr una fórmula general de construcción de una función de bienestar colectivo a partir de las preferencias individuales expresadas cardinalmente, sino que a partir de las dificultades que el propio Harsanyi tuvo que vivir en esa difícil empresa nace el concepto de sujeto social “decente” que coloca la piedra angular en el importante constructo de la llamada cultura institucional. La comprensión de dicha cultura y de los procesos que la hacen posible, se ve notablemente estimulada por los conceptos de common knowledge y evento público debidos a Aumann y Milgrom, los cuales son completados y enriquecidos con los desarrollos recientes sobre “acuerdos laxos” que abren un amplio panorama para estimular el uso de la negociación como el lenguaje apto no sólo para el logro de los arreglos institucionales, sino como el que hace posible la cultura institucional. A pesar de que son numerosas las corrientes y estrategias de pensamiento que han contribuido a complejizar y enriquecer este tema, el carácter sistemático y la continuidad exhibida por la teoría de juegos la coloca en un lugar especialmente relevante en el análisis tanto de la lógica del problema como de sus implicaciones en el mundo de las instituciones y de los procesos políticos.
Capítulo
3
Sociología y teoría de juegos. Una relectura de la obra de Neil Smelser Francisco Linares Martínez
1. Introducción En el año 1962 se publicó el primer, y único, gran tratado sociológico sobre el comportamiento colectivo. Se trata de la obra Theory of Collective Behavior, de Neil J. Smelser. Es un gran tratado en dos sentidos: en primer lugar, pretende hacer un tratamiento exhaustivo de los diversos fenómenos que se conocen como “comportamiento colectivo”; en segundo lugar, pretende presentar una teoría unificada de estos fenómenos. El desarrollo posterior de la disciplina le concede a esta obra la categoría de “única”, en cuanto a sus ambiciones. Los fenómenos que se analizan en ella son: el “pánico”, la “moda” o “boom” (craze), las revueltas (hostile outbursts), los movimientos reformistas (norm-oriented movements) y los movimientos mesiánicos y revolucionarios (valueoriented movements). Uno de los atractivos —y, desde luego, de los méritos— de la obra es el de unificar bajo un mismo marco analítico fenómenos muy dispares que, en la actualidad, se estudian diferenciados por distintos rótulos: comportamiento colectivo, acción colectiva y movimientos sociales. El primer objetivo de este capítulo es ilustrar cómo la teoría de la elección racional y la teoría de juegos pueden ayudar a mejorar la explicación que Smelser proporciona de los distintos tipos de comportamiento. En última instancia, se tratará de mostrar la insuficiencia de una teoría de los sistemas de interacción sin una teoría de la acción que aporte un principio optimizador; así como la futilidad de esta última en ausencia de la primera. Al mismo tiempo, el tratado de Smelser proporciona una oportunidad singular para realizar una de las tareas más interesantes de la sociología: una reflexión teórica sobre la naturaleza, y las posibilidades de explicación, de las normas sociales. Esto es así porque, como se verá, el problema de las normas sociales se halla estrechamente vinculado al 45
46
Economía, sociedad y teoría de juegos
problema del comportamiento colectivo. Nótese que presuponemos que ambos fenómenos son problemáticos desde el punto de vista teórico. Conviene subrayarlo porque ésta no ha sido una posición generalizada tanto en el análisis sociológico como en otras ciencias sociales. Por tanto, el segundo objetivo de este trabajo es explicar cómo la teoría de la elección racional y la teoría de juegos pueden ayudar a construir una teoría satisfactoria de las normas sociales. A nadie se le escapa que esta empresa tiene el aliciente especial de constituir una elaboración del vínculo micro-macro: se pretende dar cuenta de cómo los actores generan una propiedad del sistema de interacción que, a su vez, altera el comportamiento de los mismos. Tratamos, por tanto, con procesos de emergencia social. El orden de exposición será el siguiente: en primer lugar, se recuerda brevemente el contenido del tratado de Smelser, que lamentablemente ha seguido el camino de muchas de las grandes obras de su tiempo: el del depósito de las bibliotecas universitarias. En segundo lugar, se explica cómo las teorías de la elección racional y de juegos pueden refinar su análisis del comportamiento colectivo. En tercer lugar, se exponen los avances recientes en la teoría de la acción colectiva que permiten hacer una aproximación al problema de las normas sociales partiendo del supuesto de que la acción está guiada por un principio optimizador. En cuarto lugar, se aplican estas herramientas teóricas a cada uno de los tipos de comportamiento colectivo analizados por Smelser, mostrando en cada caso el grado de necesidad, y la posibilidad o imposibilidad, de que aparezcan normas sociales que regulen la acción de los individuos. Para concluir, se definen algunas preguntas consideradas fundamentales para guiar la investigación futura sobre la emergencia de normas sociales.
2. El punto de partida en la teoría social. La obra de Neil Smelser La base en la que Smelser se apoya para sostener que su categorización del comportamiento colectivo es exhaustiva es la compleja teoría de la acción social de Parsons, en la que se establecen cuatro “componentes” fundamentales de la acción: las “condiciones” (facilities), que constriñen las posibilidades de acción; la “movilización de motivación”; las “normas”, que regulan la acción; y los “valores”, que guían la acción (Parsons y Shils, 1951). Estos componentes de la acción social sirven, para Smelser, como “un lenguaje para describir y clasificar la acción. Se trata de una ‘carta de vuelo’ para trazar el curso de la acción, y no una fuente directa de hipótesis explicativas” (1962: 383). Así, los dos primeros tipos de comportamiento (pánico y moda) se asocian a tensiones (véase más abajo) relacionadas con el primer componente de la acción; las revueltas a tensiones relacionadas con el segundo elemento; y los movimientos reformistas, de un lado, y los mesiánicos y revolucionarios, de otro, a tensiones relacionadas con el tercero y cuarto, respectivamente. Además, como entre estos componentes existe una relación jerárquica, los tipos de fenómenos superiores en la jerarquía pueden implicar, a su vez, tipos inferiores, pero no al contrario. Así, una revolución puede implicar también un movimiento reformista; el movimiento reformista, revueltas; y las revueltas, fenómeno de pánico.
Sociología y teoría de juegos
47
No obstante, la obra de Smelser sólo es deudora de la teoría de la acción de Parsons a efectos, como el propio autor indica1, clasificatorios pero no explicativos. Esto no significa que abdicara de la tarea de explicar. Por el contrario, y esto es lo que verdaderamente nos interesa, empleó un método especialmente interesante de explicación que —realizando una analogía con la teoría económica— denominó de “valor añadido”, y que nada tiene que ver con la aproximación funcional ortodoxa tal y como, por ejemplo, es expuesta en la obra tan difundida de Merton (1972). En efecto, lo primero que llama la atención al leer Collective Behavior es la nula relevancia heurística del termino “función”, usado en escasas ocasiones y nunca con relación a un hipotético proceso de satisfacción de necesidades o requisitos de la sociedad en su conjunto. De hecho, la deuda que tiene Smelser es con el que probablemente sea reconocido como el “mejor” Parsons, el preocupado por la teoría voluntarista de la acción: los individuos se conciben como intencionados, persiguen sus fines guiados antes por una racionalidad con arreglo a valores que por la racionalidad con arreglo a fines; y en la elección de sus medios se hallan constreñidos tanto por condiciones incontrolables como por normas sociales. Este modelo de actor se halla emparentado con el del actor racional presupuesto en la teoría económica, pero no es equivalente al mismo. El desarrollo de este tipo de teoría obviamente requiere una articulación de lo que posteriormente se convino en llamar el “vínculo micro-macro”. Lo interesante para nosotros es cómo se realiza esta articulación en la obra que nos ocupa —veinte años antes de que fuera considerada un problema teórico de gran calado (Alexander, 1987)— y qué enseñanza podemos obtener de ello. Es aquí donde la aproximación del valor añadido tiene un gran interés. Smelser postula seis “determinantes” del comportamiento colectivo, que se mueven entre los fenómenos estructurales más generales hasta las decisiones políticas más concretas. Estos son: la “conductividad estructural” (structural conductiveness), la “tensión estructural”, la “creencia generalizada”, los “factores precipitantes”, la “movilización” y los “controles sociales” (véase la Tabla 3.1 para una descripción detallada). Cada uno de estos determinantes estrecha, por así decir, las posibilidades de manifestación de un episodio de comportamiento colectivo. Los factores precipitantes, por ejemplo, aparecen en un escenario previamente acotado por los procesos de tensión estructural y de difusión de la correspondiente creencia generalizada; pero, en ausencia de estos, no constituyen tales precipitantes. Al mismo tiempo, la aparición de un fenómeno que puede constituir un factor precipitante no desencadenará un episodio de comportamiento colectivo, si no existe el adecuado proceso de liderazgo o si las autoridades políticas prevén la forma de abortarlo. Así, la lógica de la explicación que se propone es que cada uno de estos determinantes añade “valor” a la explicación: Concebimos la forma de operar de estos determinantes como un proceso de valor añadido. Cada determinante es una condición necesaria para que el próximo opere como un determinante en un episodio de comportamiento colectivo. Con la acumulación de las condiciones necesarias, la explicación del episodio se hace más determinada. Juntas, las condiciones necesarias constituyen la condición suficiente para el episodio. Debería subrayarse, además, que vemos la acumulación de condiciones necesarias como un proceso analítico, no temporal (Smelser, 1962: 382). 1
Véase la cita de más arriba.
48
Economía, sociedad y teoría de juegos
TABLA 3.1. Determinantes del comportamiento colectivo en la obra de Smelser. DETERMINANTE
DESCRIPCIÓN
Conductividad estructural
Se trata de elementos estructurales que, de alguna manera, constituyen los prerequisitos más generales para el desarrollo del comportamiento colectivo. La posibilidad de comunicación entre los individuos, por ejemplo, es un requisito estructural en la mayoría de los casos.
Tensión estructural
Se trata frecuentemente de un rasgo de la estructura social, como la privación relativa de un grupo o el conflicto en torno a normas, que genera una necesidad o demanda del comportamiento colectivo, cuya misión es aliviar o eliminar dicha tensión.
Creencia generalizada
Este elemento es de especial importancia para Smelser, que lo introduce en la definición de cada uno de los tipos de comportamiento colectivo, de forma que el comportamiento X es un proceso de movilización basado en la creencia generalizada Y. Básicamente este proceso siempre es el mismo: la tensión estructural provoca un estado de ansiedad que es canalizado por una creencia sobre cómo resolver ese problema. Dicha creencia implica la identificación de un peligro y, en su caso, la identificación de la fuente o los agentes responsables del mismo, así como el convencimiento de que un curso determinado de acción puede eliminarlo.
Factores precipitantes
Se trata de elementos más o menos casuales que producen un estímulo final al desencadenamiento del comportamiento colectivo; como es el caso de la aparición de un fuego en el teatro en el estallido de un pánico o la subida de los precios en el de una revuelta.
Movilización
Hace referencia a lo que actualmente se entiende exclusivamente como “acción colectiva”. En todos los tipos de comportamiento colectivo se contemplan dos elementos relacionados con este determinante: el liderazgo y las fases de movilización, distinguiendo entre una fase “real” (que supone la respuesta inicial a la situación de peligro) y una fase “derivada” (que es fruto del cambio en las condiciones provocado por la fase real). Respecto a este segundo elemento, Smelser parece tener en mente un concepto similar al de “función de producción” (Oberschall 1980; Oliver y Marwell 1985) que dos décadas después se hizo común en una parte de la literatura sociológica sobre acción colectiva. Algunas formas de acción colectiva como el pánico y la moda, por un lado, y los movimientos reformistas y las revoluciones, por otro, siguen procesos de movilización similares.
Controles sociales
Aunque con el término de control social Smelser hace referencia en ocasiones a procesos informales (como el de liderazgo en el control del pánico), principalmente lo emplea para considerar el control de las agencias políticas y, específicamente en algunos casos, de las fuerzas policiales. Según Smelser, las agencias políticas pueden realizar una gestión que favorezca o no la movilización colectiva. Y ello puede deberse bien a aciertos o fallos en la elección de sus estrategias, o al interés de las propias agencias de ejercer o no su capacidad de control.
Sociología y teoría de juegos
49
3. El problema de los microfundamentos Con una actitud científica que muchos sociólogos posteriores deberían, al menos, tratar de imitar, Neil Smelser se pregunta al final de su obra si es posible encontrar evidencia que nos conduzca a rechazar las proposiciones que se derivan de la misma. En este sentido, señala dos clases de evidencia que pueden conducir a cuestionar su teoría (1962: 386): primero, situaciones en las que una o más de las condiciones necesarias (los “determinantes” de la Tabla 3.1) no están presentes y la acción colectiva ocurre; y segundo, situaciones en las que las condiciones necesarias están presentes, pero la acción colectiva no ocurre. Es este segundo tipo de situaciones el que, para nosotros, tiene un mayor valor heurístico. Imaginemos el caso de que se dieran las condiciones que, de acuerdo con la teoría de Smelser, fueran propicias para el desarrollo de un episodio del comportamiento colectivo reformista, por ejemplo, con relación a las relaciones laborales entre capital y trabajo. Si el episodio de comportamiento colectivo (por ejemplo, una huelga general) no ocurre, ¿supone esto evidencia en contra de la teoría? En nuestra opinión ofrece evidencia de que esta teoría es incompleta. Y esto es así porque, a pesar de su esfuerzo por combinar armoniosamente factores estructurales, como por ejemplo el grado de privación relativa, con elementos relativos a la acción, como el liderazgo, Smelser no acaba de llegar al “grano fino”. Los microfundamentos de su teoría son débiles, y ello le impide extraer de su teoría hipótesis que mejorarían sus predicciones. Hoy es un lugar común la tesis olsoniana de que a pesar de que un conjunto de individuos comparta la creencia de que una determinada acción producirá un estado deseable para un colectivo, los miembros de dicho colectivo normalmente no se movilizarán si: a) su contribución a la acción colectiva no es perceptible; y b) cualquier individuo se beneficiará de los resultados de la acción colectiva, con independencia de su participación o no en la misma 2 (Olson 1992). Así, aunque se dieran las condiciones señaladas por Smelser, la huelga podría fracasar si no existe un procedimiento para evitar el conocido problema del free rider. De esta manera, asumiendo que la Figura 3.1 —el llamado “bote de Coleman” 3 — representa correctamente la argumentación de Smelser, nuestra tesis es que la ausencia de un principio de acción optimizador le impide realizar correctamente la transición micromacro (flecha 3 de la Figura 3.1), lo que conduce a: primero, la posibilidad de derivar hipótesis de su teoría que no se vean confirmadas por la evidencia empírica y, segundo, la imposibilidad de derivar hipótesis más refinadas, susceptibles de enriquecer su marco teórico y proporcionar mayores posibilidades de contrastación empírica. Es preciso, en este punto, hacer hincapié en que el principio de acción a emplear no tiene por qué ser necesariamente el habitual en la economía neoclásica y en la teoría de juegos estándar. 2
Esto ocurre si el resultado de la acción colectiva es un “bien público” o “bien colectivo”; es decir, un bien que una vez proporcionado a un individuo se proporciona a todo el colectivo, y de cuyo consumo no puede excluirse a ninguno de sus miembros.
3
Esta figura explica la relación entre los elementos macro y micro de una explicación de la siguiente forma: los elementos macro ejercen una constricción sobre los individuos (Flecha 2), que reaccionan guiados por el principio optimizador de la acción (Flecha 4). La combinación de las acciones individuales (Flecha 3) produce finalmente un cambio en el nivel macro (Flecha 1).
50
Economía, sociedad y teoría de juegos
Un principio como el empleado en la teoría de juegos evolutiva, por el que se asume que los individuos eligen a través de un proceso de ensayo y error (implícitamente subyacente —por lo demás— en los escritos de muchos sociólogos y, desde luego, en la misma obra de Smelser 4), es posible y probablemente más adecuado 5. FIGURA 3.1. El vínculo micro-macro en el análisis de Smelser del comportamiento colectivo.
3.1 El grano fino: los dilemas de la acción colectiva El estudio del “grano fino” en los problemas de acción colectiva precisamente se deriva del planteamiento de la ya clásica La lógica de la acción colectiva. La obra de Olson, publicada por primera vez en 1965 (sólo tres años más tarde que Comportamiento colectivo), es un tratado mucho menos extenso y mucho más sencillo que el de Smelser. Su argumentación teórica puede resumirse, y de hecho queda resumida, en las tres páginas de su breve introducción (Olson, 1992: 11-13). ¿Por qué esta obra arrinconó a aquel tratado en los esfuerzos dedicados por las generaciones posteriores a entender el fenómeno de la acción colectiva? Creemos que la respuesta hay que buscarla, al menos, en tres elementos. Primero, aunque la obra de Olson es menos ambiciosa que la de Smelser proporciona, sin embargo, una tesis novedosa que tiene, al mismo tiempo, un gran atractivo por su carácter paradójico: “a menos que el número de miembros del grupo sea muy pequeño, o que haya coacción o algún otro mecanismo especial para hacer que las personas actúen por su interés común, las personas racionales y egoístas no actuarán para lograr sus intereses comunes” (Olson, 1992: 12; cursivas en el original). Segundo, el sendero de la teoría de la acción 4
Véase, por ejemplo, el epígrafe “Success or Failure of Specific Tactics” (1962: 359).
5
No consideramos relevantes para este trabajo, por tanto, las críticas realizadas al principio de la elección racional desde una perspectiva “realista”.
Sociología y teoría de juegos
51
parsoniana fue a la postre abandonado en la evolución académica de la sociología, lo que dejó desasistidas a aquéllas obras que eran deudoras de los planteamientos del sociólogo de Harvard. Tercero, la teoría de la acción empleada por Olson, aunque más pobre que la que usa Smelser, implica, no obstante, una ventaja heurística sobre ésta última, ya que permite realizar predicciones más concisas sobre las elecciones de los individuos. Con todo, la tesis de Olson es insuficiente para analizar el problema de la acción colectiva en toda su amplitud. Durante mucho tiempo se ha aceptado la hipótesis de que el problema de la acción colectiva es asimilable a la lógica del dilema del prisionero (Hardin, 1971), juego bien conocido que suele emplearse en el análisis de las situaciones en las que las decisiones individuales óptimas conducen a un resultado subóptimo desde el punto de vista colectivo. Esto se ajusta muy bien con la conclusión de Olson de que “las personas racionales y egoístas no actuarán para lograr sus intereses comunes”. Existen multitud de ejemplos con los que se ilustra este problema. Veamos tres de ellos: 1. En una empresa, los trabajadores deciden encerrarse en su centro de trabajo para impedir un recorte de plantilla (se trata, por tanto, de un ejemplo de movimiento reformista en la tipología de Smelser). Siguiendo el argumento de La lógica, cada trabajador se siente tentado a no contribuir al esfuerzo colectivo ya que se beneficiará igual de los logros obtenidos por los demás. El modelo del dilema del prisionero conduce a la predicción de que el encierro no tendrá lugar (salvo que, a través de incentivos, se altere la matriz de pagos, transformándola en un juego distinto). Esto afecta sustancialmente a las predicciones de Smelser. 2. Un conjunto de ciudadanos desean una mejora en las instalaciones de su barrio y deciden realizar una concentración ante las oficinas del Ayuntamiento de la ciudad. Es otro ejemplo de movimiento reformista. De nuevo, el modelo del dilema del prisionero predice que la concentración no tendrá lugar. 3. Los estudiantes organizan una manifestación para protestar por la deplorable enseñanza que reciben en la Universidad. En el transcurso de la misma, algunos de ellos son arrestados por apedrear la sede del rectorado; lo que desencadena una batalla campal con el resultado de varios policías y estudiantes heridos y otros tantos arrestados. El problema en el que nos interesa centrarnos es el de la lógica de la decisión de participar en la pelea entre los estudiantes y la policía pues, siguiendo el modelo del dilema del prisionero, para cada individuo aislado la racionalidad dictaría huir de la misma. A pesar de la aparente similitud entre los tres escenarios, el desarrollo de la teoría de la acción colectiva en la sociología nos proporciona herramientas para establecer diferencias relevantes entre ellos 6. Por una parte, una primera distinción aparece tan pronto como se hace notar que el “proceso de producción” de los tres tipos de acción colectiva es distinto. En el primer caso, el éxito del encierro no requiere del concurso de todo el colectivo. Si la empresa está dispuesta a negociar su política, más allá de un umbral las aportaciones del resto de los miembros tienen meramente un valor testimonial. Así, probablemente el encierro de unos pocos trabajadores sea suficiente para variar la política de la empresa. Decimos que esta acción colectiva tiene una función de producción decelera6
En concreto, seguimos en este planteamiento el relevante trabajo de Heckathorn (1996).
52
Economía, sociedad y teoría de juegos
tiva (Gráfico 3.1). En el segundo caso, el proceso de producción requiere del concurso de cuantas más personas mejor: unos pocos vecinos concentrados no llamarán la atención de la clase política que, argumentará, tiene que velar también por los intereses de los que no lo están. Decimos que esta acción colectiva tiene una función de producción acelerativa (Gráfico 3.1). Por otra parte, un segundo criterio para diferenciar los casos es el coste relativo de la acción colectiva, es decir, el coste con relación al beneficio que se obtiene al producir el bien común. Así, en el tercer ejemplo, sea cual fuere la forma de su función de producción, este coste puede considerarse mayor que en los ejemplos anteriores. GRÁFICO 3.1. Ejemplo de funciones de producción de la acción colectiva.
Esto ilustra tres lógicas distintas de la acción colectiva que se identifican con sendos dilemas bien conocidos: el juego del gallina (Matriz 1), que caracteriza a la acción colectiva con un coste relativamente bajo y una función de producción decelerativa; el juego de la seguridad (Matriz 2), que caracteriza a la acción colectiva con un coste relativamente
Sociología y teoría de juegos
53
bajo y una función de producción acelerativa; y el dilema del prisionero (Matriz 3), que caracteriza a la acción colectiva con coste relativamente alto. TABLA 3.2. Dilemas de la acción colectiva. MATRIZ 1 Juego del gallina C D C 3,3 2,4 D 4,2 1,1
MATRIZ 2 Juego de la seguridad C D C 4,4 1,3 D 3,1 2,2
MATRIZ 3 Dilema del prisionero C D C 3,3 1,4 D 4,1 2,2
La letra “C” corresponde en cada caso a la estrategia contributiva o cooperadora y la “D” a la estrategia no contributiva o desertora. Los pagos se representan en la forma usual, correspondiendo el número anterior a la coma al jugador de las filas y el posterior al jugador de las columnas. Los equilibrios se han señalado en negrita. Cada uno de los juegos señalados plantea problemas distintos (Kollock, 1998). En el juego de la seguridad existen dos equilibrios: uno en el que no hay cooperación y otro, el óptimo de Pareto 7, en el que hay mutua cooperación. La lógica es que cada individuo cooperará si tiene la seguridad de que los otros lo harán también; el problema es cómo proporcionar esa seguridad. En cuanto al dilema del prisionero, la solución estándar en los casos de repetición indefinida descansa, como es sabido, en la posibilidad de emplear estrategias condicionales como “cooperaré contigo mientras tú cooperes conmigo”, que siguen el principio general de reciprocidad (Axelrod, 1984). Esto convierte este dilema en un juego de la seguridad, en el que la estrategia condicional conduce al óptimo de Pareto. Pero si las estrategias condicionales no son posibles, la cooperación mutua sólo puede obtenerse a través de la transformación del juego mediante el empleo de incentivos selectivos. Finalmente, el juego del gallina tiene dos equilibrios de cooperación parcial (un jugador coopera y el otro no), lo que conduce al problema de quién hará el trabajo por los dos (en juegos de njugadores, por tanto, la distribución del trabajo será asimétrica). Nótese que en este último caso, a diferencia de los anteriores, la cooperación mutua no es un óptimo de Pareto. La información queda resumida en la Tabla 3.2, de la que cabe hacer las siguientes precisiones: 1. Una función de producción en forma de S consiste en la sucesión de una función acelerativa y otra decelerativa8. El colectivo en este caso se enfrenta a un “dilema híbrido”: 7
Óptimo de Pareto es el estado en el que ningún individuo puede mejorar su situación abandonándolo sin perjudicar, al menos, a otro individuo. Por tanto es habitualmente empleado en los análisis como una especie de “óptimo social” o estado “socialmente deseable”. Esto es, no obstante, un juicio criticable. Algunos de los problemas que se derivan de considerar el óptimo de Pareto como un estado socialmente deseable en el estudio de la acción colectiva pueden hallarse en Sandler (1992).
8
En aras de la simplicidad no se discuten las funciones lineales, que se corresponden con el punto de inflexión de las funciones con forma de S. La regla general es que estas funciones se caracterizan por un dilema del prisionero, si el coste relativo de la acción es alto. Si éste es bajo, no existe dilema alguno.
54
Economía, sociedad y teoría de juegos
un juego de la seguridad seguido de un juego del gallina (Taylor, 1987). Cabe asumir —y en este trabajo asumiremos— que éste es el caso más típico de acción colectiva. 2. Se han excluido los casos no problemáticos de acción colectiva en los que o bien cooperar es una estrategia estrictamente dominante o bien desertar es una estrategia estrictamente dominante. En el primero, el bien colectivo tiene un coste ridículo con relación a su valor, mientras que en el segundo el valor es inferior al coste. Por otra parte, el término coste bajo se define como el coste que se halla en un intervalo que va desde 0 veces el valor del bien colectivo a ½ de su valor 9. 3. En un colectivo cualquiera, la heterogeneidad de intereses y recursos de sus miembros puede provocar que los individuos estén jugando distintos juegos. Así, en una acción con función de producción acelerativa, algunos miembros pueden tener preferencias del juego de la seguridad y otros del dilema del prisionero (aun otros cooperarán incondicionalemente y, finalmente, algunos no cooperarán nunca)10. Asumiremos, mientras no se observe lo contrario, la simplificación de que los colectivos son homogéneos; no obstante, en los casos empíricos cabe esperar distintas “lógicas” combinándose en la acción colectiva (Linares, 2004). TABLA 3.3. Mapa básico de los dilemas de la acción colectiva. Función en forma de S
Coste relativo bajo Coste relativo alto
Función acelerativa
Función decelerativa
JUEGO DE LA SEGURIDAD si tú cooperas, yo también
JUEGO DEL GALLINA si tú cooperas, yo no
DILEMA DEL PRISIONERO no coopero, pero sería mejor si ambos cooperásemos
Estos tres dilemas plantean problemas de acción colectiva que Smelser no contempla. Problemas que pueden ser resueltos por normas sociales que, no obstante, el autor de Comportamiento colectivo sí tiene en consideración. Sin embargo, como veremos enseguida, la aproximación de Smelser —y la de tantos otros sociólogos— a las normas sociales, al prescindir de un principio de acción instrumental, resulta insuficiente.
4. El problema de las normas sociales 4.1. ¿Qué son las normas sociales? Considérense las siguientes situaciones. Primero, en los autobuses hay un letrero electrónico que indica que los usuarios deben subir con el bono o el dinero en la mano; algunos pasajeros lo hacen y otros no. Segundo, en las escaleras mecánicas del metro 9
Aquí se sigue el estudio de Heckathorn (1996).
10
En el caso de la función de producción decelerativa, algunos tendrán preferencias del juego del gallina y otros del dilema del prisionero.
Sociología y teoría de juegos
55
habitualmente las personas se pegan a un mismo lado con objeto de dejar el otro libre, y dar así paso a aquéllos que tienen más prisa. Tercero, en multitud de sitios (el mercado, el cine, la estación de tren, etc.) los usuarios hacen cola para ser atendidos. Estos tres ejemplos hacen referencia a regularidades en la conducta e intuitivamente podemos sentirnos orientados a pensar que estas regularidades están gobernadas por sendas normas sociales. Sin embargo, a pesar de la aparente similitud, existen importantes diferencias entre estas situaciones. En el primer caso hay una regla escrita, pero el comportamiento es más o menos arbitrario. Es de especial relevancia destacar que la persona que no cumple con la regla no recibe ningún tipo de sanción, ni por parte del chófer ni por parte de los otros pasajeros. En el segundo caso no hay una regla escrita, sino que se trata de una convención que la gente habitualmente respeta. A un individuo aislado que no tenga prisa le resulta indiferente situarse en el lado izquierdo o en el derecho de las escaleras mecánicas; así, cumplir con la convención no supone coste alguno. Tampoco en este caso suelen aplicarse sanciones: una persona que se sitúa en el lado que no es el convencional no suele tener ningún inconveniente en apartarse para dejar paso a alguien que lleva prisa, puesto que estar en un lado no tiene más valor que estar en el otro. Lo que distingue principalmente al tercer caso de los dos primeros es que aquí la regularidad sí implica procesos de sanción. Si alguien se salta la cola recibirá la sanción de los que ya llevan un rato esperando. Incluso si la persona que presta el servicio se equivoca, atendiendo a quien no le corresponde, probablemente se le hará saber que había alguien delante (“este señor estaba primero”). A diferencia del primer caso no existe una regla escrita, pero la regla que hay se cumple. A diferencia del segundo, la regularidad no tiene lugar de manera “espontánea”. En ausencia de mecanismos de sanción, la convención de echarse a un lado se sostiene pero —ésta es nuestra hipótesis— las colas no podrían existir. Asumimos en este trabajo que, en rigor, sólo el tercer ejemplo muestra el funcionamiento de una norma social. Es decir, una norma social es una regla de comportamiento que produce una regularidad observable debido a la existencia de sanciones 11. Una regularidad fruto de un mecanismo explicativo distinto de la existencia de sanciones no es, estrictamente, una norma social. Si las sanciones son positivas o negativas, se producen con frecuencia o rara vez, o se ejercen a través de controles externos o como fruto de un proceso de internalización no son cuestiones, ni mucho menos, menores, pero sí secundarias con respecto a la definición de norma social.
4.2. La aportación de la teoría de la lógica de la acción colectiva a la explicación de la emergencia de las normas sociales12 El análisis de las normas sociales tiene un vínculo estrecho con la teoría olsoniana de la acción colectiva. Éste se halla en la tesis de que, en el caso de los grupos en los que la contribución del individuo al bien colectivo no es perceptible, “la acción de grupo sólo 11
Una definición más completa puede hallarse en Horne (2001).
12
Los argumentos que se aportan en esta sección pueden hallarse más desarrollados en Linares (2006).
56
Economía, sociedad y teoría de juegos
se puede lograr mediante un incentivo que influya no indiscriminadamente, como el bien colectivo, sobre el grupo en conjunto, sino selectivamente sobre las personas que lo constituyen” (Olson, 1992: 60). Aquí Olson está apelando al funcionamiento de algo análogo a lo que acabamos de considerar normas sociales. La aportación estrictamente olsoniana queda, no obstante, prácticamente en esto 13. El testigo fue tomado por Edna Ullman-Margalit con un trabajo, ahora clásico, significativamente titulado The Emergence of Norms. En esta obra se propone una aproximación “evolutiva” al análisis de las normas sociales14. Su tesis puede parafrasearse afirmando que una norma social existe porque permite solucionar —se sobreentiende que mejor que otra norma social u otro tipo de mecanismo— un problema planteado por las condiciones de interacción entre los individuos (Ullman-Margalit, 1977: 9). Es decir, una norma “contribuye a la supervivencia de algo” (1977: 11). Aunque la aproximación general no es nueva, lo que sí es relativamente novedoso en la sociología es iniciar el análisis de las normas sociales partiendo de premisas individualistas y plantear una aproximación a los tipos de problemas que las normas permiten resolver empleando matrices de la teoría de juegos que establecen prototipos o modelos de interacción15. En definitiva, ese “algo” que debe sobrevivir no es una sociedad tomada como un todo o sistema, sino un determinado estado de cosas, fruto de la interacción entre los individuos, y que estos consideran deseable (se asume que la condición de deseabilidad viene dada porque ese estado de cosas es un “óptimo de Pareto” 16). Y el “problema” no es una característica abstracta del sistema (como un imperativo funcional), sino un conflicto que se deriva de las características de las relaciones que se establecen entre dichos individuos. Ullman-Margalit establece tres tipos de problemas: situaciones de dilema del prisionero, situaciones de coordinación y situaciones de desigualdad; aunque sólo las primeras están estrictamente relacionadas con nuestro interés en este capítulo17. Con respecto a este tipo de situaciones: El problema es el de proteger un estado de cosas inestable aunque mutuamente beneficioso [es decir, el óptimo de Pareto] de deteriorarse, por así decir, volviéndose un estado estable pero conjuntamente destructivo [es decir, el equilibrio del dilema del prisionero]. Mi posición con relación a tal situación es que una norma, respaldada por sanciones apropiadas, podría solucionar este problema. (1977: 22)
Lo primero que interesa señalar con respecto a este planteamiento es que el dilema del prisionero no es el único juego que plantea la necesidad o demanda de una norma 13
A lo que cabe añadir unas breves notas sobre la importancia de los incentivos sociales en los grupos pequeños (Olson, 1992: 70-72).
14
Esta aproximación ha tenido su máximo desarrollo desde el punto de vista de la investigación empírica en la obra de Ostrom (1990, 2005).
15
Un antecedente claro es la obra de Homans (1961).
16
Véase la nota 6 más arriba.
17
Los problemas de coordinación constituyen la génesis de “convenciones” que, como se explicó más arriba, no son estrictamente normas sociales. En cuanto a los problemas de desigualdad que plantea Ullmann-Margalit (cómo un grupo puede mantener un estado de cosas beneficioso para él a expensas de otro grupo) en mi opinión requiere la solución del primer tipo de problema. Más adelante en el texto se exponen casos de este tipo de desigualdad.
Sociología y teoría de juegos
57
social, sino que, como se ilustró con anterioridad, los juegos de la seguridad y del gallina constituyen también problemas específicos de la interacción que requieren algún mecanismo de solución. Reconocer este matiz tiene consecuencias muy importantes. Así, en el caso típico en el que la acción colectiva adopta la forma de un dilema híbrido, fruto de la sucesión de un juego de la seguridad y uno del gallina, se plantearán dos tipos de situaciones. En el juego de la seguridad el problema es garantizar que el mayor número posible de individuos contribuya a la acción colectiva. En el del gallina, el problema es garantizar que no demasiados individuos dejen de contribuir. Los problemas se plantean necesariamente en este orden. Esto implica que, normalmente, cabe esperar normas que incentiven la cooperación al inicio de la acción colectiva (en el juego de la seguridad) y normas que desincentiven la deserción al final (en el juego del gallina). Llamaremos a éstas “normas prescriptivas” y “normas proscriptivas” respectivamente (Coleman, 1990: 247). Y asumimos que las primeras se llevarán a efecto, o realizarán, mediante sanciones o incentivos positivos18 y las segundas mediante sanciones o incentivos negativos 19. La obra de Ullmann-Margalit —como la de Olson— deja, no obstante, sin tratar el problema de la realización de las normas sociales, esto es, de la ejecución de sanciones. Esta cuestión sólo es baladí si se prescinde de una teoría instrumental de la acción. Si se asume, por el contrario, que los actores tienen un comportamiento optimizador es preciso explicar por qué un individuo cualquiera se involucraría en la ejecución de una acción costosa como la sanción20. El problema, como hizo notar Oliver (1980), es análogo al de la lógica de la acción colectiva, porque de la implementación de sanciones no se beneficia solamente el sancionador, sino también el resto de los miembros del colectivo, contribuyan o no a ello. Por esta razón, éste se ha denominado “problema del free rider de segundo orden”: en tanto en cuanto sus aportaciones pasen desapercibidas, cabe esperar que los individuos no proporcionen las sanciones necesarias para resolver el problema de la acción colectiva original. Al abordar esta cuestión, no obstante, conviene tener presente la diferencia entre normas prescriptivas y normas proscriptivas.
Normas que fomentan la cooperación Una norma prescriptiva no es, desde luego, el único mecanismo para resolver el problema característico del juego del seguro. Otra solución bien conocida es la de la masa crítica (Marwell y Oliver, 1993). Si existe un subconjunto de individuos, más interesados que los demás en la acción colectiva, estos pueden iniciarla, actuando como líderes y desencadenando un efecto de bola de nieve que conlleva un tránsito desde el equilibrio no cooperativo hacia el óptimo de Pareto. Esta solución requiere, obviamente, un grado de heterogeneidad en la composición del grupo. Si éste es, no obstante, homogéneo puede aún desencadenarse un proceso similar aunque a través de un mecanismo distinto: 18
Empleamos los términos “sanción” e “incentivo” indistintamente, con independencia de que constituyan “premios” (positivos) o “castigos” (negativos).
19
Nótese, primero, que ésta es una predicción muy precisa sobre qué cabe esperar y qué no. Y, segundo, que esta predicción es distinta de la que se deriva asumiendo que el problema de la acción colectiva se reduce al dilema del prisionero.
20
Sobre la relación entre el coste de la sanción y el grado de implementación de la norma, véase el estudio experimental de Horne y Cutlip (2002).
58
Economía, sociedad y teoría de juegos
una parte de los individuos puede ser “empujada” a emprender la acción colectiva por el resto. Es presumible que esa parte que es empujada en primer lugar esté constituida por individuos que ocupan posiciones focales en la estructura del grupo. El mecanismo normalmente será el uso de sanciones positivas que, como regla general son fácilmente disponibles y tienen un coste muy bajo. Esto requiere la existencia de redes sociales cerradas o, dicho de otro modo, que los individuos constituyan una “comunidad”. Como muestra Coleman (1990: 277) las relaciones con estas características tienen un potencial amplificador que puede provocar un fenómeno explosivo de comportamiento colectivo, conduciendo a un exceso de “celo” o fervor en la persecución del bien colectivo 21. En su fase original esta estrategia de “empuje” tiene una connotación claramente “hipócrita” (haz lo que digo pero no lo que hago). En este sentido es interesante la distinción que realiza Heckathorn (1989) entre distintas estrategias de cooperación que, en aras de la simplificación, reducimos a: “cooperación total” (los individuos que cooperan para resolver el problema del free rider de primer orden y el del segundo orden) y “cooperación hipócrita” (los individuos sólo cooperan para resolver el problema del sistema sancionador). Heckathorn muestra que es probable que la acción colectiva se inicie con cooperadores hipócritas y que, conforme se van expandiendo las sanciones, los individuos se conviertan en cooperadores totales22. Obviamente, su análisis presupone, como el de Coleman, la existencia de vínculos entre los individuos que permiten una interacción continuada. En el caso de que este tipo de tejido social no existiera, la solución del problema del free rider de segundo orden implicaría la acción “heroica” de un pequeño grupo de individuos; una masa crítica de cooperadores “de segundo orden” (bien cooperadores hipócritas o bien cooperadores totales). Obviamente, esto exige, de nuevo, un cierto grado de heterogeneidad en el colectivo.
Normas que castigan la deserción La función de producción en forma de S implica que, si tiene lugar el efecto de bola de nieve señalado anteriormente, como fruto de tal dinámica cambiará la estructura de la situación, transformándose el juego de la seguridad en un juego del gallina. En este caso, algunos individuos se verán incentivados a abandonar el proceso de acción colectiva, explotando los esfuerzos de los que permanecen. Esto puede generar la necesidad de normas que penalicen la deserción. Y ello implica el uso de sanciones negativas. Normalmente el uso de este tipo de sanciones es más costoso que el de las positivas ya que no sólo puede implicar una reacción hostil por parte del sancionado, sino porque, además, exige la posibilidad de detectar a los individuos que se desvían de la norma (Hechter, 1984), ya que obviamente habrá un incentivo a ocultar dicha desviación23. Por ambas razones, las relaciones sociales de comunidad, que permiten no sólo compartir el coste, sino también la fácil detección de las infracciones, suelen ser también un requisito para resolver el 21
Un sugerente desafío a esta argumentación puede hallarse en Flache y Macy (1996).
22
Heckathorn emplea sanciones negativas en su modelo. No parece que existan dificultades para que los resultados puedan generalizarse al empleo de sanciones positivas.
23
Conviene señalar que tanto la investigación experimental como la de campo (Fehr y Gätcher 2000; Ostrom 1990) muestran que, una vez establecido el sistema sancionador, la cooperación se sostiene con una tasa de aplicación de sanciones muy baja.
Sociología y teoría de juegos
59
problema sancionador en este caso. Esta diferencia en cuanto al coste tiene una segunda implicación de trascendencia: puesto que cabe esperar que los incentivos sociales tengan una función de producción acelerativa (Macy, 1993), el problema de la provisión de sanciones sociales positivas probablemente se caracterice por el juego del seguro, mientras que el de la provisión de sanciones sociales negativas por el dilema del prisionero 24. Esto a su vez significa que los problemas del free rider de primer y segundo orden no tienen por qué coincidir en su forma lógica.
5. Normas sociales y comportamiento colectivo En lo sucesivo, tratamos de ilustrar cómo los argumentos anteriormente esbozados permiten refinar el análisis de los tipos de comportamiento colectivo tratados en la obra de Smelser. Se recuerda que estos son: el pánico, la moda, las revueltas, los movimientos reformistas (u orientados por normas) y los movimientos mesiánicos y revolucionarios (u orientados por valores).
5.1. El pánico Para Smelser (1962: 131 y ss.) el pánico es una forma de comportamiento colectivo fruto de la percepción de un daño inmediato, sobre el que no obstante existe un cierto grado de ambigüedad con respecto a la posibilidad, o no, de eludirlo. Esta ambigüedad produce un estado de ansiedad generalizada que deviene miedo. En un momento determinado un actor puede emerger como líder ofreciendo un “modelo de huida” (flight model). Esto provoca una primera respuesta a la situación original, que, a su vez, altera las condiciones iniciales provocando una nueva reacción. Así, el pánico genera más pánico. En cuanto a los procesos de control de esta reacción, Smelser señala no sólo la importancia del modelo de liderazgo, sino también la existencia de normas que impliquen directrices de comportamiento. ¿Es posible la emergencia de estas normas? Convenimos, en primer lugar, en que en las situaciones de pánico se cumple la demanda de una norma social, ya que existe un conflicto entre el interés del individuo y el del colectivo: a cada individuo le interesa escapar cuanto antes, pero la huida precipitada de cada individuo perjudica a los demás y, como fruto de la reacción que dicha huida provoca, también al propio individuo. ¿Qué tipo de dilemas sociales pueden emerger en esta situación? Nótese que lo relevante para abordar esta cuestión no es la función de producción del pánico —que, atendiendo a la descripción de Smelser, es acelerativa— sino la del orden. Si asumimos que el orden tiene una función acelerativa (es difícil iniciarlo, pero una vez que esto se consigue el proceso se refuerza a sí mismo) ello nos ofrece dos posibilidades, puesto que hay dos dilemas sociales compatibles con una función de este tipo: el juego de la seguridad y el dilema del prisionero. Que los individuos se enfrenten a un caso o a otro depende del valor del orden respecto al de la huida precipitada 25. Cuando el coste 24
Obviamente, si el coste relativo de las sanciones es muy bajo, no habrá dilema.
25
Es decir, si el valor del orden respecto al de la huida es alto, entonces los individuos se enfrentan a un juego de la seguridad; en caso contrario, al dilema del prisionero.
60
Economía, sociedad y teoría de juegos
del orden es demasiado alto para el individuo, como en el caso de un pánico financiero o en el de la huida de un edificio en llamas, la estrategia dominante siempre es la huida, aun cuando el orden sea un óptimo social (éste es el caso del dilema del prisionero). En este caso, la demanda de una norma social nace, como argumentaba Ullmann-Margalit, de la necesidad de proteger un estado mutuamente beneficioso, pero inestable. Sin embargo, la emergencia de la norma es difícil. Cabe hacer una distinción, no obstante, entre los dos ejemplos aportados: en el caso del pánico financiero no se dan condiciones para la realización de la norma social, puesto que no existe un tejido social común que permita la ejecución de sanciones. En el caso del pánico fruto de un desastre como un incendio, terremoto, bombardeo etc., la situación es distinta. El propio Smelser lo hace notar: Estas normas que toman preferencia sobre la huida proporcionan una ulterior explicación de por qué ocurre tan poco pánico en desastres comunitarios producidos por bombardeos, terremotos, incendios y tormentas. La vida familiar y de comunidad implica una multiplicidad de lealtades y deseos para el individuo. Si éste sigue las mismas, será menos probable que sea presa del pánico. (1962: 166)
Por tanto, cuando estos lazos comunitarios no existen, si los individuos se hallan atrapados en un dilema del prisionero (como en el caso del pánico financiero), el pánico se extenderá. Si, por el contrario, el coste de la contribución a sostener el orden es relativamente bajo, entonces la estructura de la interacción corresponde al juego de la seguridad 26: al individuo le interesa una salida ordenada si tiene la seguridad de que los demás no van a salir huyendo. Sin embargo, como argumenta Coleman (1990: 212), el equilibrio no cooperativo es un equilibrio estable pero el mutuamente cooperativo no, ya que la desviación del primero implica un coste y la desviación del segundo un beneficio. La cuestión es la siguiente: ¿cómo hacer robusto el equilibrio en el que se logra el óptimo de Pareto? Los simples mecanismos de coordinación (el establecimiento de reglas de conducta que indiquen cómo debe comportarse, del tipo “salga por la salida que corresponda al color de su asiento”) para atraer a los individuos al equilibrio cooperativo no serán, por sí mismos, de utilidad. La existencia de una masa crítica de individuos dispuestos a asumir el coste de proporcionar el modelo de “salida en orden” tampoco es una solución por sí misma, ya que al individuo sólo le interesará seguir el camino de la masa crítica si la utilidad que recibe por la ación alternativa es menor (por ejemplo, si no se encuentra cerca de la salida). Finalmente, la existencia de cooperadores hipócritas no será una solución puesto que no tiene sentido huir y, al mismo tiempo, respaldar socialmente a los que no huyen. Por tanto, la salida ordenada sólo puede producirse si existe una masa crítica de “cooperadores totales”; esto es, de individuos que estén dispuestos a asumir ambos costes: servir de modelo de “salida ordenada” y sancionar a quien no siga el modelo. En situaciones claramente estructuradas, como por ejemplo un viaje en barco o avión, la tripulación constituye dicha masa crítica. ¿Qué tipo de sanción deben emplear estos sujetos para hacer efectiva la realización de la norma social? Al contrario que en otros casos de acción colectiva, las sanciones sociales positivas no resultarán suficientes si el colectivo no tiene las características de 26
Este planteamiento es similar, aunque no análogo, al defendido por Coleman (1990: 205 y ss.) en su análisis del pánico.
Sociología y teoría de juegos
61
la “comunidad”, como ocurre, por ejemplo, en un acontecimiento público como una representación de teatro o un viaje en avión. Por tanto, esta masa crítica debe emplear sanciones negativas: el individuo debe sentirse más intimidado por las posibles sanciones que por el peligro en sí. Una ilustración puede hallarse en la película El coloso en llamas, en la que el magnate que ofrece la fiesta de inauguración del rascacielos propina un puñetazo a su propio hijo cuando éste se deja llevar por el pánico y pretende saltarse el orden de salida establecido para huir del fuego. Obviamente, el argumento presupone que la aplicación de sanciones es posible en la práctica. Si este análisis es correcto la importancia del liderazgo no reside únicamente en que proporciona un modelo a seguir, como argumenta Smelser, sino también un castigo a quien no siga ese modelo. La posibilidad o imposibilidad de ejecutar este tipo de sanciones marcaría por tanto la diferencia entre una estampida y una salida ordenada. O lo que es lo mismo, esta última se convierte en una norma social, en tanto en cuanto existe la posibilidad de una sanción para el que no cumpla con la regla establecida. Obviamente, en ausencia de un individuo poderoso con capacidad de sanción (el padre, por ejemplo, para sus hijos), serán necesarias múltiples personas con una capacidad menor, pero suficientemente efectiva.
5.2. La revuelta La explosión de un episodio de violencia en un colectivo es fruto, según Smelser (1962: 222 y ss.), de la creencia de que un determinado agente es responsable de la tensión a la que se halla sometido dicho grupo. Esta tensión puede ser fruto de diversos elementos estructurales, entre los que se enumera la ausencia de información, los fenómenos de privación relativa, la disputa sobre normas y los conflictos sobre valores. Determinados rasgos estructurales facilitan, o posibilitan en su sentido más general, este tipo de comportamiento: la posibilidad de adscribir responsabilidades a alguien, la posibilidad de expresar la protesta a través de medios no violentos, las posibilidades de comunicación entre los miembros del colectivo y la propia actuación de las agencias de control. Los factores precipitantes refuerzan la definición común de la situación que vincula el mal común a algún agente responsable. Smelser presta especial atención a las posibilidades de organización del colectivo, que pueden descansar en formas de organización preexistentes, así como al efecto de “contagio” que sigue a los primeros momentos del proceso. El liderazgo puede adoptar múltiples formas, por lo que prácticamente cualquier colectivo puede contener un líder en potencia. En cuanto a las posibilidades de control por parte de las agencias de orden público, se insiste en la importancia tanto de la acción rápida y decisiva, como de que las autoridades sean percibidas como imparciales y firmes. Este tipo de conducta se caracteriza porque los miembros del colectivo llevan a cabo actuaciones que normalmente no emprenderían de forma aislada. El problema desde el punto de vista sociológico, como señala Coleman (1990: 197), no se resuelve afirmando que estos individuos son presas momentáneas de fuerzas irracionales. El reto, por el contrario, es explicar cómo los mismos individuos de los que se presume un comportamiento en alguna medida racional en otras esferas (como la economía o la política) o en otros momentos de su vida (aquella misma mañana antes de participar en la revuelta) participan en este tipo de acciones.
62
Economía, sociedad y teoría de juegos
Los episodios de hostilidad tienen, como la producción de orden en un escenario de pánico potencial, una función de producción acelerativa. Ello implica, como en el caso previo, que el colectivo puede estar inmerso bien en el juego de la seguridad o bien en el dilema del prisionero, dependiendo del valor relativo de la acción colectiva. En el caso de que el coste en la acción colectiva sea excesivamente alto, porque —por ejemplo— el grupo se halla frente a una fuerza policial dispuesta a actuar contundentemente, la estructura de incentivos será probablemente similar a la del dilema del prisionero, y la estrategia dominante del individuo es, por tanto, no participar. Por otra parte, si el coste no es tan alto o, aun en el caso de que lo sea, el valor del bien público lo es mucho más, entonces probablemente la estructura de incentivos será la del juego de la seguridad. Tanto en un caso como en otro, existen algunas diferencias notables con respecto al caso de producción de orden en una situación de pánico. En primer lugar, si el problema es el de un juego de la seguridad, una masa crítica que lidere la acción colectiva sí puede servir como mecanismo de coordinación, ya que en este caso el equilibrio mutuamente cooperativo es normalmente robusto: un individuo no gana nada desertando del mismo. Por otra parte, la cooperación hipócrita también tiene sentido; los términos “¡Adelante, que yo voy detrás de ti!” pueden producir un fenómeno explosivo. Finalmente, en muchos casos probablemente existe como señala Smelser, un tejido social previo. Esto permite la ejecución de pequeñas sanciones sociales positivas de bajo coste y alta eficacia (por contraposición al escenario del pánico que sólo permite la realización de sanciones negativas de alto coste), dando lugar al fenómeno de fanatismo analizado por Coleman27. Una conclusión importante que se deriva de todo ello es que el liderazgo perderá importancia relativa, en comparación con los lazos sociales preexistentes, cuanto mayor sea el coste de la acción colectiva en comparación con su valor. No deja de resultar extraño hablar de la existencia de normas sociales para la explicación de episodios temporalmente breves, como son las revueltas o las situaciones de pánico. En este sentido, cabe plantear si existe alguna diferencia entre “estimular” a alguien para que haga algo (o deje de hacerlo) y “aplicar sanciones”. En el primer caso estaríamos ante un intercambio bilateral y en el segundo ante la implementación de una norma social. Coleman (1990: 817-818) parece sostener que la diferencia se halla en que en el segundo caso existe un derecho reconocido a aplicar sanciones. Este punto es discutible, no obstante, en tanto en cuanto la existencia de la norma, como argumentamos más arriba, depende de la posibilidad de ejercer sanciones, y esto puede ocurrir con o sin tal reconocimiento. Probablemente ambos casos deban considerarse los extremos de un continuo28.
5.3. El movimiento revolucionario Dentro de los movimientos orientados por valores, Smelser (1962: 313 y ss.) incluye un grupo bastante heterogéneo que, a su entender, tienen en común la creencia de que la 27
Véanse los apartados anteriores.
28
Otro tanto cabe decir con relación a la diferencia entre los casos en los que las sanciones son aplicadas por una única persona y aquellos en los que lo son por un colectivo.
Sociología y teoría de juegos
63
sociedad está amenazada por un mal que es preciso erradicar. Tal erradicación conlleva la realización de un nuevo orden social, sostenido en nuevos valores. Junto a algunos elementos comunes a otros tipos de comportamiento colectivo, una fuente de tensión específica que puede dar lugar a este tipo es la heterogeneidad de la población. Dentro de esta descripción, se contemplan desde movimientos mesiánicos hasta movimientos revolucionarios. Nos ceñiremos, no obstante, a estos últimos. Con relación a la movilización, Smelser señala las característica propias de un proceso con pendiente acelerativa: “una vez que un movimiento orientado por valores da evidencia de las posibilidades de éxito, muestra un estallido de actividad, y comienza a ganar numerosos adherentes que se unen por razones quizá no relacionadas con los objetivos originales del movimiento” (1962: 356). En la literatura de la elección racional, no obstante, se presume que una revolución tiene una función de producción en forma de S 29. La fase decelerativa puede prolongarse en el caso de que el movimiento se institucionalice en el tiempo (lo que no es característico del fenómeno revolucionario, aunque sí de los movimientos mesiánicos). Conviene, con relación a este punto, señalar la importancia otorgada por Smelser a las dinámicas de inestabilidad y fragmentación, fruto de la propia heterogeneidad del movimiento, las diferencias entre líderes carismáticos y los conflictos políticos internos con relación a las tácticas a seguir30. Igualmente, es de especial importancia, en el caso de las revoluciones, las medidas de las agencias de control político de cara a prevenir, evitar o, en su caso, minimizar el impacto de los movimientos revolucionarios. En las funciones de producción en forma de S, el colectivo se enfrenta a un dilema del prisionero si el valor relativo del bien colectivo es bajo31. Dado que el motivo de la revolución es, necesariamente, un deseo de derrocar al régimen vigente, el valor será bajo cuanto más costoso sea llevar esto a cabo, lo que depende en buena medida de la capacidad del régimen para reprimir este tipo de movimientos y para castigar a los miembros implicados en los mismos. Así, la evolución de estas capacidades, en el sentido de la pérdida progresiva de control sobre la población por parte del régimen, conduciría a una estructura de incentivos distinta del dilema del prisionero. Si esta evolución no se produce, lo más probable es que el movimiento quede reducido a los pequeños núcleos de resistencia que muestren rasgos comunitarios. Si, por otra parte, el valor relativo del bien colectivo es alto, la situación en una función de producción en forma de S es más compleja que la de los casos ilustrados con el pánico y la revuelta. Por un lado, el fragmento acelerativo de la función de producción se caracteriza por el mismo problema estudiado en los casos anteriores: el juego de la seguridad. En concreto el análisis sería análogo al de la revuelta, en el sentido de que los elementos a tener en cuenta (comportamiento de la masa crítica, conducta de celo, conducta hipócrita) operan de la misma forma; aunque cabe prever que la función tenga una pendiente más 29
Véanse, por ejemplo, Karklins y Petersen (1993) y Obeschall (1994).
30
Smelser también contempla la institucionalización como fuente de desunidad, ya que ésta normalmente lleva aparejada el abandono de ciertos ideales a los que los más “puristas” no están dispuestos a renunciar.
31
O, lo que es lo mismo, cuando su coste relativo es alto.
64
Economía, sociedad y teoría de juegos
suave, lo que puede implicar problemas de organización específicos. La teoría predice la emergencia de normas sociales prescriptivas que “empujen la cooperación hacia arriba” en la curva de producción de la acción colectiva. Este empuje es iniciado, desde luego, por una élite revolucionaria que actuaría como masa crítica. La experiencia, sin embargo, muestra la existencia de sanciones negativas en el desarrollo del proceso revolucionario. Aunque en una revolución exitosa la mayor parte de la población nunca se ve envuelta en el proceso político más que en una pequeña medida, los revolucionarios necesitan, no obstante, de su consentimiento, al menos tácito, para triunfar (Coleman, 1990: 482). En este sentido, los revolucionarios tienen que conseguir que la balanza de intereses de la población deje de orientarse hacia el lado del régimen establecido y se decante de su lado. Un instrumento posible es el uso de sanciones negativas, que incluso pueden llegar a adoptar la forma del terror. Esto es coherente con la predicción que se deriva del análisis de la función de producción. Pasada la primera fase, caracterizada por el juego de la seguridad, se entra en una segunda, caracterizada por el juego del gallina. En el juego del gallina, los equilibrios son de cooperación parcial: a los individuos no les interesa participar si otros ya lo hacen. Más aún, la cooperación mutua —a diferencia de lo que ocurre en el dilema del prisionero— no es un óptimo de Pareto. En el movimiento que nos ocupa, parte de la población quizá sea indiferente entre que los revolucionarios consigan sus objetivos o no; y en cualquier caso, si otros ya están contribuyendo, tiene poco que ganar aportando su contribución. Pero los revolucionarios, como se ha argumentado, sí los necesitan y ello puede dar lugar a la emergencia de normas proscriptivas sostenidas en sanciones negativas. A diferencia de lo que ocurría en los casos de la revuelta y el pánico, estas normas serán “disjuntas”, en términos de Coleman (1990: 244), puesto que los actores que sancionan y los que reciben las sanciones no comparten los mismos intereses. Ello implica problemas de monitorización de quién es fiel, o no, a la revolución; análogos, por otra parte, a los del régimen para detectar y castigar a los traidores. Los individuos comunes, por tanto, estarán sujetos a un sistema de normas con incentivos contradictorios. La predicción final es que, si un movimiento de este tipo se abre camino poco a poco, irá perdiendo su cara amable y, de forma simultánea, irá ganado progresivamente adeptos por motivos múltiples y en muchos casos distintos a los que originaron la revolución. El éxito de la revolución, no obstante, depende de la evolución de la balanza de poder entre fieles a ésta y fieles al régimen.
5.4. El movimiento social reformista El movimiento orientado normativamente es, según Smelser (1962: 270 y ss.), fruto de la creencia de que existe un fallo en la regulación de la sociedad que es posible corregir. Por tanto, a diferencia de los movimientos revolucionarios no implica el derrocamiento del sistema de autoridad, sino una reforma dentro del mismo. Smelser lista como fuentes de tensión que podrían dar origen a este tipo de movimiento, junto a otros elementos comunes con otros tipos, la desarmonía entre los estándares normativos vigentes y la realidad social, así como la aparición de nuevos valores que hacen que las viejas normas queden obsoletas. Entre las condiciones estructurales que posibilitan su emergencia, hace especial hincapié en la percepción de precariedad en el equilibrio de la balanza de poder: si es imposible una reforma la movilización no tendrá lugar. Esta cuestión se
Sociología y teoría de juegos
65
halla vinculada a la acción de las agencias de control social para promover o impedir el desarrollo de este tipo de movimientos. En cuanto al desencadenamiento de la acción colectiva, Smelser asume que el liderazgo puede adoptar muchas formas, existiendo la posibilidad de que emerjan conflictos entre líderes. Finalmente, con relación a las fases de movilización apunta esto: El desarrollo de un movimiento orientado normativamente puede dividirse en tres fases temporales —la fase incipiente, la fase de movilización entusiasta y el período de institucionalización y organización. El movimiento comienza con un comportamiento lento de búsqueda; se acelera en un período de actividad sobrecargada; y entonces se establece gradualmente en declive o en la rutina de la actividad diaria. (1962: 298-299)
Esta descripción coincide con una función de producción en forma de S, similar a la de los movimientos revolucionarios. A diferencia de las revoluciones, sin embargo, no cabe esperar que este tipo de movimientos tengan un valor relativo bajo, puesto que el coste de la participación no es tan alto como en el caso anterior. Si esto es así el dilema estándar al que se enfrentarán los individuos participantes en este tipo de comportamiento colectivo será el dilema híbrido compuesto por un juego de la seguridad y un juego del gallina. La teoría de la elección racional predice, por tanto, que habrá una demanda de incentivos positivos, que estimulen la cooperación al inicio, y de incentivos negativos que impidan que los participantes se “desenganchen”, más adelante. Puesto que los miembros del movimiento reformista, a diferencia de los del movimiento revolucionario, no disponen normalmente de medios de coacción social eficaces, este tipo de acción colectiva es, paradójicamente, más difícilmente sostenible. Una forma de evitar el desenlace en forma de progresiva disolución es la institucionalización de mecanismos (como, por ejemplo, reuniones periódicas) que aunque propicien, como decía Smelser, que el movimiento entre en una fase rutinaria, impidan, no obstante, su declive. Estos mecanismos implican algún grado de organización formal, al que quedarían vinculadas las normas; lo que constituye —como las normas mismas— un problema del bien colectivo de segundo orden. La respuesta estándar en la teoría de la acción colectiva a esta cuestión es la de Olson: asumiendo que el grupo no es privilegiado —puesto que si lo fuera no sería necesaria la instauración de rutinas formalizadas— la organización sólo sobrevivirá si es capaz de producir incentivos selectivos a sus miembros. Si los grupos son tales que los individuos pueden intercambiarse incentivos sociales, entonces se mantendrá una norma social institucionalizada; si no es así, la organización tendrá que ofrecer otro tipo de estímulos si el movimiento reformista ha de sobrevivir.
5.5. La moda o el “boom” Finalmente 32, Smelser (1962: 170 y ss.) también analiza en su tratado de comportamiento colectivo el fenómeno de las modas de objetos de consumo (que pueden ser tanto una prenda de una determinada marca como las acciones de una determinada empresa)33. Se 32
Hemos alterado el orden de la exposición de Smelser, dejado para el final el análisis de este tipo de comportamiento colectivo, por conveniencia de nuestra propia exposición.
33
Smelser pone ejemplos principalmente del ámbito del consumo de masas, del ámbito económico y del político.
66
Economía, sociedad y teoría de juegos
trata de un comportamiento colectivo poco organizado, en el que no siempre es evidente el tipo de interdependencia que existe entre los actores. Algunas veces, por ejemplo en lo que concierne a la vestimenta, no está claro en qué medida se trata sencillamente de una convención. No obstante, parece claro que vestir de etiqueta o no, no es lo mismo que circular en carretera por la izquierda o por la derecha. Cuando se decide circular por un lado o por otro, está en el interés de todos escoger la misma opción. En este caso, resulta evidente cuáles son las consecuencias negativas de no cumplir la convención; y el equilibrio en el que los individuos se coordinan es, por tanto, self-policing: no requiere normalmente del uso de sanciones. Solamente desde la presunción —difícilmente sostenible, por otra parte— de la deseabilidad de que todos vistamos igual puede entenderse la moda como una convención, en el sentido que aquí se le da a este término. Cuando alguien no va vestido “a la moda”, sin embargo, pueden producirse sanciones sociales. Estas sanciones normalmente son muy baratas y, por tanto, su ejecución no suele implicar un problema del free rider de segundo orden. El problema desde el punto de vista analítico no parece ser cómo es posible sancionar a los free riders, sino averiguar por qué el individuo que no va “a la moda” es un free rider. Es decir, ¿cuál es el bien colectivo al que el individuo no está contribuyendo? De esta forma, este tipo de comportamiento colectivo parece constituir un caso límite para el análisis de las normas sociales, pues no parece haber un problema que la norma deba resolver, puesto que —al menos aparentemente— la conducta del individuo no produce consecuencias negativas a los demás. Un camino posible para abordar esta dificultad es asumir que la moda desempeña un papel importante en los procesos de distinción entre grupos, que —a su vez— implican asignaciones diferenciales de recursos. Esta aproximación, sin embargo, sólo sería útil para analizar algunos fenómenos, pero no otros, de los incluidos por Smelser bajo el rótulo de “moda” o “boom” (craze). Conviene señalar que muchos de estos son procesos que implican pautas de conducta cuya emergencia y desaparición, aun siendo complicada de entender (como es un boom financiero o las modas de determinados juguetes), no implican un comportamiento sometido a norma. Sin duda, en un boom financiero —como en el caso “simétrico” del pánico financiero— la acción de un individuo es contingente con respecto a la de los demás, pero no existen procesos de sanción ni, aun cuando fuera deseable que existieran (por ejemplo, para evitar el estallido de una “burbuja” financiera), hay un tejido social que permita el desarrollo de los mismos.
6. Conclusión La teoría de la elección racional y la teoría de juegos se han empleado con frecuencia de una manera poco fructífera en el campo de la sociología, orientándose a la reconstrucción racional de un determinado acontecimiento histórico o proceso social. La estrategia correcta desde el punto de vista de la teoría sociológica, sin embargo, es la de mostrar cómo el principio de la elección racional produce distintas predicciones en distintos sistemas de acción (Boudon, 1981; Coleman, 1990). En este sentido, el principio optimizador es una herramienta que solamente da frutos cuando se dispone de una teoría de los sistemas de acción que especifique sus propiedades características. Si esa teoría existe, el principio permite refinarla, siempre que ésta sea compatible con una concepción intencionada de
Sociología y teoría de juegos
67
la acción. Si la teoría no existe, el análisis se convierte en un vacuo ejercicio de estilo, con frecuencia sujeto a la sospecha de resultar irrefutable y, por tanto, tautológico. A lo largo de este capítulo hemos ilustrado este argumento examinando la obra Comportamiento colectivo, de Neil Smelser. Una parte de esta obra es “prescindible” desde la perspectiva del desarrollo de la teoría sociológica en los últimos cuarenta años. El rigor de su construcción teórica y su ánimo de exhaustividad, no obstante, permiten plantear la posibilidad de refinar su análisis empleando las herramientas de la elección racional y la teoría de juegos. En el desarrollo de este refinamiento cabe, al mismo tiempo, plantear una cuestión de interés central para la construcción de una teoría sociológica compatible con un principio de acción optimizador, a saber: las constricciones institucionales a las que los individuos se adaptan instrumentalmente deben a su vez ser susceptibles de ser explicadas de una forma compatible con el comportamiento optimizador. Éste es el conocido problema del vínculo entre la estructura y la acción, que no se ha resuelto satisfactoriamente en las ciencias sociales. Si hay una constricción institucional por excelencia en el reino del análisis sociológico, ésta es la “norma social”. Con frecuencia (más bien con bastante “normalidad”) en la teoría sociológica se han tomado las normas sociales como dadas, como elementos que definen el marco de interacción de los sujetos. Esta posición resulta muy clara en la obra de Smelser, deudora teóricamente de la de Parsons. Al mismo tiempo, se ha asumido que los individuos orientan su acción —como fruto de los procesos de socialización— de una manera consistente con el cumplimiento de las normas sociales. Cualquiera que sea el mérito de esta aproximación para dar cuenta de determinados fenómenos empíricos, plantea algunas dificultades analíticas, ya que no permite abordar correctamente el problema de los intereses de los actores, e incurre también en una gran deficiencia teórica: impide abordar el problema de la emergencia de las normas sociales. Adoptar una teoría instrumental de la acción nos obliga, sin embargo, a tratar de responder preguntas muy precisas que, en la actualidad, presentan un campo muy fértil para la investigación, tanto teórica como aplicada. Primero: ¿qué tipos de problemas suscitan la emergencia de normas sociales? La teoría de juegos ofrece tres modelos de interacción (el dilema del prisionero, el juego del gallina y el juego de la seguridad) que generan una “demanda de norma social”. Desde la perspectiva (metafóricamente) evolutiva que planteaba Ullmann-Margalit, las normas sociales son mecanismos que permiten resolver los problemas planteados por estos dilemas. Es preciso hacer notar que existe un amplio consenso sobre la exhaustividad de esta, no obstante, breve lista. Por otra parte, sin embargo, se carece de una elaboración teórica que permita reconocer con precisión cuándo se hará presente cada uno de los dilemas. La obra de Smelser es ejemplo de un camino a seguir para emprender esta tarea. Como hemos visto, en Comportamiento colectivo no se presta atención exclusivamente al momento de la acción colectiva, sino que se delinean, siguiendo una senda teórica, qué condiciones concurren en cada uno de los casos, las cuales propician un tipo de comportamiento u otro. Segundo: ¿qué tipo de norma puede satisfacer esa demanda? Cada uno de los tres dilemas señalados plantea distintos problemas para la acción. En este punto, el desarrollo actual de la teoría de la acción colectiva proporciona una lógica que el investigador no puede alterar a su conveniencia. Esta lógica implica que no deben esperarse normas que
68
Economía, sociedad y teoría de juegos
castiguen la deserción al inicio de la movilización. Esto es así porque, si la función de producción es acelerativa, la cooperación será estimulada bien por la acción de una masa crítica o bien por la provisión de incentivos positivos. Si, por el contrario, la función es decelerativa, no serán necesarios incentivos para iniciar la cooperación, pero sí lo serán sanciones negativas para evitar la aparición de comportamientos oportunistas en la fase de consolidación de la acción colectiva. Tercero: ¿qué tipo de sanciones pueden emplearse en la realización de una norma y qué condiciones garantizan su aplicación? No existen normas si no existe la posibilidad de sancionar. Si se asume una teoría instrumental de la acción, esta tesis plantea un problema analítico cuya solución no es fácil, pues no es evidente en qué medida individuos racionales aplicarán sanciones costosas. Este problema del free rider de segundo orden encierra además un gran puzzle teórico, ya que podría darse el caso de que fueran necesarias metanormas para hacer cumplir normas de orden inferior, produciendo eventualmente una regresión infinita. La solución estándar de este problema en la sociología es la proporcionada por Coleman: en redes sociales cerradas los individuos pueden emplear sanciones sociales de bajo coste que tendrán un efecto multiplicador, pudiendo producir incluso un exceso de celo en el cumplimiento de la norma. Obviamente estas condiciones de comunidad facilitan resolver el problema de monitorización inherente a todo proceso de asignación de recompensas y castigos. Esta solución conlleva la necesidad de una aproximación teórica que aporte soluciones sobre las características de los lazos que vinculan a unos individuos con otros, los procesos de intercambio que tienen lugar a través de ellos, los tipos de sanciones disponibles, así como la “función de producción” de dichas sanciones; éste último, un aspecto notablemente descuidado en la literatura. Finalmente: ¿cuál será el grado de generalización de una norma entre los individuos? A lo largo de este trabajo hemos asumido como regla general una población homogénea. Esto es obviamente una simplificación. En la realidad existirán tipos de individuos que variarán con respecto a distintos parámetros; los más obvios, su grado de interés en la acción colectiva y sus recursos bien para contribuir a ella, o para oponerse a la misma. De nuevo, una construcción teórica es necesaria para establecer satisfactoriamente estas distinciones. Por otra parte, la teoría de juegos evolutiva promete ser una herramienta de gran relevancia en esta cuestión. La razón, más allá de la importancia del modelo de racionalidad acotada que ésta proporciona, es su foco en el problema de la distribución estable de estrategias en una población de individuos. La cercanía o parentesco entre este objetivo y el planteamiento seminal de Ullmann-Margalit en el análisis de la normas resulta evidente.
Capítulo
4
Coordinación y convención Luis Miguel Miller
1. Introducción La relación entre las teorías y las investigaciones sociológicas contemporáneas y la noción de convención social puede ser calificada, hasta cierto punto, de paradójica. Mientras que resulta intuitivo situar el estudio de las convenciones sociales en el corazón mismo de la sociología, no podemos afirmar que exista una literatura sociológica extensa especializada en este tipo de regularidades sociales. A pesar de lo dicho anteriormente, uno de los mayores clásicos del pensamiento sociológico, Max Weber, no sólo incluyó la noción de convención en sus “conceptos sociológicos fundamentales” (Weber, 1964 [1922]), sino que la utilizó profusamente a lo largo de Economía y Sociedad. El propio Weber se refiere a otro clásico de la sociología, Ferdinand Tönnies, en especial a una de sus obras menos conocidas, Die Sitte (1909), como otra de las contribuciones más importantes a la caracterización del concepto de convención. De este modo, nos encontramos ante un concepto sociológico fundamental, sobre el que han insistido al menos ciertos clásicos de la sociología, pero sobre el que, en la práctica, los sociólogos contemporáneos no somos capaces de ponernos de acuerdo sobre los elementos que acotan su definición1. Sobre todo, el principal problema que se le plantea a la teoría sociológica a este respecto es la distinción entre aquellas regularidades observables en el comportamiento humano que denominamos convenciones y otras regularidades sociales, tales como las costumbres, los hábitos, los comportamientos guiados por normas morales, etc. Ante tal escenario tuvo que ser un pensador ajeno a la sociología, el filósofo analítico norteamericano David Lewis, el que, utilizando una herramienta también extraña al arsenal metodológico de la sociología clásica, la teoría de juegos, aportara una definición de convención que ha vertebrado la discusión en torno a este término en los últimos treinta años. 1
Entre los varios intentos de aproximación a la noción de convención presentes en la teoría sociológica contemporánea encontramos desde propuestas ancladas en la teoría de la elección racional (Coleman, 1990: 248), hasta intentos de aplicación de la filosofía pragmática y la sociología de Margaret Mead al estudio de las convenciones (Handel, 2003), pasando por toda una corriente heterogénea que pretende recuperar la noción weberiana de convención (Batifoulier, 2001; Favereau y Lazega, 2002; Biggart y Beamish, 2003; Orléan, 2004).
69
70
Economía, sociedad y teoría de juegos
La obra de Lewis (1969), Convention. A Philosophical Study, tuvo una repercusión importante en el conjunto de las ciencias sociales por dos motivos. En primer lugar, porque determinados autores, principalmente filósofos analíticos, sociólogos de la elección racional y teóricos económicos, aceptaron rápidamente la definición de Lewis como válida e incorporaron el concepto de convención con el significado aportado por éste 2. En segundo lugar, porque incluso los autores que se han mostrado más críticos con el planteamiento lewisiano3 han reconocido su importancia y reconstruyen la noción de convención a partir de su obra. Por tanto, el objetivo fundamental de este capítulo no es otro que el de presentar, partiendo de la propuesta de Lewis (1969), la contribución de la teoría de juegos a la definición y el estudio teórico de las convenciones sociales. Para ello, en el segundo apartado se introduce la propuesta de Lewis para dar cuenta de la primera característica de las convenciones sociales: las convenciones como regularidades de hecho en el comportamiento humano. El tercer apartado desarrolla la segunda de las características de la noción de convención que son susceptibles de ser definidas a partir de la teoría de juegos: las convenciones sociales como regularidades arbitrarias e indeterminadas. En el cuarto apartado se presenta la tercera de estas características: las convenciones como estrategias evolutivamente estables. En el quinto, se aborda la cuestión del carácter normativo de las convenciones sociales y el sexto apartado presenta las principales conclusiones de este capítulo.
2. David Lewis y las convenciones como regularidades de hecho en el comportamiento humano Una de las cuestiones en las que la teoría de juegos ha contribuido a la definición de la noción de convención es la caracterización de ésta como una regularidad social, en tanto que implica la pauta de comportamiento efectivamente seguida por una población al encontrarse ante una situación recurrente de interacción social (véanse por ejemplo, Schotter, 1981: 10; Young, 1996: 105). Así, las convenciones son pautas de comportamiento empíricamente observables. Por ejemplo, saludar por la mañana con un simple “buenos días” es la convención existente en mi centro de trabajo; ahora, si el encuentro se produce fuera del trabajo, la convención es “dar dos besos” si una de las partes es una mujer y “estrechar las manos” cuando ambas partes son hombres. Generalmente todas las reglas relacionadas con el “decoro social” y con las “buenas costumbres” son consideradas convenciones, ya que suponen la regularidad de comportamiento predominante en una situación de interacción social determinada. Pero, las convenciones no sólo se circunscriben a cuestiones relacionadas con la educación o el civismo, sino que podemos 2
No es extraño que la propuesta de Lewis (1969) fuera bastante bien acogida por los teóricos de la elección racional ya que, como veremos más adelante, su definición de convención está basada en la teoría de juegos de estrategia, especialmente en la versión de ésta que se deriva del influyente libro The Strategic of Conflict, del recientemente galardonado con el premio Nobel de Economía Thomas Schelling (1960).
3
Entre otros, Gilbert (1989), Batifoulier (2001), Favereau y Lazega (2002), Handel (2003) u Orléan (2004).
Coordinación y convención
71
encontrarlas en cualquier momento y lugar. Pensemos en el siguiente ejemplo, donde varias convenciones desempeñan un papel muy importante en el ámbito económico. Durante décadas era costumbre entre los propietarios de tierras del sur de España reclutar campesinos en la plaza del pueblo para que trabajaran en sus tierras a cambio de un jornal. No existía ningún tipo de contrato, ni era normal la existencia de una convocatoria explícita; es más, aunque el contacto entre propietarios y jornaleros se producía de forma regular en un lugar concreto —“la plaza del pueblo”— y en un momento determinado del día —“al amanecer”—, esto no implicaba que existiera ninguna obligación para las partes y cada día el encuentro podía producirse o no llevarse a cabo. Pero el hecho es que dicha pauta de comportamiento se repetía y, regularmente, tanto propietarios como jornaleros se encontraban en un mercado de trabajo que, aunque improvisado, estaba provisto de multitud de convenciones referentes a los espacios, los tiempos, los intercambios de toda índole, etc. ¿Cómo era posible la emergencia de tales regularidades sin la concurrencia de acuerdos explícitos referentes a cada una de los asuntos en cuestión? En términos generales, ésta es la pregunta que se halla en la base del trabajo de Lewis (1969). La solución que este autor propone —como veremos— requiere de la existencia de dos elementos, a saber: un precedente que marca la pauta a seguir en un problema de interacción social recurrente y conocimiento común del mismo por parte de los participantes en la regularidad que se quiere explicar. Para Lewis las convenciones emergen a partir de situaciones no triviales, es decir, situaciones que representan problemas cuya solución no es trivial —la solución no se deriva directamente de la propia estructura del problema—, como es el caso de los múltiples problemas de coordinación que tenían que resolver propietarios y jornaleros en el ejemplo introducido anteriormente. En general, los denominados problemas de coordinación representan situaciones en las que “los actores tienen intereses similares y, aunque puede no importarles qué solución será la impuesta, están de acuerdo en que algún tipo de solución es necesaria” (Wilson y Rhodes, 1997: 767). Así, tanto los propietarios de tierras, como los jornaleros no preferían encontrarse en la plaza por encima de encontrarse en el parque, por ejemplo, aunque ambos preferían, desde luego, coincidir en un punto de encuentro. Un problema similar es el que se da en cualquier mercado entre vendedores y compradores, o en cualquier mercado de trabajo entre empresarios y trabajadores. De ahí la emergencia de determinadas regularidades en el establecimiento espacial de ciertos comercios —como la presencia de firmas de moda internacionales en los Campos Elíseos de París o la concentración de empresas de tecnología punta en Silicon Valley—, o de regularidades relativas a tiempos y horarios —como la elección del domingo para montar numerosos mercadillos callejeros en España—. Este tipo de situaciones pueden ser definidas como situaciones puras de coordinación (Schelling, 1960; Lewis, 1969: 14); un tipo de situaciones donde predomina la coincidencia de intereses4. Dado este tipo de situaciones, el objetivo de Lewis es plantear que los acuerdos explícitos no suponen, desde 4
Esta “coincidencia predominante de intereses” debe ser aclarada. Cuando afirmamos que tanto propietarios como jornaleros prefieren coincidir en el punto de encuentro sólo estamos diciendo que prefieren coincidir en esto y nada se dice sobre la coincidencia o el conflicto en cualquier otro problema de interacción que pudiera surgir entre ambos grupos. Lo mismo se puede decir de compradores y vendedores, de trabajadores y empresarios, etc.
72
Economía, sociedad y teoría de juegos
un punto de vista lógico, el único mecanismo para la resolución de problemas de coordinación. Aunque está claro que un acuerdo supone la forma más directa de generar el conjunto de expectativas mutuas concordantes necesarias para la resolución de problemas de coordinación (Miller, 2007), este tipo de expectativas también pueden ser generadas a través de las convenciones, entendidas como regularidades de hecho en el comportamiento humano. Veamos esto a través de la representación formal del ejemplo de la coordinación entre propietarios y jornaleros (véase la Tabla 4.1), para, posteriormente, adentrarnos en la definición de convención aportada por Lewis (1969: 47), así como en las implicaciones de la misma.
PROPIETARIO
TABLA 4.1. Situación pura de coordinación5. JORNALERO PLAZA
PARQUE
PLAZA
1,1
0,0
PARQUE
0,0
1,1
Para simplificar, supongamos que tanto jornaleros como empresarios pueden dirigirse cada mañana a dos lugares del pueblo para ponerse en contacto: la plaza y el parque. Si ambos coinciden en alguno de estos dos lugares obtienen un pago derivado de la relación que se establece entre ambos y si no coinciden, no obtienen pago alguno. Dada esta estructura de preferencias, ambos son indiferentes entre encontrarse en la plaza o encontrarse en el parque, siempre que cada mañana esté claro dónde han de encontrarse 6. Pero, dada dicha estructura de pagos, ¿cómo podemos explicar la emergencia de una convención que suponga que la regularidad de comportamiento es encontrarse en la plaza y no en el parque? La solución aportada por Lewis a la pregunta anterior es la siguiente: los actores resuelven problemas de coordinación recurriendo al conocimiento común de un precedente que indica cuál es la solución establecida del problema en cuestión. Es decir, si un propietario quería disponer de mano de obra en un momento determinado, el hecho de reconocer un precedente, tanto si ha sido experimentado por él mismo como si le ha sido transmitido 5
Las combinaciones de estrategias que suponen un equilibrio aparecen en negrita. Este juego también tiene un equilibrio en estrategias mixtas (ENEM) en el que cada jugador elige dirigirse a la plaza con probabilidad de 1/2 y dirigirse al parque con la misma probabilidad. Como veremos más adelante, al hablar de la estabilidad de las convenciones, la interpretación de éstas como una combinación probabilística de estrategias resulta bastante problemática.
6
Alguien podría decir que el hecho de representar la relación entre propietarios y jornaleros como un juego simétrico está completamente alejado de la realidad, debido a la enorme desigualdad que en términos reales existe entre ambos. Esto no supone ningún problema para el argumento que estamos desarrollando, ya que aunque el hecho de ponerse en contacto reporte al propietario una utilidad enorme —digamos 100— y al jornalero siga reportándole 1, ambos prefieren encontrarse a dirigirse a lugares por separado.
Coordinación y convención
73
por una tercera persona, hace que sepa que la convención establecida es ir a buscar a los jornaleros a la plaza del pueblo. Además, la existencia de dicho precedente debe ser de conocimiento común entre los actores implicados del siguiente modo: el propietario debe conocer que la convención supone que los jornaleros esperan la llegada de los propietarios —o de los empleados de estos que actúan de capataces— en la plaza del pueblo, los jornaleros deben conocer también este hecho, los propietarios deben saber que los jornaleros conocen este hecho, los jornaleros deben saber que los propietarios saben que los jornaleros conocen este hecho y, así, ad infinitum 7. El supuesto de la existencia de un precedente permite a Lewis solucionar problemas de coordinación como el presentado en la Tabla 4.1. El supuesto de conocimiento común le permite dotar a la convención establecida —por el precedente— de la estabilidad propia de un equilibrio de Nash: cualquier desviación de la misma supone la obtención de un resultado subóptimo. Desviarse de la convención, en este sentido, no sólo perjudica al resto de participantes, sino que principalmente perjudica al propio actor que se desvía. De este modo, la convención supone una regularidad que se refuerza a sí misma, es útil para aquellos que participan en ella. La definición exacta que Lewis aporta es la siguiente: Una regularidad R en el comportamiento de los miembros de una población P siendo agentes en una situación recurrente S es una convención si y sólo si, en cualquier instancia de S entre los miembros de P, (1) todos se conforman con R; (2) todos esperan que todos los demás se conformen con R; (3) todos prefieren conformarse con R a condición de que los otros lo hagan, dado que S es un problema de coordinación y la conformidad uniforme con R es un equilibrio propio de coordinación en S. (Lewis, 1969: 47)
Como se observa, la definición técnica aportada por Lewis contiene los elementos que han sido introducidos intuitivamente hasta el momento. La convención es una regularidad en el comportamiento de los miembros de una población determinada, en la que: (1) no existen incentivos individuales para desviarse de la misma; por tanto, (2) todo el mundo tiene la expectativa de que el resto actuará de acuerdo con la convención; y, así, (3) la convención se convierte en una situación estable, debido a que el seguimiento de la misma —condicionado a que el resto de participantes también la sigan— supone una situación individualmente óptima, es decir, una situación de equilibrio. Las tres características de la propuesta lewisiana —convención como regularidad, existencia de un precedente y conocimiento común— han sido objeto de numerosas críticas. Aquí sólo nos vamos a referir a los aspectos más problemáticos que plantea cada una de ellas. 7
No está muy claro a quién hay que atribuir la primera formulación de la noción de conocimiento común en la historia de la teoría de juegos. Parece aceptarse que la primera caracterización informal de este concepto fue realizada por el propio Lewis (1969); aunque, el también filósofo Robert Nozick afirma que este concepto apareció por primera vez en su tesis doctoral en 1963 (véase Cubitt y Sugden, 2003). Sin embargo, la noción de conocimiento común que se ha impuesto como la estándar en la teoría de juegos es la formulación matemática de la misma realizada por Aumann (1976). Para una representación de ésta como un “sistema interactivo de creencias” véase O’Neil (2000); para una interesante representación “gráfica” del proceso de generación de conocimiento común véase Chwe (2001).
74
Economía, sociedad y teoría de juegos
La primera crítica se refiere a la afirmación por la cual una convención es una regularidad social en tanto que supone la pauta de comportamiento realmente seguida por una población al encontrarse ante una situación recurrente de interacción social. Ésta es una de las características más problemáticas de la definición de convención social asumida por los teóricos de juegos y teóricos de la elección racional en general. Así, ¿implica esta condición que para que una regularidad de comportamiento en una población de tamaño n sea considerada una convención social tiene que ser seguida por n personas? Y si la regularidad es seguida por n – 1 personas, ¿seguiríamos hablando de convención social? Sin entrar en más detalles, diremos que, en general, los defensores de esta definición de convención se conforman con un supuesto más modesto que no exige la unanimidad en el seguimiento de la convención, sino, más bien, una suerte de seguimiento mayoritario de la misma. El propio Lewis pone este hecho de manifiesto en la última de las definiciones de convención propuestas en su libro: Una regularidad R en el comportamiento de los miembros de una población P siendo agentes en una situación recurrente S es una convención si y sólo si es verdad que, y es conocimiento común en P que, en casi cualquier instancia de S entre los miembros de P, (1) casi todos se conforman con R; (2) casi todos esperan que casi todos los demás se conformen con R; (3) casi todos tienen aproximadamente las mismas preferencias en relación con todas las posibles combinaciones de acciones; (4) casi todos prefieren que cualquier otro se conforme con R, a condición de que casi todos los demás se conformen con R; (5) casi todos preferirían que cualquier otro se conforme con R', a condición de que casi todos se conformen con R', donde R' es alguna regularidad posible en el comportamiento de los miembros de P en S, tal que casi ninguno en casi ninguna instancia de S entre los miembros de P podría conformarse con ambas R' y R. (Lewis, 1969: 78)
Con esta nueva definición, Lewis se adelanta a algunos de los autores que años más tarde han criticado su concepción de las convenciones como regularidades: no es necesario la conformidad unánime con la convención para que ésta sea considerada como tal. Sin embargo, la insistencia de igualar convención a regularidad de comportamiento sigue dejando una cuestión abierta: ¿cómo es posible que la simple expectativa de que un fenómeno aparezca con cierta regularidad genere automáticamente la adhesión y la conformidad de los miembros de una población? La respuesta que Lewis daría a esta pregunta podría ser la siguiente: porque está en su interés (porque es útil, porque supone un equilibrio). Para que esto sea posible Lewis necesita el que ahora se ha convertido en el supuesto (3) de su definición: que todo el mundo tenga aproximadamente las mismas preferencias, es decir, que nos encontremos aproximadamente ante una situación pura de coordinación como la descrita en la Tabla 4.1. Pero intuitivamente no está claro que esto tenga necesariamente que ser así. Más bien parece que se trate de una cuestión susceptible de ser abordada empíricamente, que de un supuesto teórico. Gilbert (1989: 342) se muestra contundente a este respecto: “las convenciones sociales, concebidas intuitivamente, pueden cubrir situaciones de toma de decisiones interdependientes que no suponen problemas [puros] de coordinación como los definidos por Lewis”. Por tanto, necesitaremos de algo más que de regularidades predecibles de comportamiento para dar cuenta de la fuerza vinculante que intuitivamente parecen tener las convenciones sociales, ya que “... si las convenciones sociales no tienen por qué cubrir lógicamente los problemas [puros] de
Coordinación y convención
75
coordinación, su necesario aspecto normativo difícilmente puede ser expresado en los términos de dicha estructura subyacente” (Gilbert, 1989: 355). La segunda crítica al planteamiento de Lewis se refiere al argumento por el que la convención queda establecida por la existencia de un precedente. El problema en sí no es que no seamos capaces empíricamente de correlacionar la existencia de una regularidad actual con la presencia de un precedente en el pasado, ni que no podamos trazar la línea que une ambos fenómenos, el problema surge cuando nos preguntamos por el cómo y el cuándo de la emergencia del precedente, sin caer en una regresión hasta el infinito, donde cada precedente quedaría justificado por la existencia de un precedente anterior. Hay que tener en cuenta que, en el lenguaje de Lewis, un precedente supone solamente un caso específico de un mecanismo psicológico más general denominado “prominencia” (salience). Decimos que un equilibrio —combinación de estrategias— es prominente cuando “sobresale del resto por su singularidad en algún aspecto conspicuo” (Lewis, 1969: 35). Este recurso explicativo a la prominencia es bastante frecuente en la teoría de juegos contemporánea. Cuando no se sabe muy bien cómo dos actores han logrado coordinar sus estrategias de forma satisfactoria es frecuente recurrir al argumento de que el equilibro alcanzado es prominente, o lo que es lo mismo, que constituye un punto focal. Pero, como ha señalado Gilbert (1989: 334): “dentro del marco de la teoría de juegos el supuesto de que algún punto es prominente no nos lleva a ningún lugar. Es decir, no lleva el razonamiento de los actores hacia la siguiente conclusión: actúa de esta forma”. Por tanto, la vinculación de la existencia de la convención a la existencia de un precedente, aunque intuitivamente plausible, nos conduce directamente a un argumento teórico vacío de contenido. La tercera crítica al planteamiento lewisiano en la que nos vamos a detener en este momento es la necesidad de la existencia de conocimiento común entre los participantes en la convención. En realidad, una vez puesto en duda el argumento de la convención basada en un precedente, el supuesto de conocimiento común no tiene tanto sentido en el planteamiento de Lewis, ya que la función del supuesto de conocimiento común aquí es la de perpetuar una combinación de estrategias que han surgido a partir del reconocimiento común de la existencia de un precedente que establece cuál es la convención en una situación de interacción social concreta. Un segundo problema más de fondo es lo que Latsis (2005: 718) denomina falacia del modelo mental, que implica que “para que se genere una convención, un agente debe conocer, o ser consciente de lo que él o ella está haciendo”. No parece que nuestra experiencia cotidiana de las convenciones implique que seamos capaces de ser conscientes de las mismas en todo momento. Por tanto, el supuesto de conocimiento común deberá ser, cuando menos, relajado. La referencia a la obra de Lewis nos ha permitido poner la primera piedra de la reconstrucción de la noción de convención apoyada en la teoría de juegos. Como se deduce de las críticas realizadas a la propuesta lewisiana, ésta no es definitiva y no agota la reflexión en torno al término convención, pero sí que aporta algunos elementos que son dignos de mención. Entre estos elementos, cabe destacar: la convención como regularidad, la interpretación de la misma como un equilibrio en un juego de coordinación y un mecanismo explicativo basado en el conocimiento común de un precedente, el cual ha sido puesto en duda por autores posteriores. En el siguiente apartado avanzaremos en la reconstrucción de la noción de convención social a partir de otra de las características fundamentales de las mismas: el carácter arbitrario e indeterminado de las convenciones sociales.
76
Economía, sociedad y teoría de juegos
3. Las convenciones sociales como regularidades arbitrarias e indeterminadas La corriente principal de la teoría de juegos, al menos desde el trabajo seminal de von Neumann y Morgerstern (1947), ha concentrado sus esfuerzos en plantear los juegos como interacciones estáticas entre jugadores perfectamente racionales, en un entorno en el que la función de utilidad y el comportamiento racional de cada uno de los jugadores son de conocimiento común. Dicho intento analítico está encaminado a la persecución de un objetivo claro y preciso: mostrar que el análisis racional prescribe una única estrategia para cada jugador en un juego determinado (Sugden, 1989: 88). Sin embargo, esta estrategia analítica, cuyo máximo exponente es el trabajo conjunto de los premios Nobel Harsanyi y Selten (1988), se ha visto seriamente obstaculizada por la dificultad que entraña analizar situaciones donde el puro análisis de las acciones racionales de los jugadores no conduce a una solución única 8. Como ya hemos visto, cuando la interacción entre dos o más jugadores perfectamente racionales da lugar a más de una solución en potencia, nos encontramos ante los denominados problemas de coordinación. En general, los problemas o juegos de coordinación, como señalábamos en el apartado anterior, representan situaciones en las que varios actores tratan de alcanzar uniformidad en sus acciones haciendo cada uno lo que espera que haga el resto. Más arriba utilizábamos como ejemplo la coordinación espacial y temporal entre propietarios de tierra y jornaleros en el mundo rural. A continuación, seguiremos avanzando en la construcción de la noción de convención social a través de uno de los ejemplos más recurrentes en la literatura sobre el tema: la coordinación en el sentido de la conducción. Supongamos que estamos conduciendo por una carretera comarcal donde no existe separación entre carriles en alguna provincia española y que nos encontramos de frente con otro coche que se aproxima hacia el nuestro. Existe el espacio justo para que, a duras penas, puedan pasar dos coches al mismo tiempo. ¿Por qué lado de la vía deberíamos conducir? En España conduciríamos por la derecha, esperando que el otro conductor haga lo mismo. Pero, ¿cuál es la fuente de dicha expectativa? Si no se tratara de una situación real, sino de una situación puramente ideal, atemporal y descontextualizada, como suelen ser representadas en la teoría de juegos estándar (véase la Tabla 4.2), cualquier elemento que permitiera a ambos conductores coordinar sus expectativas cumpliría la función de resolver una situación que desde un punto de vista formal resulta irresoluble. Tanto es así que, si en vez de tratarse de dos conductores circulando por una carretera comarcal española, se tratara de dos conductores irlandeses conduciendo por una carretera de su país, ambos elegirían circular por la izquierda con la misma naturalidad que nosotros lo hacemos por la derecha. 8
Aunque el propósito analítico de la corriente principal de la teoría de juegos ha perseguido el objetivo de la definición de una única solución racional para cada juego, incluso los padres fundadores de la misma asumían que, más allá del análisis teórico-ideal, en la práctica, esta empresa no era posible. Así, “von Neumann y Morgerstern sostuvieron que cuando quiera que existe más de una solución teórica a un juego, la solución que es realmente alcanzada depende de normas y convenciones (o, como ellos lo expresaron, de los ‘estándares de comportamiento’) en la comunidad a la que los jugadores pertenecen” (Luce y Raiffa, 1957: 205, 219; Ullmann-Margalit, 1977: 15).
Coordinación y convención
77
Como ocurría con el ejemplo del encuentro entre propietarios de tierra y jornaleros, cada una de las soluciones del juego representado en la Tabla 4.2 supone una convención en potencia y aquella que es la predominante en un espacio social determinado —circular por la derecha en España— será la convención establecida.
CONDUCTOR B
TABLA 4.2. Juego de la conducción9. CONDUCTOR A
IZQUIERDA
DERECHA
IZQUIERDA
1,1
–1,1
DERECHA
–1,1
1,1
Esta es la forma más simple de dar cuenta de la noción de convención social que podemos encontrar: en una situación social donde existe una multiplicidad de pautas de comportamiento posibles, la convención supone aquella que es seguida en la práctica. Ejemplos recurrentes de convención en este sentido son el hecho de adherirse a un determinado modo de vestir —como vestir de negro en un funeral—, la utilización de palabras con su significado convencional o numerosos aspectos relacionados con el mercado y la actividad económica, tales como el uso de distintos tipos de dinero, el uso de estándares industriales y tecnológicos o las reglas de contabilidad10. Los teóricos de juegos han empleado el concepto de arbitrariedad (arbitrariness) para hacer referencia a esta característica de las convenciones que implica que cada convención supone sólo una de las múltiples regularidades de comportamiento que pueden emerger a partir de una determinada situación de interacción social. Por ejemplo, Binmore (1994: 290) afirma: “Afortunadamente, las sociedades humanas tienen abundantes convenciones [...]. En puridad, estas convenciones son completamente arbitrarias. La gente no queda en el ‘punto de reunión’ de un aeropuerto porque piensa que allí la reunión será más placentera, sino porque es convencional hacerlo. Lo mismo se puede decir de otras convenciones como ‘circular por la derecha’ o ‘poner cosas en orden alfabético’”. Otras referencias explícitas al carácter arbitrario de las convenciones pueden ser encontradas en Lewis (1969: 70) y en Coleman (1990: 248), entre otros. 9
Como en la Tabla 4.1, los equilibrios aparecen resaltados en negrita. Este juego también tiene un equilibrio en estrategias mixtas (ENEM) similar al del juego de la Tabla 4.1. Véase el comentario sobre el mismo en la nota 5.
10
El éxito de mercados alegales, como la prostitución, o directamente ilegales, como el tráfico de drogas, sólo puede ser entendido a partir de la compresión de las numerosas convenciones en que se sostienen. Por ejemplo, existen convenciones acerca de cómo ponerse en contacto con un vendedor de droga al por menor, sobre cómo negociar el precio de la misma con él e incluso sobre el tipo de lenguaje que se ha de utilizar. Al no tratarse de un mercado regulado, parece evidente que las convenciones desempeñan un papel fundamental en la articulación de los conocimientos tácitos de los participantes en este tipo de transacciones económicas.
78
Economía, sociedad y teoría de juegos
Las convenciones son arbitrarias en el sentido de no ser necesarias, como arbitrarias son las normas legales o la propia moral de cada grupo social. Por tanto, a pesar de lo que parece deducirse de buena parte de la teoría económica que se ha preocupado de las convenciones, la arbitrariedad no es una característica distintiva de las mismas. En todo caso, podríamos decir que las convenciones tienen un rango limitado de arbitrariedad, en el sentido de que, aunque podemos imaginar convenciones alternativas a una convención establecida, el número de éstas no suele ser ilimitado. Así, la convención alternativa a “conducir por la derecha” sería “conducir por la izquierda”, la alternativa al saludo mediante dos besos en España sería la convención de dar tres besos en Francia o la de dar uno en Estados Unidos. Por tanto, afirmar, como hace Binmore, que las convenciones son “completamente arbitrarias” tampoco parece lo más correcto. En realidad, como ya hemos señalado anteriormente, cuando Binmore y otros teóricos hacen referencia al carácter arbitrario de las convenciones sólo están poniendo el énfasis en la existencia de convenciones alternativas a la convención establecida. En este sentido sería más apropiado hablar del carácter indeterminado de las convenciones sociales. Su propia condición de soluciones estables a problemas de coordinación y, por tanto, la multiplicidad de soluciones potenciales a estos, hacen que no podamos predecir teóricamente cuál es la convención que se establecerá en un contexto social determinado. En definitiva, el problema de qué convención emergerá como solución a un problema de coordinación concreto nos remite a una cuestión eminentemente empírica. El carácter arbitrario de las convenciones hace que éstas aparezcan como el producto de una historia determinada y que, cuando nos disponemos a dar cuenta de la emergencia, la evolución o el ocaso de una convención concreta no podamos separar ésta de las condiciones históricas particulares en las que se dan estos procesos. Sin embargo, en la teoría de juegos el único elemento que remite a este concepto de arbitrariedad es la representación de las convenciones a partir de problemas de coordinación, de lo que se deduce que cada convención establecida presupone, por definición, la existencia de al menos otra convención en potencia, una regularidad “alternativa a la convención”, en palabras de Lewis (1969: 68). Hasta el momento, a través del recurso a los problemas de coordinación, hemos intentado argumentar en qué sentido una convención como regularidad de comportamiento tiene un rango limitado de arbitrariedad y es indeterminada por definición. También, al menos indirectamente, hemos planteado por qué una convención, una vez establecida como regularidad de hecho en el comportamiento social, se refuerza a sí misma. Así, tanto en la Tabla 4.1 como en la Tabla 4.2, cualquier desviación unilateral de la convención conduce a una situación individualmente subóptima, por lo que podemos afirmar que la propia estructura de la situación ofrece incentivos suficientes para que no sea necesaria ninguna intervención externa que haga efectiva la conformidad con la convención. Sin embargo, lo que todavía no ha quedado muy claro es cómo emergen las convenciones y cómo evolucionan hasta convertirse en regularidades de comportamiento aceptadas por la mayoría de la sociedad. ¿Puede la teoría de juegos proporcionarnos un modo de explicar por qué entre todas las convenciones en potencia sólo una es la convención establecida? Como ya hemos avanzado, el intento de la teoría de juegos más estándar ha sido infructuoso en este sentido. Ha tenido que ser una alternativa teórica a ésta, la teoría de
Coordinación y convención
79
juegos evolutiva, la que ha permitido avanzar en la comprensión de los mecanismos que hacen que una determinada regularidad de comportamiento se convierta en una convención. En concreto, como argumentaremos a continuación, la teoría de juegos evolutiva nos permite plantear sendas respuestas (seguramente sólo provisionales) a tres preguntas que se derivan de lo dicho hasta el momento, a saber: (1) ¿bajo qué condiciones surgen las convenciones sociales?, (2) ¿cómo evolucionan las convenciones sociales?, y (3) ¿por qué son estables las convenciones sociales?
4. Las convenciones como regularidades estables Interpretar las convenciones a partir de la interacción de individuos perfectamente racionales nos ha llevado al problema teórico de encontrarnos con varias soluciones formales a una situación donde sólo existe una en la práctica. Una alternativa sería considerar las convenciones a partir de las limitaciones que tiene la teoría de juegos para abordar problemas no triviales. ¿Es posible avanzar hacia un modelo explicativo que sitúe a las convenciones más como una solución a un problema que como el problema mismo? Por otro lado, si no se afronta el problema de la emergencia y la evolución de las convenciones sociales, el planteamiento estaría muy cerca de un argumento funcionalista ad hoc que explicara cada convención simplemente como la mejor solución a cada problema de coordinación social concreto. Para no caer en dicha falacia explicativa, los teóricos de juegos han adoptado la perspectiva de la teoría de juegos evolutiva para modelar la emergencia de las convenciones sociales11. El trabajo de Sugden (1986) fue el primero en utilizar herramientas importadas de la biología evolutiva con el objetivo de definir las convenciones como soluciones o equilibrios estables en problemas de coordinación12. A continuación, describiremos 11
Es obvio que no todas las convenciones sociales son el resultado de un largo proceso evolutivo. En multitud de ocasiones es una autoridad central la que determina cuál es la convención. Por ejemplo, después de la Revolución Francesa, los revolucionarios establecieron nuevas convenciones en relación con las unidades de peso y medida (el sistema métrico) e inventaron un nuevo calendario, con nuevos períodos de vacaciones y el cambio de la semana de siete días por una “década” de diez días (Chwe, 2001: 23). Sin embargo, una convención puede convertirse en una pauta de comportamiento social tan estable que hasta el gobierno más autoritario del mundo tendría dificultades en cambiarla. Al menos, eso es lo que tuvo que pensar el gobierno comunista chino en plena revolución cultural, tal y como queda descrito en la narración de Kristof y Wudunn (1994: 70): “Durante un tiempo, se obligó a los coches a avanzar con las luces [de los semáforos] en rojo y a detenerse con las luces en verde, debido a que el rojo era un color revolucionario sinónimo de acción. Dicho plan fue retirado cuando, al no llegar el mensaje a un número suficiente de conductores, se produjeron accidentes múltiples en los principales cruces”.
12
No es éste el lugar para repasar las aplicaciones de la teoría de juegos a la biología, ni de cómo a partir de ésta un buen número de economistas han incluido las explicaciones de corte evolutivo en su arsenal teórico. Sobre esto segundo sí que se darán algunas pinceladas en las páginas siguientes. A propósito de la teoría de juegos evolutiva, véase el texto clásico de Maynard Smith (1982) o el más reciente de Weibull (1995).
80
Economía, sociedad y teoría de juegos
intuitivamente cómo la teoría de juegos evolutiva modela las convenciones sociales. Para ello, consideremos el siguiente ejemplo. Cuando tomamos el autobús o el metro, entramos en un cine o un teatro donde los asientos no están numerados o intentamos comprar algo en una tienda abarrotada de clientes, generalmente respetamos una regla no escrita que dice que la prioridad sobre recursos escasos es asignada según el orden de llegada. Así, por ejemplo, si el autobús dispone de veinte asientos, sólo los veinte primeros viajeros que accedan al mismo tendrán derecho a sentarse. Para comprender cómo dicha regla no escrita, o convención social, puede emerger en una situación determinada consideraremos la situación más simple, una situación en la que sólo existe un asiento y dos viajeros dispuestos a sentarse en el mismo. La estructura de dicho problema es similar a un problema de negociación como el representado en la Tabla 4.3. TABLA 4.3. Situación de negociación.
VIAJERO B
VIAJERO A SENTARSE
CEDER EL ASIENTO
SENTARSE
–2, –2
2,0
CEDER EL ASIENTO
0,2
1,1
Ante tal situación, cada viajero puede elegir entre dos estrategias posibles: proceder a “sentarse” en el único asiento disponible o “ceder el asiento” a la otra persona. Si ambos muestran una clara intención de sentarse, el resultado de la interacción entre ambos será una disputa que, independientemente del resultado que produzca, supondrá un pago negativo para ambos jugadores. Si sólo uno reclama el asiento, y el otro cede, el primero recibirá la mayor utilidad posible en este juego, mientras que el segundo no recibirá utilidad alguna. Si ambos deciden no sentarse reciben una utilidad intermedia, inferior a la utilidad de ocupar el asiento, pero superior a la resultante de verse implicado en una disputa por el mismo. A continuación, presentaremos brevemente cómo dicho juego puede ser interpretado en términos evolutivos. Sea UE (I, J) la utilidad esperada de un jugador de usar la estrategia I cuando el otro jugador utiliza la estrategia J. La estrategia I es una estrategia evolutivamente estable (EEE) cuando se cumplen las dos condiciones siguientes: • UE (I, I) tUE (J, I) para toda estrategia J • o UE (I, I) tUE (J, I), o bien UE (I, J) tUE (J, J) La primera condición, o condición de equilibrio, se corresponde con el concepto de equilibrio de Nash utilizado por la teoría de juegos estándar. Este juego tiene tres equilibrios. Dos de ellos son equilibrios en estrategias puras, es decir situaciones en las que cada jugador emplea cierta estrategia con certeza. En el juego de la Tabla 4.3 dichos equilibrios se corresponden con situaciones en las que uno de los jugadores elige la estrategia “sentarse” y el otro la estrategia “ceder el asiento”. Además, existe un tercer equilibrio, el denominado equilibrio en estrategias mixtas, en el que la estrategia
Coordinación y convención
81
“sentarse” es seleccionada con probabilidad de 1/3. Teóricamente, cualquiera de los tres equilibrios puede ser la solución real del juego13. La segunda condición, o condición de estabilidad, garantiza que una población que sigue la estrategia I no será satisfactoriamente invadida por otra población que emplee una estrategia distinta. Ésta es la condición genuinamente evolutiva e implica que una estrategia evolutivamente estable ha de ser la mejor respuesta a sí misma en relación con el conjunto de estrategias disponibles. La intuición que se halla detrás de esta condición es que una población alcanzará en su seno, a través de un largo proceso de prueba y error, una distribución de estrategias estable, en el sentido de que es resistente a la introducción de comportamientos diferentes a los ya presentes en dicha población. En otras palabras, si una distribución de estrategias cumple esta segunda condición, la situación resultante estará preparada para no dejarse invadir por las posibles “mutaciones” en el comportamiento que se produzcan en pequeños grupos dentro de la misma14. La teoría de juegos evolutiva modela situaciones, como la representada en la Tabla 4.3, en las que los individuos de una población interaccionan por parejas de forma aleatoria. En principio, estos individuos no saben qué estrategia emplear y, de este modo, comienzan utilizando una estrategia o una combinación probabilística de estrategias y van ajustando paulatinamente sus comportamientos mediante un proceso de aprendizaje. Los equivalentes de la selección natural cuando nos referimos al comportamiento social son la imitación y el aprendizaje. Esto tiene implicaciones importantes a la hora de pensar en el período de tiempo necesario para que una convención emerja o “mute”; cuando hablamos de “evolución social” o de “evolución cultural” no es necesario pensar en los términos de la “evolución biológica” o “genética”, sobre todo porque, según afirma la mayoría de biólogos evolutivos, la estructura genética del ser humano apenas se ha modificado desde las sociedades de cazadores y recolectores. “En la ‘evolución cultural’, la reproducción se produce a través de la formación de roles, de la instrucción, de la influencia social, de la imitación y del refuerzo delegado [en otras personas]” (Macy, 1997: 437). La evolución de situaciones como la representada en la Tabla 4.3 y la emergencia de convenciones sociales en las mismas pueden ser caracterizadas de dos modos: a través de un proceso de evolución simétrica o de evolución asimétrica. En un proceso evolutivo simétrico la población converge hacia una situación en la que todos los individuos 13
El equilibrio de Nash en estrategias mixtas (ENEM) puede ser interpretado de dos modos distintos. En primer lugar, la teoría de juegos más estándar lo interpreta como una situación en la que cada jugador, individualmente, emplea una combinación de estrategias. Así, una persona que se encontrara de forma repetida con el juego de la Tabla 4.3, elegiría “sentarse” en un tercio de las ocasiones y “ceder el asiento” en el resto. Una segunda interpretación, quizá más realista, propia de la teoría de juegos evolutiva, es interpretar el ENEM como una distribución de estrategias dentro de una población. En este caso, deberíamos interpretar la situación de equilibrio como una en la que un tercio de la población elige “sentarse” y dos tercios “ceder el asiento”. Esta última interpretación es la que parece estar imponiéndose como la interpretación más aceptada en el seno de la teoría de juegos.
14
No es extraño que uno de los campos donde se está intentando aplicar la teoría de juegos evolutiva sea la evolución y el cambio de las convenciones sociales en ámbitos geográficos que reciben un volumen importante de inmigración. Sobre la coexistencia de diferentes convenciones en el corto y en el largo plazo, véase Bhaskar y Vega Redondo (2004).
82
Economía, sociedad y teoría de juegos
emplean la misma estrategia o combinación probabilística de estrategias. En nuestro ejemplo, el proceso convergería hacia la solución siguiente. Sea p la probabilidad de encontrarse con un individuo que sigue la estrategia “sentarse”. De aquí se deduce: UE(sentarse) = p(–2) + (1 – p)2 = 2 – 4p (1) UE(ceder) = p(0) + (1 – p)1 = 1 – p (2) Dadas las ecuaciones (2.1) y (2.2), cada individuo encuentra más beneficioso seleccionar la estrategia “sentarse” cuando que
y “ceder el asiento” cuando
. Diremos
es EEE, ya que, al tratarse de uno de los equilibrios del juego cumple la primera
condición y, además, es la única estrategia que cumple la segunda condición. La solución propuesta no parece muy realista en ninguna de sus dos posibles interpretaciones, a saber: bien existe un tercio de la población que siempre reclama su derecho a sentarse y dos tercios que siempre ceden el asiento, o bien cada individuo reclama el asiento en un tercio de las ocasiones y lo cede dos tercios de las veces. En realidad, la situación es poco realista porque obvia una de las características más relevantes de la interacción social: la presencia de asimetrías. ¿Tiene sentido en la situación descrita tener presente las posibles asimetrías existentes? ¿Y qué resultado depararía la evolución si consideráramos una situación asimétrica? En el ejemplo simple representado en la Tabla 4.3 es posible introducir una asimetría que se observa en la realidad. Supongamos que nos encontramos en una población cargada de estereotipos de género y que, como consecuencia, en el ejemplo que estamos utilizando, se pueden detectar dos comportamientos distintos, según el sexo de los individuos. Supongamos que el viajero A es una mujer, mientras que el viajero B es un hombre. Ahora nos encontramos ante un juego asimétrico, fruto de la introducción de un elemento ajeno a la información contenida en la matriz del juego: el tipo o rol de los participantes en el mismo. En un juego asimétrico, los jugadores aprenden a diferenciarse y a asignar a cada persona un rol diferente. A partir de dicho momento se produce un aprendizaje específico de rol. En este sentido, el enunciado de una estrategia en este tipo de juegos debe incluir la estrategia prescrita para cada rol, por ejemplo: “si eres jugador del tipo B juega X; si eres jugador del tipo A juega Y.” Veamos a qué resultado conduce este aprendizaje específico de rol. Sea p la probabilidad de que el jugador con rol B juegue “sentarse” y sea q la probabilidad de que el jugador con rol A juegue “sentarse”. Del mismo modo, sea E(X/K) el pago esperado para un jugador con la característica K al elegir la estrategia X. De aquí se deduce que: (3) (4) (5) (6) De las ecuaciones anteriores se deriva que de los tres equilibrios que tiene el juego de la Tabla 4.3, sólo dos son estables en una situación de evolución asimétrica como la
Coordinación y convención
83
descrita. Los dos equilibrios en estrategias puras son estables debido a que la mejor respuesta ante un individuo que elige la estrategia “sentarse” es “ceder el asiento” y viceversa. Sin embargo, el ENEM, en un escenario asimétrico, viola la segunda de las condiciones que debe cumplir una estrategia evolutivamente estable, ya que podría ser invadido por cualquier otra combinación de estrategias. En otras palabras, cualquier otra combinación de estrategias es al menos tan buena como la prescrita por el ENEM. El concepto de EEE a partir de un juego asimétrico parece acercarse más a la noción cotidiana de convención. Así, la convención “ceder el asiento a una mujer” cumple los requisitos formales de una estrategia evolutivamente estable. El problema es que la teoría no nos había prescrito sólo dicha estrategia, ya que también la convención “ceder el asiento a un hombre” sería evolutivamente estable según lo argumentado hasta el momento 15. Hasta aquí es hasta donde la teoría de juegos evolutiva puede ayudarnos a comprender el origen y la evolución de las convenciones: nos proporciona las condiciones mínimas que requiere una convención para sobrevivir a las fuerzas evolutivas. Sin embargo, no nos ofrece un argumento sólido acerca del porqué del establecimiento de una convención determinada a partir del conjunto de convenciones que serían evolutivamente estables. Para explicar por qué nos coordinamos en una convención y no en otra, la teoría de juegos, y aquí también tenemos que incluir su versión evolutiva, se ve obligada a recurrir a elementos ajenos a la teoría, tales como los conceptos de prominencia o punto focal, como veíamos anteriormente. Por ejemplo, la convención “ceder el asiento a una mujer” podría haber evolucionado a partir de la analogía con otro tipo de situaciones sociales en las que también se asigna prioridad en el uso de recursos a las mujeres, como al atravesar una puerta o al servir los platos a los comensales en una cena16. Pero también alguien podría haber comenzado a realizar tal práctica y haberse extendido a través de un proceso de “bola de nieve”. Por ejemplo, recordemos la práctica regular de los propietarios de tierra del sur de España de recoger a los jornaleros en la plaza del pueblo para que trabajaran en sus tierras a cambio de un jornal. Pues bien, si buscamos dicha regularidad en las mismas zonas rurales en la actualidad vemos que, si bien la práctica sigue existiendo, los grupos sociales que toman parte en ella han cambiado. Actualmente los propietarios ya no reclutan a jornaleros autóctonos, sino que reclutan a inmigrantes, sobre todo magrebíes. ¿Se ha producido una transmisión de conocimiento de los campesinos autóctonos del sur de España a los inmigrantes? Si es así, ¿cuál es la forma concreta que adopta dicha transmisión? La teoría de juegos evolutiva todavía nos aporta pocas soluciones a este tipo de cuestiones. Además, al menos por el momento, cualquier conjetura de este tipo se escapa de la propia teoría, por lo que ésta no nos aporta una explicación última de la regularidad que observamos. Por tanto, no es aventurado concluir que aunque la teoría de juegos nos ofrece las herramientas adecuadas para representar el escenario de condiciones necesario para la emergencia de las convenciones sociales, dar cuenta de éstas en toda su complejidad requerirá de algo más. 15
El hecho de que ambas regularidades sean evolutivamente estables nos recuerda de nuevo el carácter arbitrario e indeterminado de las convenciones. Del mismo modo que podríamos tachar de arbitraria la convención de ceder el asiento a una persona “de raza blanca” en los Estados Unidos de mitad del siglo XX.
16
El recurso explicativo a la presencia de analogías ha sido ampliamente empleado por Sugden (1986; 1989).
84
Economía, sociedad y teoría de juegos
Ese algo más necesario para explicar por qué una convención concreta, de entre todas las convenciones posibles, acaba perpetuándose en el tiempo nos remite a la pregunta de por qué cada individuo se conforma con cada convención social que observamos en la realidad social. En otras palabras, nos conduce a preguntarnos por el carácter normativo de las convenciones sociales.
5. El carácter normativo de las convenciones sociales Si bien todas las definiciones de lo que hemos denominado convención social coinciden en las tres características mencionadas anteriormente —regularidad de hecho, arbitrariedad y estabilidad— no todas coinciden en la justificación última de la conformidad con la convención por parte de los participantes en la misma. Por ejemplo, mientras que en la definición de Lewis (1969: 47) citada anteriormente los agentes tienen una preferencia por la conformidad con la convención —eso sí, condicionada a la conformidad del resto—, Sugden (1986: 33) rechaza plenamente esta necesidad. Mientras que Lewis (1969: 14) afirma que su análisis de las convenciones se concentra en “situaciones en las que predomina la coincidencia de intereses” 17, la mayor parte de los ejemplos empleados por Sugden (1986; 1989) remiten a situaciones mixtas donde se da tanto la coincidencia como el conflicto de intereses. Aquí se puede ver como el tratamiento que ha dado la teoría de juegos a la emergencia y la evolución de las convenciones sociales ha derivado en distintas interpretaciones. Así, no es difícil encontrar coincidencia de intereses si pensamos en situaciones que responden al orden de preferencias de los juegos de las tablas 4.1 y 4.2, tales como: multitud de convenciones en la carretera, la utilización de signos convencionales para coordinarnos, la definición de un punto convencional de encuentro, etc. Sin embargo, si pensamos en situaciones como la representada en la Tabla 4.3, está claro que aquí los intereses no sólo son diferentes, sino en multitud de ocasiones contrapuestos. Pero, ¿por qué es importante determinar la relación entre los intereses de los actores participantes en la convención? Pues porque de ella dependerá la fuente de legitimidad y la aceptación de la misma y, por tanto, el modo en el que los actores individuales conforman su comportamiento a la convención. Por ejemplo, si la convención establecida en un centro de trabajo es acudir cada mañana con un atuendo correcto, pero informal, uno no gana nada desviándose de la misma vistiendo con ropa deportiva o con esmoquin. Por el contrario, si la convención establecida en el mismo centro es que la antigüedad en el mismo determina la posibilidad de acceder a mejores condiciones de trabajo, uno, como joven titulado, podría estar interesado en que la convención fuera, por ejemplo, que los más cualificados accedieran a dichas mejores condiciones. En este último caso la conformidad con la convención es más problemática. Si se produce la misma más que 17
A continuación, explica desde un punto de vista técnico a qué se refiere con este predominio de la coincidencia de intereses, a saber: “las diferencias entre los pagos de los agentes en cualquier casilla [combinación de estrategias] son pequeñas comparadas con las diferencias entre los pagos de distintas casillas [distintas combinaciones de estrategias]” (Lewis, 196: 14).
Coordinación y convención
85
de conformidad hablaríamos de conformismo; es decir, aceptar sin más una convención que va contra nuestros propios intereses o, al menos, aceptarla a sabiendas de la existencia de una convención que pudiera satisfacer mejor las preferencias propias18. Varios autores han ligado el problema del conformismo con la emergencia de las convenciones, en general, y con la generación de éstas a partir de problemas de coordinación social, en particular. Para Ullmann-Margalit (1977: 93), “un conformista es alguien que considera la mayoría de las situaciones [...] como si fueran problemas de coordinación” 19. Esto es, el conformista en vez de elegir su opción preferida, elige aquella que considera que va a ser elegida por los demás. En este sentido, las convenciones suponen, en cierto modo, un ahorro considerable de costes cognitivos para los conformistas: les informan acerca de la acción que es probable que siga la mayoría de un grupo en un entorno social concreto. No nos detendremos en profundizar más aquí sobre conformidad y conformismo, ya que ambos conceptos sólo tocan tangencialmente el tema central de este capítulo. De todos modos, volviendo a Ullmann-Margalit (1977: 96), esta aproximación al conformismo puede suponer el camino contrario “de un procedimiento bastante común en las ciencias sociales, donde muchas discusiones que tratan en apariencia sobre normas sociales, se deslizan directamente hacia discusiones sobre conformismo.” Lejos de establecer un vínculo directo y necesario entre normas y convenciones, por una parte, y conformismo, por otra, esperamos que esta breve discusión acerca de uno de los mecanismos que se pueden hallar tras el acto social del conformismo sirva para repensar éste desde el punto de vista de las acciones de los individuos. Más allá del fenómeno del conformismo, la cuestión de la coincidencia o no de intereses en los problemas de coordinación que se encuentran en la base de la emergencia de las convenciones sociales es importante por un segundo motivo: el carácter normativo de las convenciones sociales. En primer lugar, cabe preguntarse por qué merece la pena recurrir a argumentos normativos para explicar comportamientos que son óptimos desde un punto de vista individual —dado el comportamiento esperado del resto de individuos— y, por tanto, gozan de un refuerzo intrínseco —suponen equilibrios en el lenguaje de la teoría de juegos. Ullmann-Margalit (1977: Cap. 3) ofrece tres argumentos de peso: (1) “Una norma es capaz de regular y canalizar las expectativas [...] de participantes anónimos.” Por ejemplo, supongamos que en nuestra empresa existe la siguiente norma 18
Con respecto al ejemplo de una convención establecida en la que chocaran los intereses de jóvenes y no tan jóvenes uno podría recurrir para su aceptación a argumentos de tipo intertemporal, como el siguiente: asumiendo que en t+1 dicha convención me va a beneficiar, me conformo con ella en t. No diremos mucho aquí en contra de dicho argumento, aunque creemos que sólo supondría una justificación más para conformarse efectivamente con la misma.
19
Aunque la metáfora es sugerente, la propia Ullmann-Margalit señala que el conformista no afronta un problema de coordinación como los que se han introducido anteriormente, sino lo que podría ser denominado como un problema de coordinación unilateral, es decir, sólo afrontado por aquel que conforma su comportamiento al de los demás, sin necesidad de que ocurra a la inversa.
86
Economía, sociedad y teoría de juegos
de coordinación 20: ante la limitación de plazas de aparcamiento propiedad de la empresa, dichas plazas serán ocupadas por los empleados mediante un sistema de turnos. Sólo la existencia de una norma que regule esta actividad garantiza que los nuevos trabajadores que se incorporen a la empresa puedan aprender el significado concreto de esta pauta de comportamiento. (2) “Mientras una regularidad extraída de eventos pasados podría ser continuada de más de una forma, una norma proporcionará el principio de continuidad que resolverá las posibles ambigüedades en la mayoría de situaciones futuras”. En el ejemplo anterior, la norma es necesaria para regular las acciones individuales de forma correcta; por ejemplo, la norma podría indicar cuántas semanas en un período de tres meses uno puede utilizar una plaza. (3) “Existe un mayor nivel de articulación asociado con una norma que con una mera regularidad de comportamiento”. Debido al hecho de que una norma puede ser transmitida y explicada, la presión grupal indicará qué solución (equilibrio) es prominente21. Poco hay que objetar a la función de las convenciones como soluciones a problemas de coordinación. Sin embargo, si nos limitamos a describir el carácter funcional de las mismas no habremos avanzado mucho. En realidad, las convenciones pueden ser consideradas como un tipo especial de normas: normas de coordinación. Son especiales en el punto más problemático a la hora de abordar las normas sociales desde una perspectiva individualista: ¿por qué los individuos cumplen las normas? Las convenciones, en este sentido, cumplirían una función más cognitiva que motivacional a la hora de coordinar las expectativas de múltiples actores. Sacconi y Moretti lo expresan del siguiente modo: No nos interesa aquí la explicación de cómo las normas generan puntos de equilibrio en los juegos debido a sus efectos estructurantes sobre los pagos y los incentivos. Los puntos de equilibrio son entendidos como posibles combinaciones de estrategias preexistentes a una situación de juego dada. Las normas, por otra parte, deben ser principalmente vistas como un conjunto de sentencias normativas que prescriben una acción particular para cada jugador en cualquier situación del juego perteneciente a una clase de juegos dada. Por lo tanto, dichas sentencias simplemente piden a los jugadores que adopten un comportamiento de equilibrio dado dentro del conjunto de equilibrios existente de una situación de juego dada. Su efectividad no reside en el refuerzo proporcionado por algún conjunto de acciones a través de incentivos o sanciones externas, sino más bien, y sólo, en su funcionamiento como mecanismos 20
Ullmann-Margalit (1977) utiliza el concepto de norma de coordinación para referirse tanto a “convenciones”, como a “decretos”. Por convención entiende una regularidad de comportamiento como la que hemos descrito en este capítulo. Por decreto entiende la instauración de una norma por parte de un poder centralizado que resuelve un problema de coordinación; por ejemplo, los cambios introducidos por los revolucionarios franceses a los que nos referíamos en la nota 11. La distinción es interesante, aunque no abundaremos más en ella para no complicar más la terminología empleada en este trabajo. Salvo que se especifique de otro modo, cuando hablemos de normas de coordinación nos estaremos refiriendo a las propias convenciones.
21
En este juego habría tantos equilibrios como número de combinaciones posibles para distribuir las plazas de parking limitadas entre todos los empleados en un espacio de tiempo concreto.
Coordinación y convención
87
cognitivos que generan el sistema de expectativas apropiado sobre los comportamientos en equilibrio. Dado dicho sistema de expectativas apropiado, los jugadores tienen incentivos endógenos para adoptar el comportamiento prescrito, en tanto que esperan que los otros jugadores realicen la acción correspondiente. (Sacconi y Moretti, 2002: 1)
Así, de acuerdo con la visión extendida en la teoría económica, mientras que las normas que surgen como soluciones a dilemas sociales22 — normas de dilema del prisionero en la terminología de Ullmann-Margalit (1977) o normas esenciales en la terminología de Coleman (1990: 248)— siempre necesitan de alguna instancia sancionadora que garantice el cumplimiento de las mismas, las convenciones sólo cumplen una función cognitiva: informar a los actores de algo que se ajusta a su propio interés. Las convenciones sociales, en este sentido, no serían más que una herramienta heurística23 de carácter social que permite a los individuos coordinar sus expectativas y comportamientos. Ésta es la conclusión que puede ser derivada del marco teórico empleado por los teóricos de juegos para representar las convenciones sociales.
6. Conclusión En este capítulo hemos presentado los elementos fundamentales del modo en el que la teoría de juegos modela las convenciones sociales. Ello nos ha permitido llegar a una definición de convención social que nos posibilita distinguir ésta de otros tipos de regularidades observables en el comportamiento humano. Así, las convenciones sociales han sido caracterizadas como regularidades arbitrarias e indeterminadas, pero a la vez estables en el comportamiento social de los seres humanos. La característica de regularidad social alude al hecho de que se trata de comportamientos observables, lo que supone que puedan ser empíricamente analizados. Las características de arbitrariedad e indeterminación se derivan de la caracterización de las convenciones como soluciones a problemas de coordinación social; lo que supone que cada convención es sólo una de las múltiples regularidades posibles en una situación social determinada. Estas características son las que distinguen fundamentalmente a las convenciones de las normas sociales, en tanto que estas últimas no son arbitrarias e indeterminadas en el sentido expuesto para las convenciones. La característica de estabilidad, aun siendo aceptada por la mayoría de teóricos de las convenciones, ha sido objeto de diversas formulaciones. A pesar de esto, parece imponerse la idea de que las convenciones son estables en la medida en que suponen un equilibrio estable en un proceso dinámico de evolución social. Los individuos alcanzan 22
Por dilema social se entiende una situación en la que todos los componentes de un grupo, o la mayor parte del mismo, actuando de acuerdo con sus intereses particulares, obtienen un resultado peor del que hubieran obtenido si hubieran ignorado sus propios intereses. Para una extensión de esta definición, véanse Orbell y Dawes (1991: 38), van Lange, Liebrand, Messick y Wilke, (1992: 3-4), Komorita (1994: 8), Kollock (1998: 183-184) o Miller (2004), entre otros.
23
Regla heurística en el sentido empleado por los teóricos de la racionalidad acotada (bounded rationality). Como afirma Robles (2004), “Genéricamente los estudiosos de la racionalidad acotada han denominado heurísticos a los algoritmos (conjunto finito de operaciones que nos permiten resolver un problema) utilizados para resolver nuestras restricciones cognitivas”.
88
Economía, sociedad y teoría de juegos
dicho equilibrio a través de un proceso continuo de aprendizaje adaptativo, y una vez alcanzado un equilibrio (convención) determinado no tienen incentivos para desviarse del mismo. Si bien la teoría de juegos resulta muy fructífera en la definición de las condiciones que posibilitan la emergencia y la evolución de las convenciones, no lo es tanto a la hora de aportar explicaciones acerca de por qué una convención concreta ha emergido a partir del conjunto de regularidades posibles. Para especular acerca de los mecanismos que se pueden hallar en la base de estas explicaciones, en el último apartado del capítulo nos hemos preguntado por la fuente de normatividad de las convenciones sociales. La reflexión en torno a este problema nos ha llevado a concluir que las convenciones cumplen sobre todo una función cognitiva: la de coordinar las expectativas individuales, como paso previo a la coordinación de los comportamientos. Hasta aquí se ha señalado el conjunto de posibilidades que la teoría de juegos ofrece para el estudio de las convenciones sociales. Como se ha podido observar en diversas partes del texto, esto no quiere decir que en su estado actual la teoría de juegos pueda explicar cada mecanismo que se halla detrás de la existencia de cada convención social que podamos observar empíricamente. Aun así, con sus virtudes e inconvenientes, esta teoría ha aportado algo bastante importante para la teoría sociológica contemporánea: la preocupación por el estudio teórico de la noción de convención social.
Capítulo
5
Libertad, justicia y juegos Fernando Aguiar
1. Introducción Desde muy pronto, apenas una década después de que John von Neuman y Oskar Morgenstern publicaran su Theory of Games and Economic Behaviour, se apreció la utilidad de esta nueva rama de la matemática aplicada para la ética. Si la teoría de juegos se ocupaba del estudio formal de las interacciones estratégicas de individuos racionales, esas interacciones podían tener un claro componente ético (Braithwaite, 1955). Desde muy pronto también, los pioneros de la teoría de juegos dieron un nuevo impulso a viejos problemas filosóficos, éticos y políticos al tiempo que desarrollaban su disciplina. Hoy en día resulta imposible reflexionar sobre racionalidad, utilidad, normas sociales, normas de justicia o cooperación, por poner sólo algunos ejemplos, sin tener en cuenta las aportaciones de la teoría de juegos. Ahora bien, alabar el uso de la teoría de juegos en ámbitos como la ética y la filosofía política puede hacernos creer que hay un claro acuerdo sobre cómo debe usarse esta herramienta formal y cuáles son sus límites. Sin embargo, esto no es así. Hay al menos tres respuestas distintas a esa cuestión y cada una de ellas establece límites distintos al uso de la teoría de juegos en el terreno de la reflexión ético-política: una concepción puramente instrumental, otra contractualista y una tercera evolutiva1. El uso y la concepción puramente instrumentales de la teoría de juegos para la ética es el más restringido. Desde este punto de vista la teoría de juegos no es más que una herramienta formal que, como la lógica, aporta claridad a las complejas situaciones de interacción que implica un problema de decisión moral. Los modelos de la teoría de juegos evidencian cuál es la naturaleza concreta de un problema moral y las teorías éticas proporcionan soluciones a esos problemas. Así, por ejemplo, si la teoría de juegos nos ha llevado mucho más lejos que cualquier otra teoría en la demostración formal de los fallos de la racionalidad, la misión de las teorías morales consistiría, entre otras cosas, en tratar de resolver esos problemas de racionalidad. En el caso paradigmático del dilema del prisionero, en el que la racionalidad individual conduce a un resultado colectivo irracional al impedir que los 1
Esta división tripartita es una versión modificada de la que puede encontrarse en Verbeek y Morris (2004).
89
90
Economía, sociedad y teoría de juegos
jugadores cooperen, las teorías morales proporcionan las normas que permiten superar tales dilemas. Las aproximaciones a la teoría de juegos en términos que no son meramente instrumentales consideran que las normas morales y los principios de justicia son el producto de la interacción estratégica de individuos racionales. La teoría de juegos no sería ya una herramienta útil para la ética, sino que la ética misma sería teoría de juegos, una rama más de esta disciplina (Harsanyi, 1992: 671). En este terreno nos encontramos sobre todo con teorías contractualistas que “interpretan la moralidad como el resultado de un proceso de negociación” (Verbeek y Morris, 2004: 4). Los jugadores negocian estratégicamente los principios morales y políticos que regularán la distribución de los recursos sociales. Ahora bien, esto no deja de ser un artificio, una construcción hipotética a partir de la cual deducir las normas morales y de justicia. La concepción evolutiva de la relación entre la ética y la teoría de juegos comparte con los contractualistas la idea de que la moralidad emerge de la interacción estratégica de los individuos. Pero ese surgimiento no se establece en un marco hipotético-deductivo, sino en un marco evolutivo. Las normas morales son producto de la evolución humana; a lo largo de su historia evolutiva los seres humanos han tenido que resolver complejos problemas de coordinación para sobrevivir. La solución de esos problemas es lo que se denomina normas morales y de justicia. La teoría de juegos evolutiva nos permite reconstruir esas soluciones, nos proporciona los equilibrios evolutivos a los que denominamos moralidad, justicia y libertad. En este capítulo presentaré algunos ejemplos de los diversos usos de la teoría de juegos en ética y filosofía política. Para ilustrar la aproximación instrumental me centraré en el análisis de la libertad —derechos, libertades y libertad interior— desde la teoría de juegos (secciones segunda y tercera). En la cuarta sección veremos el vínculo que existe entre la teoría de la negociación y la teoría del contrato. En la quinta sección me detendré en la teoría de juegos evolutiva y en su explicación del surgimiento de normas de justicia.
2. Elección social, liberalismo y libertad Cuando Kenneth Arrow publicó en 1951 su obra Social Choice and Individual Values (Arrow, 1963) inauguraba una línea de investigación en el seno de la economía del bienestar que rápidamente se extendería a otras disciplinas. Su propósito original residía en hallar un mecanismo (una constitución, una regla de arbitraje, un sistema de votación, etc.) que permitiera tomar decisiones colectivas a partir de las preferencias de cada individuo sobre distintas opciones sociales. Arrow demostró en su trabajo que es imposible encontrar un mecanismo semejante —una función de decisión social— sin que viole una serie de condiciones tan razonables como las siguientes: que nadie imponga a los demás su preferencia, que en el proceso de decisión colectiva tengan cabida todas las preferencias individuales, que las preferencias sean transitivas para que el individuo (y la sociedad) no se contradigan a sí mismos, etc. El análisis del teorema de imposibilidad de Arrow (sus consecuencias, los intentos de sortearlo y la aparición de nuevas imposibilidades) ha generado lo que hoy se conoce como teoría de la elección social2. 2
Una excelente introducción a los problemas de la elección social se puede encontrar en Sen (1976).
Libertad, justicia y juegos
91
Una de las condiciones que deben cumplir las reglas de elección social tiene que ver con el derecho de las personas a que las decisiones ajenas no violen su esfera privada: si se concede que en cierto ámbito privado la elección individual ha de ser libre, se debe imponer a las decisiones colectivas una condición que asegure el derecho a la libre elección en asuntos privados. Si yo quiero que las paredes de mi casa sean verdes no puede establecerse una regla de elección social —un sistema de voto, por ejemplo— que contemple la posibilidad de que las pinte de rojo. En el lenguaje de la teoría de la elección social se dice que la persona que determina la elección sobre el par de posibles estados o situaciones sociales (x, y) en los que se abordan asuntos de su incumbencia es decisiva sobre ese par. Para asegurar la decisividad de los individuos Amartya Sen propuso una condición débil de liberalismo (Condición L) que sirve para proteger la esfera privada de cualquier persona cuando se ve inmersa en un proceso de elección social, esto es, un proceso en el que a partir de las preferencias individuales se debe llegar a una preferencia social o colectiva: La Condición L exige que para toda persona haya al menos un par de estados sociales, digamos x e y, tales que su preferencia en ese par sea decisiva para el juicio social; esto es, si prefiere x a y, se tiene que reconocer entonces que x es socialmente mejor que y, y de igual modo si prefiere y a x. La aceptabilidad de la condición L dependerá de la naturaleza de las alternativas que se ofrezcan para elegir, y si ninguna elección fuera personal... esta condición no tendría mucho atractivo. (Sen, 1982: 292)
No se trata, según lo entiende Sen, de que tan sólo los liberales en sentido estricto acepten esta condición. El término liberalismo puede mover aquí a confusión. Lo que se pretende destacar es que cualquiera que acepte un mínimo de libertad individual —sea cual fuere su concepción general de la misma— debe estar conforme con que la condición L se integre en el proceso de elección social. En “La imposibilidad de un liberal paretiano” (Sen, 1970), artículo extensamente comentado desde su aparición, Amartya Sen demostró que la Condición L entra en conflicto con el criterio de optimidad o eficiencia de Pareto. En su forma débil, este criterio afirma que si todos los miembros de una sociedad prefieren un estado social x a otro y, el primero se debe considerar socialmente preferible al segundo. El Teorema de Imposibilidad de un liberal paretiano demuestra que no existe ninguna función de decisión social que satisfaga al mismo tiempo la condición liberal (Condición L) y el criterio de Pareto. En otras palabras, la condición liberal no es compatible con la eficiencia paretiana, resultado que tiene una enorme trascendencia para la economía del bienestar, que ha hecho del criterio de Pareto su piedra angular. Merece la pena recordar el ejemplo que propuso Sen para ilustrar su teorema, pues aunque se trata de un ejemplo un tanto anticuado se ha convertido en todo un clásico de la literatura sobre elección social. Puritano y Lascivo tienen un ejemplar de El amante de Lady Chatterley, y Puritano quiere evitar que Lascivo lea un libro procaz. Las situaciones sociales posibles en el ejemplo de Sen son las siguientes: a: Puritano lee el libro b: Lascivo lee el libro c: Ninguno de ellos lo lee. Puritano preferiría ante todo que nadie lo leyera (situación social o resultado final c), optando por leerlo él mismo (a) si con ello impide que lo lea Lascivo (b). Lascivo desearía
92
Economía, sociedad y teoría de juegos
que lo leyera Puritano (a) para ver si así se suaviza su puritanismo. Mas si Puritano se niega a leerlo, Lascivo prefiere leerlo él (situación b) antes de que el libro se quede sin leer (c). Tenemos, pues, la siguiente ordenación de las preferencias de ambos individuos3: TABLA 5.1. Orden de preferencias de puritano y lascivo. PURITANO
LASCIVO
c
a
a
b
b
c
¿Pueden obtener Lascivo y Puritano una sola ordenación social, a partir de sus preferencias individuales, que cumpla con la Condición L y con el criterio de Pareto? La condición liberal dicta que Lascivo lea el libro antes de que se quede sin leer, ya que así lo desea. Es decir, la sociedad debe respetar ese deseo, por lo que b se ha de considerar socialmente mejor que c gracias a la Condición L, pues Lascivo es decisivo sobre el par (b, c). Por la misma razón diremos que si Puritano no desea leer el libro de Lawrence, la alternativa c resultará socialmente mejor que a. Entonces, si b es socialmente preferida a c (lo que expresamos como bPc) y cPa obtendremos, por transitividad, bPa. Pero ocurre que el criterio de Pareto impone aPb (pues a es preferida a b de forma unánime por Lascivo y por Puritano), por lo que surge una contradicción: el criterio de Pareto lleva a la preferencia social aPb y la Condición L a la preferencia social bPa. La condición liberal conduce, pues, a un resultado social supóptimo. Al calor de la Paradoja de Sen surgieron otras muchas paradojas y otros tantos intentos de resolverlas. Una de las más interesantes y discutidas, relacionada también con la libertad de elección, es la Paradoja de Gibbard. En esta paradoja se muestra que no sólo la Condición L puede entrar en conflicto con el criterio de Pareto, como demostró Sen, sino que también los derechos y libertades individuales —tal y como se plasman en dicha condición— pueden dar lugar a resultados incoherentes. En el teorema de imposibilidad de Sen se establecía la decisividad de una persona sobre un par de alternativas sociales que sólo le afectaban a ella. No se planteaba la posibilidad de que dos personas fueran decisivas sobre el mismo par. Fue Allan Gibbard quien presentó una paradoja ligada a este problema. Según Gibbard (1974), a todo el mundo debería permitírsele fijar ciertas “características” de las alternativas o estados sociales (no los estados sociales mismos) que fueran sólo asunto suyo, de tal forma que su preferencia por tales características fuera socialmente decisiva. De esta forma, si una opción social sólo se diferencia de otra en una característica que es de mi sola incumbencia, Gibbard considera que soy moralmente decisivo sobre esa característica. Pues bien, Gibbard demostró que la decisividad moral sobre asuntos privados puede conducir por sí sola a una contradicción. El siguiente ejemplo, del propio Gibbard, nos ayudará a comprender la lógica de su demostración. Supongamos que la persona A desea ponerse una chaqueta del mismo color que la persona B que, a su vez, 3
Las opciones que se encuentran más arriba se prefieren a las que se encuentran más abajo.
Libertad, justicia y juegos
93
quisiera diferenciarse de A. Esto daría lugar al surgimiento de cuatro alternativas (R es rojo y V verde. La primera letra representa el color elegido por A y la segunda el elegido por B): RR, VV, RV, VR. Puesto que la elección del color de la chaqueta es sin duda un asunto privado, A y B son moralmente decisivos sobre ese asunto; es decir, que lo que ellos prefieran deberá ser aceptado por la sociedad y elegido por ella, en este caso una sociedad de dos miembros. Mas esto conduce a una contradicción, pues tendríamos que el deseo de A de imitar a B conduce a que RR (esto es, que ambos vistan chaqueta roja) sea socialmente preferible a VR, y que VV sea preferible a RV; y la voluntad de B de diferenciarse de A nos lleva a que RV sea preferible a RR, y que VR sea socialmente mejor que VV. De esta forma, la combinación de las preferencias de ambos nos aboca al siguiente resultado paradójico: RR p VR p VV p RV p RR 4. De esta forma, el derecho de los individuos a vestir la chaqueta del color que ellos quieran conduce a un resultado social paradójico, intransitivo, en el que uno de los dos miembros de la sociedad (el que quiere llevar una chaqueta distinta) sale peor parado que el otro, pues al final los dos llevan el mismo color. La sencillez o, aún más, el carácter superficial de los ejemplos no debe hacer pensar que no nos hallamos ante verdaderos problemas de agregación de preferencias, ante conflictos sociales que surgen como producto de la interacción de preferencias individuales. Preferencias individuales que, por otra parte, se hallan protegidas por principios sociales que tratan de asegurar que los mecanismos de decisión social o colectiva beneficien a todo el mundo (criterio de Pareto) y que nadie vea en peligro su libertad de elección. Tales principios, bien arraigados en la cultura moral y política de nuestras sociedades, pueden conducir a complejos conflictos y contradicciones sociales que los modelos formales de la teoría de la elección social tratan de desentrañar. Ahora bien, aun siendo esto cierto, se ha criticado que la Condición L de Sen no resulta adecuada para captar lo que es un derecho, pues, “por lo común, los individuos no tienen derechos sobre estados sociales o resultados, sino sobre acciones (suyas o de otros)” (Dowding, 2004: 151). Si se acepta esto, la vía para estudiar formalmente los problemas de la libertad de elección no es la teoría de la elección social, sino la teoría de juegos: habría que transformar las paradojas de Sen y de Gibbard en juegos de estrategia pues, de esa forma, los derechos se convierten en derechos sobre estrategias, que son acciones o conjuntos de acciones individuales. A la hora de analizar la compatibilidad entre diversos principios sociales —eficiencia paretiana y libertad, conflictos entre derechos, etc.— un enfoque centrado en la teoría de juegos no considera que los sujetos de derecho puedan fijar los resultados finales de la interacción social, sino que se les garantiza el derecho a elegir entre diversas estrategias que conduzcan al resultado social que respeta su libertad. De esta manera, las reglas o funciones de decisión social se transforman en juegos de estrategia abstractos (game forms, formas de juego como el de más abajo), esto es, juegos en forma normal o estratégica en los que no se muestran pagos concretos (Gärdenfors, 1981; Peleg, 1998; van Hees, 2000). Los derechos son ahora estrategias con las que cuentan los jugadores, estrategias que, combinadas entre sí, dan lugar a diferentes situaciones sociales. En algunas de esas situaciones los derechos entrarán en conflicto, en otras, chocarán con el criterio de Pareto. Esto se verá más claro en los ejemplos que siguen. 4
De nuevo la letra p significa “es preferido a”. La uso en minúscula esta vez para que se distinga mejor.
94
Economía, sociedad y teoría de juegos
TABLA 5.2. Derechos y formas de juego.
JUGADOR 1
JUGADOR 2 B
A
A
(a, b)
(a, a)
B
(b, b)
(b, a)
El jugador 1 y el jugador 2 tienen dos estrategias cada uno, A y B (el derecho de hacer A y el derecho de hacer B), que producen cuatro combinaciones de estrategias por jugador. Cada combinación genera un situación social distinta —(b, b), por ejemplo, o (b, a)— que tendrá lugar o no según las preferencias de los jugadores por una u otra acción o estrategia a la que tienen derecho. Así, si el jugador 1 opta por realizar su derecho a A y el jugador B opta por realizar el suyo a B, la situación social que se genera es (a,b), que es producto de la combinación del derecho a la estrategia A y del derecho a la estrategia B. Si interpretamos el ejemplo de Sen en los términos de la matriz anterior, una de esas combinaciones se daría cuando ambos leen el libro, otra distinta es aquella en la que ninguno lo lee, y otras dos surgen cuando lo lee uno o lo lee otro. La Condición L de Sen se cumple, pues ambos jugadores pueden leer el libro o no leerlo, y eso queda reflejado en las distintas situaciones sociales. Ahora bien, ¿cuáles son las preferencias de los jugadores que en el ejemplo de Sen conducen a la paradoja del liberal paretiano? Si A es “no leer el libro” y B “leerlo”, tendríamos los siguientes órdenes de preferencias y la siguiente matriz: TABLA 5.3. Paradoja del liberal paretiniano en forma estratégica.
LASCIVO
PURITANO
(NL) No leer (L) Leer
(L) Leer
(NL) No leer
(3, 3)
(1, 4)
(4, 1)
(2, 2)
Orden de preferencias de Lascivo5: L-L=4 > NL-L=3 > L-NL=2 > NL-NL=1. Orden de preferencias de Puritano: NL-NL=4 > L-NL=3 > NL-L=2 > L-L= 1. 5
El símbolo “>” se suele usar en estos casos, en los órdenes de preferencias de los juegos, con el sentido de “preferido estrictamente a”. El orden de preferencias no es cardinal: sólo indica que una situación se prefiere más que otra, pero no en qué medida se prefiere más o menos. De esta forma, 4 es lo que más se prefiere, y 1 lo que menos, pero esto no significa que la opción más preferida se prefiera cuatro veces más.
Libertad, justicia y juegos
95
En efecto, esta matriz recoge bien la idea de Sen, pues lo que quiere Lascivo ante todo es que el libro sea lea, y si lo leen ambos mejor, mientras que Puritano quiere lo contrario; es decir, que nadie lea el libro o, como poco, leerlo sólo él para que Lascivo no se condene. Se trata, como vemos, del conocido dilema del prisionero, en el que ambos jugadores tienen una estrategia dominante: Lascivo leer el libro y Puritano no leerlo. Lo que en definitiva nos dice la Paradoja de Sen interpretada así es que para todo juego que satisfaga la Condición L habrá un perfil de preferencias tal que todo equilibrio de Nash en estrategias puras será ineficiente en el sentido de Pareto. O dicho de otra forma, que la condición liberal y el criterio de Pareto son incompatibles si los jugadores tienen estrategias dominantes, como habíamos visto ya, sólo que ahora se definen los derechos como estrategias. Por otra parte, en el caso de la Paradoja de Gibbard las preferencias y los derechos de los jugadores transforman el juego abstracto de la Tabla 5.2 en este otro juego con pagos concretos. TABLA 5.4. La Paradoja de Gibbard en forma estratégica.
JUGADOR A
JUGADOR B VERDE
ROJA
ROJA
(2, 4)
(4, 1)
VERDE
(3, 2)
(1, 3)
Orden de preferencias de A: RR=4 > VV=3 > RV=2 > VR=1. Orden de preferencias de B: VR=4 > RV=3 > VV= 2> RR= 1. Como vimos anteriormente, ambos jugadores tienen derecho a ponerse la chaqueta del color que quieran. Dado que el jugador A quiere coincidir con el otro y el jugador B lo que quiere sobre todo es evitar coincidir, el juego carece de equilibrio en estrategias puras. De esta forma lo que nos dice la Paradoja de Gibbard es que para toda forma de juego que satisfaga la Condición L habrá un perfil de preferencias para ese juego que no contenga ningún equilibrio de Nash en estrategias puras. A menudo se ha señalado que la Condición L de Sen pone un énfasis excesivo, como se vio más arriba, en la efectividad o poder de los individuos para que se realice o lleve a cabo de hecho el estado de cosas que asegura sus derechos. De esta forma, parece que la condición de Sen captaría mejor la idea de la libertad positiva que la de libertad negativa, más propia del liberalismo. La libertad negativa sólo nos asegura que nadie impedirá que se produzca tal o cual resultado, no que el resultado se producirá de hecho. Yo soy negativamente libre de leer El amante de Lady Chatterly si nadie me impide leerlo, pero eso no asegura que lo pueda leer: quizá no pueda si no tengo un ejemplar a mano. La Condición L recoge, pues, el poder hacer algo, no la ausencia de constricciones exteriores que me impiden hacer ese algo. Si la Condición L se reformula de forma que refleje sólo la idea de libertad negativa la Paradoja de Sen desaparece, pero la de Gibbard se mantiene. Sin embargo, al interpretar los derechos como estrategias admisibles para los individuos
96
Economía, sociedad y teoría de juegos
hemos visto que la Paradoja de Gibbard pierde fuerza, pues ya no nos encontramos con un resultado incoherente (la violación de la transitividad), sino con un resultado inestable (la ausencia de equilibrio de Nash). Como veremos más adelante, la inestabilidad se puede resolver mediante algún convenio o acuerdo y no supone mayor problema para el liberalismo y la libertad negativa como principios sociales que han de regir la agregación de preferencias individuales. Las paradojas que hacían incompatibles la libertad y la eficiencia paretiana, por una lado, y las libertades entre sí, por otro, desaparecen al reformularlas como juegos de estrategia en los que la libertad se reduce al derecho de que los demás no interfieran en nuestras decisiones 6.
3. Voluntad general y libertad interior En uno de los pasajes más olvidados de Elección social y valores individuales Kenneth Arrow traza, casi a vuelapluma, una posible conexión entre la voluntad general de Rousseau, el imperativo categórico de Kant y el concepto de ordenación social. En cierto modo, asegura Arrow, la ordenación social de preferencias podría considerarse una suerte de voluntad general “que se supone... que es la misma para todos”, o un imperativo moral que es tanto una ordenación social como “una ordenación moral para todo individuo: representa la voluntad que tendría todo individuo si fuera plenamente racional” (Arrow, 1974: 183). La posible relación entre la voluntad general y la elección social, que nos aleja de los tradicionales fundamentos utilitaristas de la teoría de la elección social, nos lleva a una cuestión que ha sido tratada también desde la teoría de juegos: me refiero a la liberad de los sujetos para elegirse a sí mismo, es decir, para ser interiormente libres. En la propuesta de Arrow el resultado de la elección social, el orden social de preferencias, la preferencia colectiva, se convierte en la voluntad general que los individuos asumen —hacen suya— si son plenamente racionales. Pero esto puede plantear al individuo un conflicto entre su voluntad privada y la voluntad general (que, como señala Arrow, es también su propia voluntad), en la medida en que ambas se contradigan. En otras palabras, ¿cómo se puede resolver, si se da, el conflicto entre el interés particular y el interés público? Históricamente se han dado dos respuestas a esta pregunta: el conflicto se puede resolver mediante la ley o mediante la virtud. En un mundo de egoístas recalcitrantes, en un mundo de maximizadores de su bienestar privado, en un mundo, en fin, hobbesiano, los individuos serán incapaces de seguir los dictados del bien público 7. Si acaso se llegara en semejante mundo a un 6
Sin embargo, en opinión de Sen “las limitaciones de la aproximación [a los problemas de la libertad] como formas de juego reside en parte en el hecho de que se concentra exclusivamente en el aspecto de elección de la libertad” (1991: 211). Esto impide, en su opinión, analizar los ataques a la libertad procedentes de las “acciones invasoras” o de la “inhibición a la hora de elegir”, que padecen las mujeres en las sociedades sexistas. La teoría de la elección social puede tratar esos casos, ya que puede usarse para analizar situaciones en las que se va más allá de la decisión real de los jugadores.
7
En las páginas que siguen hago un uso ilustrativo de conceptos clásicos como el de estado de naturaleza o el de voluntad general. No se trata, por supuesto, de un análisis de la teoría de Hobbes o la de Rousseau.
Libertad, justicia y juegos
97
resultado colectivo mediante un mecanismo de elección social, los individuos preferirían que los demás se atuvieran a ese resultado común, mientras que ellos defienden su interés egoísta. La consecuencia bien conocida es que en el estado de naturaleza hobbesiano reina el casos, la guerra de todos contra todos, y la única forma de salir de tal situación consiste en alienar la libertad en un soberano que, representante de Dios en la tierra, imponga la ley y el orden mediante el temor. El estado de naturaleza hobbesiano sería, pues, un dilema del prisionero en el que sólo el soberano puede imponer la cooperación a los jugadores 8. Que en el estado de naturaleza pueda haber individuos dispuestos a cooperar por propia voluntad es indiferente, pues serán arrollados por los egoístas: no cooperar es la estrategia dominante. Figura 5.1. Voluntad general y voluntad de todos.
Supongamos que en el juego de arriba (un dilema del prisionero en forma extendida en el que el segundo jugador, Tú, toma su decisión sabiendo ya lo que ha hecho el otro) Tú y Yo queremos poner en práctica el acuerdo colectivo al que se ha llegado en nuestra sociedad para salir del estado de naturaleza hobbesiano. Si Yo pretendo seguir los dictados del acuerdo que es producto de la voluntad general, VG, Tú tienes un incentivo enorme para seguir tus intereses privados, IP (pues así obtienes la máxima ganancia, 10, aunque sea a mi costa). Al conocer Yo el juego que jugamos y ver en el árbol que, si juego VG, Tú vas jugar IP; esto es, me dejarás que cargue con los costes de obtener el bien público mientras te dedicas a tus intereses privados, Yo no jugaré VG al comenzar el juego, sino que también elegiré IP y el resultado será colectivamente malo (pues el resultado agregado de VG más VG es mejor que el resultado de IP más IP). El papel de la ley para salir de esta situación sería el que se presenta en la Figura 5.2:
8
David Gauthier (1969) es el primero que analiza la teoría hobbesiana del Estado como si se tratara de la superación de un dilema del prisionero.
98
Economía, sociedad y teoría de juegos
Figura 5.2. Voluntad general y ley.
Al introducir la ley, el juego se transforma. Ya no se trata sólo de que Tú y Yo intentemos cooperar para salir del estado de naturaleza, sino que ahora hay un juego previo en el que Yo juego contra mí mismo (Yo1 y Yo2) y debo decidir si atiendo a la voluntad general o a mis intereses privados asociales 9. Si decido satisfacer mis intereses privados incluso a costa de ejercer la fuerza contra los demás como en el estado de naturaleza, ahora deberé tener en cuenta un nuevo elemento: las leyes que nos hemos dado libremente y que me van a forzar a ser un buen ciudadano. Pero si las leyes son blandas (esto es, si la probabilidad de que me castiguen es baja, 0,2) quizás me merezca la pena no obedecer la ley y seguir defendiendo mis intereses privados a la fuerza si es preciso. Si las leyes son duras (si la probabilidad de ser castigado es muy alta, 0,8), se me forzará con mayor seguridad a ser un buen ciudadano. Los miembros de una sociedad hobbesiana que ha salido del estado de naturaleza no son ya libres del todo, pues han de trocar parte de la libertad irrestricta de que gozaban en el estado de naturaleza por seguridad. El soberano, la ley, protege a los súbditos, pero lo hace obligándolos a asumir la coacción que la propia ley implica. Nos falta por analizar, sin embargo, una rama del juego anterior, la rama izquierda, la de quien elige de primeras honrar la voluntad general. ¿Qué hay de ese ciudadano que elige de buen grado seguir la voluntad general, ese ciudadano que no promueve el bien público por temor a la ley sino por convicción? ¿Qué hay de ese ciudadano que hace suya la voluntad general? Desde el punto de vista de los resultados, parece que no existe diferencia alguna entre el ciudadano que elige por convicción seguir los dictados de una voluntad general que hace suya y el ciudadano que sigue la voluntad general por temor a la ley: ambos se presentan a ojos de los demás como buenos ciudadanos. Hay 9
No se trata de que los individuos no puedan tener intereses privados, sino de que esos intereses privados son los del estado de naturaleza, son intereses privados que no dudan en aprovecharse de la voluntad general.
Libertad, justicia y juegos
99
una diferencia obvia, por supuesto, que el juego resalta con claridad. Si los beneficios de ser un mal ciudadano son muy altos y la probabilidad de que la ley castigue al mal ciudadano es muy baja, éste no tendrá incentivo alguno para comportarse como un buen ciudadano. En cambio, el ciudadano virtuoso, el ciudadano que opta por la voluntad general, que la hace suya, no necesitará esa coacción externa para ser un buen ciudadano. Para el ciudadano virtuoso la voluntad general ya no será impuesta desde fuera, sino que será libremente —virtuosamente— elegida desde dentro por la razón: ¿Qué es, pues, el hombre virtuoso? Es el que sabe vencer sus afectos. Porque entonces sigue su razón, su conciencia, cumple su deber, se mantiene en el orden y nada puede apartarlo de ahí. Hasta ahora tú sólo eras libre en apariencia; no tenías sino la libertad precaria de un esclavo al que no se ha mandado nada. Sé libre ahora en efecto; aprende a volverte tu propio dueño; manda en tu corazón, oh Emilio, y serás virtuoso. (Rousseau, 1998: 666)
El hombre y la mujer virtuosos no tendrán que ser coaccionados desde fuera por la ley para ser buenos ciudadanos: la voluntad general es su voluntad y por eso son libres. Ahora bien, la ley debe existir porque siempre habrá quien se deje arrastrar por las pasiones, por los intereses, por la vanidad, por el amour propre. El ciudadano virtuoso, que es interiormente libre, juega un juego contra sí mismo en el que doblega al egoísmo, pues su estrategia dominante es la cooperación. El mal ciudadano juega contra sí mismo un dilema del prisionero en el que el egoísmo siempre gana, pues el mal ciudadano no es libre interiormente y sólo la coacción externa puede forzarlo a cooperar 10.
4. Teoría de la negociación y teoría del contrato Ahora bien, ¿por qué una sociedad de virtuosos sería mejor que una sociedad de ciudadanos que obedecen la ley por temor a la sanción? Hemos visto que sin temor a la sanción el ciudadano virtuoso promueve también la voluntad general. Eso no implica, sin embargo, que no puedan surgir también entre virtuosos dilemas de la cooperación que les obliguen a arbitrar mecanismos de cooperación, acuerdos, para superar esos dilemas. La teoría de juegos es una teoría matemática, una teoría formal, y por lo tanto los supuestos que establece sobre los jugadores son también formales: exige de ellos racionalidad, entendida como coherencia lógica (que sus preferencias sean transitivas y completas) y como maximización de utilidades. Si las preferencias del jugador son egoístas, el jugador tratará de maximizar su propio beneficio; si son altruistas tratará de maximizar el beneficio ajeno. La teoría de juegos no supone, pues, que los individuos son egoístas. Lo que sí nos permite evidenciar el uso instrumental de la teoría de juegos es que ya sean egoístas o altruistas, 10
Queda abierta aquí la pregunta de por qué el virtuoso lo es en primera instancia. Se trata de un problema de psicología moral, no de teoría de juegos. Ahora bien, una vez que el ciudadano ha decidido hacer suya la voluntad general se podría representar la lucha interna para doblegar las pasiones o los intereses antisociales como un juego de reputación, pero un juego de reputación interna (Kim, 2006), en el que el virtuoso juega contra sí mismo y recibe un beneficio psicológico, si es capaz de no dejarse vencer por las pasiones. En ese juego el ciudadano, si es virtuoso, ya no se ve forzado por una ley exterior, sino por una ley interna, una ley que se da a sí mismo, una ley de su voluntad. Para una análisis de la voluntad general rousseauniana y el imperativo categórico kantiano en los términos de la teoría de juegos véase Domènech (1989: 265-292).
100 Economía, sociedad y teoría de juegos
la interacción de los jugadores puede ocasionar dilemas cuya solución es compleja si no se llega a algún tipo de acuerdo. En otras palabras, aunque parece que en la sección anterior insinuamos que en una sociedad de individuos virtuosos interiormente libres la voluntad general de cooperar surgiría por sí sola, lo cierto es que la teoría de juegos demuestra que también en una sociedad de individuos virtuosos se precisa a veces algo más que preferencias virtuosas. Esto queda patente en el dilema del altruista, que se refleja en la siguiente matriz. TABLA 5.5. Dilema del altruista. Pasa tú primero
Paso yo primero
Pasa tú primero
0,0
1,1
Paso yo primero
1,1
0,0
Cuando dos personas se encuentran ante un puerta por la que quieren pasar y no pueden hacerlo a la vez es necesario que una de ellas ceda el paso. Si cada una de esas dos personas se empeña en pasar primero, si ninguna cede el paso, se atascarán en la puerta y no podrán pasar más que a empujones, hasta que uno entre primero. El par de estrategias (yo primero; yo primero) conduce a un mal resultado, esto es, (0, 0): ninguno pasa. Pero tampoco resuelve el dilema el hecho de que ambos jugadores venzan sus afectos egoístas y, de forma virtuosa, cedan el paso al otro, porque si los dos ceden a la vez y no salen del círculo vicioso en que han caído por virtuosos tampoco pasarán. El par de estrategias (pasa tú primero; pasa tú primero) conduce al mismo resultado que la estrategia egoísta; esto es, al peor resultado, (0, 0), de forma que los jugadores tampoco pasarán por la puerta, se quedarán ante ella cediéndose amablemente el paso una eternidad. La diferencia con los jugadores egoístas que tratan de pasar a la vez es que al menos aquí no hay empujones. Como vemos, la teoría de juegos no presupone nada respecto del contenido de las preferencias de los jugadores. Ya sean egoístas o virtuosos, el trabajo de la teoría consiste en analizar el resultado emergente de su interacción. Y en este caso lo que nos dice la matriz es que, para alcanzar uno de los dos equilibrios de Nash —(1, 1) y (1, 1)—, algún jugador tiene que ceder el paso y el otro tiene que pasar. Si el dilema del altruista se juega una sola vez y no se incluye ninguna variable que nos permita resolverlo (uso de la fuerza, normas, etc.), los egoístas se enfrentarán y los virtuosos altruistas se quedarán ante la puerta. Sin embargo, si el juego se repite, si los jugadores se encuentran muchas veces ante la misma situación, pueden salir del atolladero recurriendo a lo que se conoce como estrategias mixtas. En el dilema los jugadores tienen dos estrategias puras, esto es, pasar primero o ceder el paso. Se denominan así porque el jugador escoge una o escoge la otra, pero no las mezcla; es decir, no elige una estrategia unas veces y la otra otras veces. Si los jugadores deciden poner en práctica una estrategia mixta en el dilema del altruista — jugar unas veces “paso yo primero” y otras “pasa tú primero” — el equilibrio de Nash se produce cuando los jugadores eligen la mitad de las veces pasar ellos primero y la otra mitad que pase primero el otro. Si el juego se repite esta es sin duda la solución.
Libertad, justicia y juegos 101
Como se puede apreciar, en este caso nos hemos alejado de la concepción puramente instrumental de la teoría de juegos, pues ya sean virtuosos o egoístas los jugadores, la solución a su dilema se la proporciona el propio juego, y no su idea de lo que está bien y de lo que está mal, no su particular teoría moral. O dicho en otras palabras, cuando se hace un uso instrumental de la teoría de juegos, ésta presenta los problemas en su aspecto formal para que resulten más claros, pero las teorías políticas o morales los resuelven. Así, por ejemplo, en el caso del dilema del prisionero la teoría de juegos demuestra que la racionalidad individual puede conducir a un resultado colectivo irracional. Cuando el dilema se juega una sola vez, la teoría de juegos considera que lo más racional es no cooperar. Sin embargo, una teoría moral podría recomendar que se cooperara incluso cuando se juega una sola vez: para un utilitarista la solución cooperativa es la correcta moralmente porque cuando se coopera la suma de utilidades es mayor; para un kantiano cooperar en un dilema del prisionero es la única forma de que no se considere al otro como un medio para maximizar el beneficio privado. El uso instrumental de la teoría de juegos sirve, pues, como herramienta descriptiva de los problemas de interacción moral o política, pero ni ofrece soluciones ni las explica. En el dilema del altruista que vimos más arriba la situación es distinta, pues no sólo modela la teoría de juegos el problema, sino que ofrece la solución, en principio, más justa. Desde esta perspectiva, la ética se puede considerar una rama más de la teoría de decisión y no una simple herramienta heurística. Como afirma David Gauthier, uno de los principales defensores de la concepción que relaciona íntimamente ética y teoría de juegos, “elegir racionalmente es elegir moralmente... La moralidad... se puede generar como una constricción racional a partir de las premisas no morales de la elección racional” (Gauthier 1986: 4). En efecto, si el dilema del altruista se repite, los jugadores llegarán al equilibrio de Nash en estrategias mixtas que, además, es la solución más justa, por imparcial, al problema que se les plantea. Y del mismo modo, si el dilema del prisionero se juega de forma repetida los jugadores aprenderán a cooperar, que es la solución correcta desde un punto de vista moral. La teoría de juegos no es una teoría moral, es una teoría formal, pero las soluciones que propone cuando los jugadores se encuentran en repetidas ocasiones pueden adoptarse como soluciones morales. Un resultado éste —la elección racional que es a la vez elección moral— que se puede forzar; es decir, no es necesario esperar a que la interacción repetida lo produzca. Los jugadores pueden regatear y llegar a acuerdos justos —imparciales— de forma que se obtenga un resultado que beneficie a todos. El resultado de la negociación, la moral por acuerdo, llevaría a un contrato social aceptable para todos. Así, por ejemplo, en el caso del dilema del altruista, la negociación conduce al mismo resultado que la repetición indefinida del juego, como se ve en la Figura 5.3. Si los jugadores negocian, llegarán a la conclusión de que el dilema que se les plantea se resuelve pasando cada cual primero por la puerta la mitad de las veces en que se encuentren. Los puntos que caen por debajo de la frontera del conjunto de negociación —determinada por la línea que une el punto 1 de cada coordenada—, así como los que están en la misma frontera, se corresponden con el conjunto de negociación: sólo esos puntos (como el M, por ejemplo) son posibles. Los que caen más allá de la frontera (como el F) no son posibles, no pueden ser objeto de la negociación. Por otro lado, los puntos que están en la frontera son todos óptimos de Pareto 11: a los jugadores les interesará que 11
Incluidos (0, 1) y (1,0).
102 Economía, sociedad y teoría de juegos
el resultado final sea un punto óptimo, un punto que esté en la frontera, no por debajo (pues el punto que esté por debajo será subóptimo). La coordenada (0, 0) es el punto de desacuerdo en este juego, una suerte de “estado de naturaleza” del que los jugadores quieren salir pero al que pueden amenazar con volver. Pues bien, si los jugadores tienen el mismo poder de negociación, el equilibrio de Nash coincide con el mayor resultado de multiplicar entre sí los posibles resultados de la negociación —en nuestro juego sencillo los resultados son pasar siempre el primero por la puerta (1), no pasar nunca el primero (0) y que cada cual pase primero la mitad de las veces (1/2)— descontándoles el punto de desacuerdo (el equilibrio se obtiene también en el punto en que la diagonal que sale del punto de desacuerdo corta la frontera del conjunto de negociación). (1/2 – 0) u (1/2 – 0) = 1/4 como 1/4 > 0, (1/2, 1/2) es el punto de equilibrio. (1 – 0) u (0 – 0) = 0 Figura 5.3. Un problema de negociación.
Coordenada de Tú (eje vertical): punto (0, 1) = Tú siempre pasa primero. Coordenada de Yo (eje horizontal): punto (1,0) = Yo siempre pasa primero. Una negociación de esta naturaleza resolvería, por ejemplo, la paradoja del liberal paretiano, pues los jugadores podrían llegar a un acuerdo sobre quién lee el libro y quién no, y un acuerdo similar resolvería también la Paradoja de Gibbard, al determinarse mediante negociación quién ha de llevar un jersey de un color y quién de otro y en qué (o en cuántas) ocasiones. De esta forma, la negociación da lugar a la interacción cooperativa de los jugadores: La idea de la negociación nos permite incorporar a nuestra descripción de la elección racional cooperativa lo que se pierde desde la perspectiva de la elección social y del utilitarismo: la implicación activa de quienes cooperan. También nos permite captar el requisito de que el acuerdo sobre una estrategia común sea voluntario. (Gauthier, 1986: 128)
Sin embargo, al filósofo o la filósofa curtidos en los complejos problemas de la justicia distributiva les costará aceptar que la teoría de la negociación sirva para resolver tales
Libertad, justicia y juegos 103
cuestiones, y menos aún para explicar la posible adopción por parte de agentes morales reales de los posibles contratos sociales que emerjan de la negociación. ¿Cómo olvidar que los agentes tienen poder? ¿Cómo no tener en cuenta que en la sociedad hay ricos y pobres, fuertes y débiles? ¿Cómo dejar a un lado el hecho de que el resultado de esas negociaciones hipotéticas no es vinculante? En primer lugar, las teorías contractualistas de la negociación pueden suponer, siguiendo la estela de Rawls, que en el “estado de naturaleza” los individuos negocian tras un velo de ignorancia que iguala su poder. La negociación se desarrolla así de forma imparcial. Si se supone, en cambio, que los individuos tienen información completa, como en la teoría del contrato de Gauthier (1989), la negociación se someterá a restricciones que eviten que los jugadores puedan negociar con ventaja: Gauthier impone a los negociadores una condición lockeana (Lockean proviso) según la cual nadie puede mejorar su situación empeorando la de otro 12. En segundo lugar, se considera preciso adoptar algún tipo de índice social para poder comparar el interés que puedan tener los jugadores por los distintos bienes. En nuestro ejemplo sobre quién pasa primero por la puerta, un índice social que compare el interés de los jugadores podría ser el siguiente: el altruista puede tener el doble de interés que el egoísta en ceder el paso, de forma que se llegue a un acuerdo en el que el egoísta pasa primero tres cuartos de las veces y el altruista un cuarto. Este resultado sería también justo dados los intereses de los jugadores. Si lo que se distribuyen son bienes básicos, por ejemplo, la negociación tiene que partir de un mínimo y todo lo que se salga de ese mínimo es innegociable. Dicho en otros términos, el punto de desacuerdo se puede situar donde se quiera y tendrá, como los índices sociales, un marcado carácter cultural y social. Por último, el hecho de que se suponga que los individuos son maximizadores de utilidades hace que las decisiones que adoptan sean vinculantes, pues son las que más les benefician. No cumplir los acuerdos perjudica a la larga a quien incumple.
5. Evolución de la moral y teoría de juegos Pese a todas las restricciones que se puedan aplicar a la negociación, su uso como base de la teoría de la justicia no carece de detractores, especialmente por la naturaleza hipotética del contrato. El interés de los jugadores a la hora de cumplir con los términos del contrato aparece como algo difuso que no tiene fuerza categórica. Además, no está claro que toda negociación tenga una, y sola una, solución racional dadas las muchas soluciones posibles que hay en un proceso de negociación, ni está claro tampoco que esa solución racional, si existe, coincida siempre con la solución moral de un problema de interacción. Los factores irracionales que pueden influir en la negociación son tantos, son tantos los sesgos posibles, que el resultado puede quedar indeterminado. Ahora bien, ya hemos visto que en algunos casos el resultado de la negociación es el mismo que se daría, si los jugadores se encontraran en repetidas ocasiones y aprendieran a cooperar. Si en un dilema del prisionero los jugadores se enfrentan en múltiples ocasiones terminan cooperando porque es lo que más les beneficia (Axelrod, 1986). La cooperación puede surgir, pues, como resultado de la evolución del propio juego en un 12
Obsérvese que ésta es una forma de definir el criterio de Pareto. La teoría de la justicia de Gauthier se analiza a fondo en Vallentyne (1991).
104 Economía, sociedad y teoría de juegos
tiempo indefinido y no tanto de la negociación expresa de jugadores hipotéticos perfectamente informados. Pero en otros casos ocurre lo contrario; es decir, que la evolución del juego lleva a un resultado muy distinto al de la negociación hipotética. Teoría de juegos evolutiva y teoría de la negociación suponen, pues, aproximaciones distintas al estudios de los problemas morales y de justicia distributiva. La teoría de juegos evolutiva surge al aplicar la teoría de juegos a cuestiones de evolución biológica. En el trabajo que inaugura esta línea de investigación se analiza la adaptación biológica —el éxito o el fracaso a la hora de transmitir los genes a las siguientes generaciones— como una estrategia. Si la estrategia tiene éxito, la población que la adopte será genéticamente eficaz, esto es, estará bien adaptada al medio y bien preparada para resistir el asalto de otras estrategias evolutivas. A las estrategias que tienen éxito se las denomina evolutivamente estables. Según la definición de John Maynard Smith, “una estrategia es estable en sentido evolutivo cuando no existe una estrategia mutante que dé una eficacia darwiniana superior a los individuos que la adoptan” (1978: 122). Supongamos, para simplificar las cosas, que dos individuos pueden adoptar una estrategia adaptativa agresiva (a la que llamaremos, siguiendo la costumbre, Halcón) o una estrategia que no sea agresiva (Paloma). En el juego Halcón-Paloma hacer siempre de Halcón o hacer siempre de Paloma (estrategias puras) no es una estrategia evolutivamente estable. Seguir una estrategia agresiva es mortal si uno se encuentra con otros Halcones o una Paloma se encuentra con un Halcón: los Halcones se exterminan, pero son más eficaces en la adaptación genética que las Palomas. Asumir siempre la estrategia menos agresiva funciona sólo cuando uno se encuentra con otras Palomas. En este juego, la estrategia evolutivamente estable es la estrategia mixta (que es el equilibrio de Nash), que consiste en hacer de Halcón 8/13 de las veces y de Paloma 5/13. En otras palabras, “la estrategia del Halcón (H) no puede invadir a una población que emplee la estrategia mixta M” (Maynard Smith, 1978: 123). TABLA 5.6. Juego del Halcón y la Paloma.
Halcón (H) Paloma (P)
Halcón (H)
Paloma (P)
–5, –5 0, 10
10, 0 2, 2
La teoría de juegos evolutiva ha encontrado numerosas aplicaciones fuera de la biología, sobre todo en el terreno de la teoría moral y de la sociología. Así, por ejemplo, el juego Halcón-Paloma se ha aplicado con notable éxito al estudio de normas sociales. Si suponemos que H es una estrategia que promueve la desconfianza en los demás y P una que promueve la confianza, este juego nos dice que la confianza y la desconfianza incondicionales no son evolutivamente estables: no puede sobrevivir una sociedad en la que todos desconfían entre sí, y una sociedad en las que todos confían es, a su vez, “invadida” con facilidad por desconfiados que traten de aprovecharse de los confiados. Habría que seguir una estrategia mixta en la que se mezclaran en distinta medida la confianza y la desconfianza. Eso es, precisamente, lo que suele hacer la gente en sociedad. Por otro lado, desde la perspectiva de la teoría moral, el uso de la teoría de juegos evolutiva permite suponer que las normas morales son soluciones evolutivamente estables a los problemas de coordinación que se han encontrado los seres humanos en su evolución
Libertad, justicia y juegos 105
cultural (Binmore, 2005). La teoría de juegos evolutiva tiene un marcado carácter explicativo del que carecen los usos instrumental y contractualista de la teoría de juegos, pues trata de analizar formalmente por qué tenemos las normas morales que tenemos, cómo surgen, por qué perviven. Ahora bien, una apuesta decidida en esta línea implica suponer, además, que tenemos las normas morales que tenemos porque resulta que son las mejores evolutivamente hablando: las mejores para la convivencia humana en términos de su evolución cultural. Veamos esto con un ejemplo para comprender mejor lo que implica para la teoría moral el enfoque de la teoría de juegos evolutiva. Supongamos que, al igual que en el juego anterior, dos jugadores (Tú y Yo) tienen que decidir quién pasa primero por una puerta, pero en este caso supongamos que el primero que pase puede comerse hasta tres porciones de un pastel dividido en cuatro partes que hay al otro lado. Supongamos también que los dos jugadores tienen hambre y son golosos. Si a esto añadimos que un jugador, Tú, puede tener preferencias egoístas o preferencias altruistas, pero el otro (Yo) desconoce si se encuentra ante un egoísta o ante un altruista, ¿cómo debe comportarse? Antes de abordar esta pregunta podemos ver cómo se plantea la situación en términos de la teoría de juegos. En primer lugar, habrá que representar un contexto (por convención se denomina a ese contexto N, del inglés nature) en el que Yo se pueda encontrar con un egoísta o con un altruista. Luego se representa la decisión de Yo, que no sabe si se halla ante un egoísta o ante un altruista: la línea de puntos del juego en forma extendida a continuación (Figura 5.4) representa la incertidumbre de Yo, que no sabe en qué lado del juego está, si ante un tipo de jugador u otro. Una vez que Yo decida pasar primero por la puerta (PP) o ceder (C), le toca el turno a Tú, que toma su decisión sabiendo ya lo que ha decidido Yo. Pues bien, ¿qué es lo que hay que hacer en este juego? ¿Hay que pasar o hay que ceder? Figura 5.4. Pasar o ceder en un juego con información incompleta.
106 Economía, sociedad y teoría de juegos
Una teoría moral deontológica que incluya el altruismo y la generosidad entre sus primeros principios hará un uso instrumental de la teoría de juegos para analizar la situación y prescribirá la conducta altruista con independencia de sus consecuencias. Una teoría del contrato recomendará una negociación entre los jugadores que les lleve al resultado (2, 2), que es el más justo porque ambos jugadores se encuentran en las mismas circunstancias (tienen hambre, son golosos, tienen el mismo poder). En caso de que los jugadores no cumplan el trato la teoría apelará a una institución (el Estado, por ejemplo) que lo haga cumplir. El análisis evolutivo del juego llega a la solución equitativa por otro camino. ¿Qué hará Yo, qué decisión tomará? En la teoría de juegos evolutiva Yo ya no es un jugador individual maximizador de utilidades, sino un miembro de una población. Yo vive en un mundo en el que hay muchos Yos y muchos Tús, y en esa población hay egoístas y altruistas. A Yo le gustaría saber ante quién se halla, pero no siempre lo sabe. Si supiera que está ante un egoísta, quizás adoptaría la estrategia de un altruista. Como se ve en el árbol anterior, cuando Yo actúa como un egoísta (línea B de resultados o pagos del juego) sale muy mal parado, si se encuentra con otro egoísta: son dos Halcones que se pelean en la puerta. En cambio, si cede ante el egoísta puede llevarse al menos una porción de pastel. Por otro lado, si se encuentra con un altruista y adopta una estrategia egoísta saldrá muy beneficiado, pues pasará primero por la puerta y se llevará tres trozos. Mas el caso es que Yo no sabe si se encuentra ante un egoísta o ante un altruista. Si cree que es muy alta la probabilidad (p) de que en la población haya más egoístas que altruistas, puede adoptar una estrategia de altruista de supervivencia. Si cree que la probabilidad (1 – p) de que en la población haya muchos altruistas es muy elevada puede adoptar una estrategia egoísta. Ahora bien, si en la población hay muchos altruistas, su estrategia será invadida con facilidad por egoístas que siempre pasan primero por la puerta y se llevan más ración. Eso les hará comportarse a veces, si no son santos, como egoístas, para defenderse. De esta forma, y ante la incertidumbre, los individuos terminarán pasando los primeros por la puerta la mitad de las veces y cediendo el paso la otra mitad. En promedio el pastel se habrá repartido equitativamente y la norma de ceder el paso la mitad de las veces ante la puerta habrá tenido éxito adaptativo en la prehistoria evolutiva de la sociedad de Yos y Tús que hemos imaginado aquí 13. Desde esta perspectiva cabe suponer, pues, que las normas de justicia y la normas morales son estrategias evolutivamente estables. Cabe suponer también que la moral y la justicia surgen como subproducto de la interacción de los individuos. Y cabe suponer también, en consecuencia, que la justicia y la moral no precisan de individuos racionales plenamente informados, sino de individuos que siguen normas que son producto de la evolución cultural humana.
6. Conclusión Cabe suponer todo esto empleando la teoría de juegos evolutiva, pero ¿se puede demostrar? ¿Son tan similares la evolución biológica y la evolución cultural? Y si una norma de 13
“En una población en la que todo el mundo exige la mitad del pastel, cualquier mutante que exija algo diferente obtendrá menos que la media de la población. Exigir la mitad del pastel es la estrategia evolutivamente estable en el sentido de Maynard Smith y Price” (Skyrms 1996: 11). En nuestro ejemplo, lo que se termina exigiendo es pasar por la puerta el primero la mitad de las veces. Así todos terminan comiendo a la larga la misma cantidad de pastel.
Libertad, justicia y juegos 107
justicia o una norma moral no son evolutivamente estables, si son evolutivamente inestables, ¿qué me puede importar como agente moral en el momento en que he de tomar una decisión moral inaplazable? Hay que resolver todavía muchas preguntas en este terreno tan novedoso. Cuando se habla de evolución puede hacerse referencia a un proceso simulado en el laboratorio, como el ingeniado por Axelrod para analizar el surgimiento de normas, y no a la evolución moral real de la especie humana. Ahora bien, aunque se pueda simular en el laboratorio el surgimiento evolutivo de normas morales y de justicia, suponer que son equilibrios de Nash seleccionados por la evolución cultural humana implica una idea muy distinta, pues aquí los lapsos temporales se miden en miles de años. ¿Son las normas de justicia producto de la evolución humana, de nuestra convivencia en pequeñas sociedades de cazadores y recolectores? ¿Hay normas inmorales que también resultan evolutivamente estables? ¿Se le puede dar fuerza categórica a lo evolutivamente estable por el mero hecho de serlo? En este capítulo no podemos hacer frente a semejantes preguntas, pero merece la pena plantearlas porque evidencian la intensa relación que puede darse entre la ética y la teoría de juegos. De los tres usos de esta teoría que hemos presentado aquí, quizá sea el evolutivo el que tiene ante sí mejores perspectivas. Sin embargo, aún no existe demasiada relación entre expertos en teoría de juegos y expertos en filosofía moral y política. Para los primeros, para algunos de ellos al menos, los filósofos académicos se contentan con levantar cortinas de humo carentes de sentido (Binmore, 2005: 37). Para los segundos, para la gran mayoría, la teoría de juegos resulta inútil si su estructura formal no se interpreta de forma especial, pero al hacerlo nos las veremos inevitablemente con “tradiciones mucho más viejas” (Rawls, 1999: 58). Los filósofos temen encontrarse con una nueva ética matematizada, una nueva ética demostrada según el orden geométrico que aporte poco a los verdaderos problemas morales. La teoría de juegos, sin embargo, ha mostrado hasta ahora que puede ser de gran utilidad para desentrañar complejos problemas de interacción humana y proponer soluciones. La ética y la teoría de la justicia se enfrentan también a uno de los grandes problemas de la interacción humana, a saber, el de construir una sociedad mejor, más racional y más justa. La colaboración entre la teoría de juegos y la filosofía moral y política puede ser, pues, muy fructífera y no tiene por qué estar lastrada por otros intentos —ya sea el más antiguo de Spinoza, ya sea el más reciente de la filosofía analítica— de emplear disciplinas formales para abordar cuestiones morales.
Capítulo
6
La teoría de juegos: ¿una teoría social? Félix Ovejero Lucas1
1. Introducción Con frecuencia las ciencias sociales se han encontrado con productos cuya naturaleza no era clara. No se sabía si se trataba de herramientas formales, matemáticas, de metodologías (o heurísticas), de genuinas teorías sociales o de tesis metafísicas —de ontologías— capaces de abarcar disciplinas diversas. En su día, sucedió con la teoría de sistemas. En unas ocasiones se contemplaba como una teoría matemática, como una especie de álgebra de operaciones que podía ser útil para dotar de potencia formal a la explicación de procesos biológicos, sociológicos o económicos. Para otros era una metodología, una manera de explicar que puede ser utilizada por diferentes teorías y disciplinas, como sucede con la explicación causal. Unos terceros la veían como una teoría empírica acerca de cómo eran los procesos sociales (retroalimentadores, p.e.). Finalmente, otros la entendían como una “teoría ontológica”, como una especie de metafísica de la naturaleza, al modo como la metafísica de “átomos y fuerza” abasteció —proporcionó una manera de mirar la realidad— a diversas disciplinas en los siglos XVII y XVIII (Thackray, 1981). De esas ambigüedades interpretativas participaron el estructuralismo, el funcionalismo e incluso tradiciones enteras de pensamiento como el marxismo. De las mismas ambigüedades participa hoy la teoría de juegos, acogida por algunos como el (nuevo) “paradigma” de la ciencia social. Entre sus cultivadores hay interpretaciones para todos los gustos. Desde quienes la entienden como una teoría social que abarca —y subsume— a distintas disciplinas clásicas, hasta quienes la reconocen como una simple herramienta formal, matemática, pasando por quienes ven en ella una metodología o una heurística 2. Esas diversas calificaciones no siempre son explícitas, pero 1
Agradezco los comentarios a este capítulo de Guillaume Haeringer y José Luis Martí.
2
La teoría de juegos también se puede interpretar normativamente, como una teoría que nos dice qué debemos hacer en cierto tipo de situaciones, qué estrategia es racional adoptar. No nos ocuparemos aquí de esta interpretación. Por lo demás no se puede olvidar que cualquier teoría empírica es susceptible de ser reformulada como teoría normativa. La teoría que nos dice que “Siempre que C sucede que E” sirve de base al juicio: “Si se quiere E debe hacerse C”.
109
110 Economía, sociedad y teoría de juegos
resultan casi inevitables a la vista de la propia descripción que de la teoría de juegos se hace. Como ha destacado un economista matemático con preocupación por los problemas de fundamentación: “la teoría de juegos tiene una particularidad sorprendente: todo el mundo habla, pero pocos saben qué es exactamente” (Guerrien, 2002: 5). Así las cosas, no ha de extrañar que autores que han hecho un uso brillante e imaginativo de la teoría de juegos se pregunten “¿qué es la teoría de juegos?”; ni ha de asombrar tampoco la imprecisión de su respuesta: “es más que una ‘teoría’, más que un conjunto de teoremas y soluciones” (Schelling, 1984: 221). Las páginas que siguen se ocupan de las dos imágenes más comunes: como teoría social, como teoría que explica los procesos sociales, y como teoría matemática, como una teoría formal que, en todo caso, ayuda a mejorar las explicaciones3. Se verán las razones, las implicaciones, presunciones y consecuencias de esas dos interpretaciones. La tesis que se sostiene es, en su núcleo, poco original: la teoría de juegos es una teoría matemática que encuentra aplicaciones (modelos) en determinados procesos sociales. En ese sentido, al margen de imprecisas presentaciones, la segunda interpretación es la correcta. A la vez se advertirá sobre los peligros de la pasión “formalista” que acompaña a veces a esa interpretación: los intentos de forzar la realidad para encajarla en los modelos; el descuido de que lo que importa, al fin, es explicar. Sin embargo, aun reconociendo la impertinencia de la primera interpretación se intentará ser respetuoso con ella. Se evitará una resolución estipulativa que consiste en establecer una definición —más o menos justificada— de lo que es una teoría (p.e. un conjunto de modelos) y despachar como “simples confusiones” las malas maneras de los científicos sociales porque no cuadran con esa idea. Ese proceder conduce con frecuencia a ignorar los asuntos de interés que se esconden detrás de las “malas formulaciones”4. Los problemas recurrentes, por lo general, son algo más que simples confusiones susceptibles de zanjarse con distinciones analíticas. A mi parecer, la mejor estrategia ante tales problemas consiste en hacerles justicia, tratar de entenderlos y, en todo caso, dejar para el final las tareas clarificadoras. Sin duda, es buena cosa caracterizar con precisión el género literario de la teoría de juegos, pero conviene hacerlo después de reconocer qué está en juego, qué es lo que se oculta detrás de las “confusiones”. Éstas, casi siempre, apuntan a asuntos de interés que una “aclaración” prematura puede llevar a ignorar. De modo que al discutir la interpretación empírica se hará, por así decir, en sus propios términos, con sus mejores razones. En el primer apartado se sugiere una explicación de las raíces (históricas) de la doble interpretación. En el segundo se examina la interpretación empírica de la teoría de juegos y —en varios subapartados— las dificultades que conlleva esa interpretación, dificultades percibidas muchas veces como “el irrealismo de los modelos de la teoría de juegos”. En el siguiente se hará lo propio con la interpretación formal y se destacará la corrección 3
Algo parecido ha sucedido con la teoría del equilibrio general en economía, que para algunos era “matemática pura” sobre cuya adecuación empírica no cabía interrogarse (cfr. Hausman, 1981). Aunque en este caso el origen es, al menos en la aspiración, claramente de vocación empírica: explicar los precios.
4
La historia del análisis filosófico ha realizado tantas idas y venidas, ha vaciado las suficientes bañeras —y no sólo en el análisis de la ciencia— con el niño dentro, como para permitirse muy pocas “descalificaciones rotundas y definitivas” y, muy razonablemente, son cada vez menos frecuentes las viejas maneras de “zanjar en pocas páginas” problemas que han ocupado a notables inteligencias durante años.
La teoría de juegos: ¿una teoría social? 111
de esta perspectiva. Para terminar se realizarán algunas consideraciones de tipo general que atañen al uso de los instrumentos formales. En particular se recordará que aunque la teoría de juegos puede cumplir diversas funciones (instrumentales, heurísticas, etc.) ello no quiere decir que tenga diferentes “naturalezas”.
2. La originalidad de la teoría de juegos en la historia de la ciencia social Desde una perspectiva metodológica se pueden reconocer dos grandes tradiciones en la historia de las ciencias sociales: naturalismo e historicismo. La primera cristaliza en torno a la tesis de la unidad metodológica de la ciencia, tesis que la segunda rechaza en nombre de ciertas especificidades de las ciencias sociales. La tesis de la unidad de la ciencia adopta diversas modalidades (Ovejero, 1985), pero la más común es la de una ciencia de leyes, leyes que deseablemente deben presentarse en un formato matemático. La otra tradición apela a modos particulares de explicación que harían, a su entender, imposible la utilización de herramientas formales. La especificidad más comúnmente invocada era “el problema del sentido”. El historicismo empezaba por recordar que las acciones humanas son acciones conforme a un propósito. Entender un proceso social exigiría reconocer, identificar, la intencionalidad que está detrás de las acciones que lo desencadenan y ello requiere de una metódica especial que no encuentra su paralelo en las ciencias de la naturaleza y que consiste en “ponerse en la piel de los protagonistas”, para “comprender el sentido de sus acciones”. La realización de un ritual se “comprenderá” desde un propósito (“provocar la lluvia”) y un conjunto de creencias (entre ellas, por ejemplo, que “la realización de una danza alegrará a los dioses”) que se atribuyen a los sujetos investigados. Conjuntamente, creencias y propósitos explicarían las acciones. Ese carácter relativo, local, apegado a cada contexto particular, haría imposible —según los historicistas— la aplicación de cualquier procedimiento formal y general e invitaría a hacer uso de estrategias empáticas y narrativas, parecidas a las de los novelistas, clásicamente empleadas por buena parte de la historiografía decimonónica5. Por una vía un tanto retorcida la tradición historicista estaba reconociendo que en ciencias sociales hay un lugar para un tipo de explicación que apela a las creencias y propósitos de los actores sociales; un tipo de explicación (intencional), que, a su parecer, no tiene cabida en las ciencias de la naturaleza. De este modo, las ciencias sociales aparecían divididas entre una tradición que aspiraba a una ciencia social “abstracta”, con un formato axiomático y tentativamente formal, y otra que apelaba a procedimientos narrativos y lo hacía en nombre de un marco metodológico en el que creencias y propósitos eran categorías fundamentales. La circunstancia de que la idea de unidad de la ciencia apareciese en el seno de una “filosofía positivista”, particularmente preocupada por los problemas del método, 5
Se reproduce una argumentación que no se comparte en la confianza de no haberla traicionado. Lo cierto es que incluso en sus versiones más refinadas (Taylor, 1985/II: 114) hay una explícita exclusión de la economía como ciencia social que sólo se entiende desde lo dicho, desde la contraposición entre la explicación “comprensiva” y el uso de las matemáticas. Con todo, como se verá, la teoría social tradicionalmente más formalizada, la microeconomía (neoclásica), hace de la hipótesis de racionalidad su núcleo (y la racionalidad es una forma de comportamiento intencional).
112 Economía, sociedad y teoría de juegos
y que las críticas a dicha tesis encontrasen su caldo de cultivo filosófico en tradiciones más especulativas, se tradujo en paradoja: las ciencias sociales se bifurcaban en dos direcciones, una pulcra metodológicamente, pero que ignoraba la ciencia social real, y otra, nacida de la propia historia de las ciencias sociales y capaz de detectar sus peculiaridades, que infería incorrectamente que problemas especiales reclamaban métodos especiales6. Los primeros tenían la buena teoría de la ciencia e ignoraban los problemas; los segundos reconocían los problemas, pero carecían de los instrumentos para encararlos. Había una circunstancia que propiciaba que la sensibilidad historicista para los genuinos problemas de las ciencias sociales se acompañase de la torpeza metódica, circunstancia que es particularmente interesante en el presente contexto: la carencia de instrumentos formales para abordar la anatomía lógica de las explicaciones sociales, la carencia de unas matemáticas de la intención, por así decir. Esta es la oportunidad abierta por la teoría de juegos: proporcionar la precisión del lenguaje matemático a las teorías sociales. Theory of Games and Economic Behavior, el libro con el que presentó en sociedad, en 1943, se abría afirmando: “El propósito de este libro es presentar una discusión de algunas cuestiones fundamentales de la teoría económica que requieren un tratamiento diferente del que han encontrado hasta ahora en la literatura. El análisis se concentra en algunos problemas básicos que han aparecido en el estudio del comportamiento económico y que han sido el centro de atención de los economistas durante mucho tiempo”(von Neumann y Morgenstern, 1972: 1)7. En realidad, la teoría de juegos no hacía sino ahondar una estrategia iniciada por los economistas. Una mirada atenta muestra que la denostada hipótesis del homo oeconomicus, el individuo que busca maximizar su utilidad entendida como su interés 8, se ajusta impecablemente a la estrategia de los historicistas maduros: el individuo tiene ciertos fines (beneficio, utilidad) y ciertas creencias sobre su entorno (sobre su presupuesto, sobre sus dotaciones, sobre las alternativas disponibles, sobre los precios, etc.), y a partir de unos y otras, esto es, desde sus razones, se explican sus acciones (invertir aquí o allá, consumir esto o lo otro, escoger o rechazar un trabajo). Visto así, el homo oeconomicus encaja bastante bien en el modelo de la “comprensión” (Verstehen), la estrategia explicativa específica de las “ciencias de la cultura” según los historicistas. Entender su comportamiento exige lo mismo que nos pedían los historicistas: comprender el sentido de sus acciones, esto es, atender a sus razones, a sus creencias y a sus objetivos. Hasta ahí habían llegado los economistas. La teoría de juegos daba un paso más: se desprendía del vínculo con una teoría social específica, la economía “neoclásica”, y ampliaba la perspectiva, desde las situaciones “paramétricas” (yo frente a 6
En realidad, tanto en la defensa de la unidad como en la de la dualidad, se darán dos criterios de argumentación, que dan pie a cuatro posibles formulaciones de la disputa sobre la unidad: quienes apelan a razones ontológicas (unidad de la naturaleza frente a dualidad) y quienes apelan a razones metodológicas (unidad o dualidad de la perspectiva). El resultado de combinar esos dos criterios da pie a cuatro posiciones distintas (Ovejero, 2003a).
7
Cierto es que el siguiente párrafo se abría con otro tono, explícitamente formal: “Nuestras consideraciones se dirigen a la aplicación de la teoría matemática de los ´juegos de estrategia´ desarrollada por uno de nosotros en sucesivas etapas en 1928 y 1940-1941”. Y continuaba con unas refinadas consideradiones sobre lo que significa la aplicación de las matemáticas en la teoría social (aunque eso sí, hablaba de “método matemático”).
8
En formulación más común siempre se vincula esta hipótesis con el egoísmo. Con todo, es necesario precisar que: a) la ideas de egoísmo asociadas al homo economicus serán diversas; b) la economía neoclásica prescindirá, en su tratamiento de la utilidad, de la hipótesis egoísta (o al menos está en condiciones de hacerlo) (Demeulenaere, 1996).
La teoría de juegos: ¿una teoría social? 113
la naturaleza, precios y productos) hasta las estratégicas (“yo” frente a “otro”)9. Ahora las acciones —y por tanto lo que acabe por pasar, el resultado— depende de las expectativas que cada uno tiene sobre lo que los otros harán. Los componentes imprescindibles serán: (las creencias sobre) las posibilidades de cada uno, las estrategias; (las creencias sobre) las ganancias de cada uno según las consecuencias de las acciones —de cada uno de ellos—; (las creencias sobre) los parámetros del juego. Existe cierto paralelo de origen entre la teoría de juegos y la historia del análisis matemático que merece ser recordado en el presente contexto. El análisis fue literalmente creado para responder a los requerimientos explicativos de una teoría física —la dinámica newtoniana— que carecía de un instrumento formal con el que referirse a ideas como “cambios de trayectoria infinitamente pequeños”. Esa estrecha vinculación con una teoría empírica fue la razón última de muchos de los problemas del análisis, de una “crisis de fundamentos” que está en la trastienda de buena parte de la investigación matemática del siglo XIX. Sus conceptos centrales dependían de nociones (físicas) intuitivas y no se sabía muy bien dónde terminaba la teoría física y dónde empezaba la teoría matemática. El “análisis infinitesimal” se manejaba con términos vaga o nulamente definidos y se desarrollaba, antes que por demostración de teoremas o por el pulido de axiomas matemáticos, a golpe de necesidades de la práctica de la investigación física (Cohen, 1980; Kline, 1972). Por su parte, la teoría de juegos también nace desde la necesidad de encontrar un instrumental matemático (cualitativo) con el que abordar las situaciones de interacción. Esa imbricación de origen era, a la vez, fuente de fecundidad y, cuando no se entendía bien, raíz de problemas. Porque también había una diferencia y es importante. La “crisis” del análisis, por así decir, era una crisis optimista. Era un instrumento poderoso, inserto en el entramado de la teoría empírica que acaso más fascinación ha producido en la historia de la ciencia y, en ese medio, no había dudas acerca de su potencial. Las dudas procedían de sus fundamentos, de su soporte axiomático, en donde las definiciones explícitas se veían con frecuencia sustituidas por la apelación a simples intuiciones como la de “infinitésimo” 10. La teoría de juegos, aunque comparte sus problemas de identidad entre teoría “formal” y teoría “empírica”, no presenta muchos problemas de fundamentos. Incluso se podría decir que, a través de su subordinación a la teoría de la utilidad esperada, presenta demasiados fundamentos11. 9
En realidad, las situaciones que analizan los economistas, casi siempre, son estratégicas. Pero, en muchos casos, la economía, de diverso modo, las ha tomado como paramétricas. Por ejemplo: con el supuesto de competencia perfecta, de manera que los precios vienen “dados”, los agentes “los aceptan” (o los conocen a través de un voceador de precios, lo que no está exento de problemas). Sobre esto (Guerrien, 1999, pp. 41-ss). Hoy el análisis de las situaciones paramétricas es cosa de la teoría de la decisión.
10
El sustrato axiomático fue objeto de una progresiva depuración que, a su vez, contribuyó al desarrollo de la propia teoría matemática. El análisis se afirmó desde los axiomas de Peano, de la aritmética; ésta, a su vez, llevó “más arriba”, a la búsqueda de la fundamentos lógicos de la propia aritmética y condujo al desarrollo de la teoría de conjuntos. A partir de ahí, cuando todo parecía definitivamente claro, es cuando los problemas de esa teoría llevaron, ya en el siglo XX, a dudar del conjunto del edificio, por los problemas en los cimientos, señaladamente, con las paradojas de la teoría de conjuntos.
11
La teoría de juegos se ocupa sobre todo de situaciones de incertidumbre y, por ello, en muchas de sus presentaciones más cuidadas aparece subordinada a la teoría de la utilidad esperada. De hecho, hay diversos candidatos para la fundamentación de esta última, diversos conjuntos axiomáticos (Fishburn, 1988). Lo que es otro modo de decir que la primera es independiente de cada uno de ellos en particular.
114 Economía, sociedad y teoría de juegos
Fundamentos que, si acaso, han sido objeto de discusión por su plausibilidad psicológica, lo cual sólo tiene sentido en el contexto de una teoría empírica (o de su utilización al servicio de teorías empíricas), cosa que, desde luego, no sucedía con el “análisis”, sobre cuya eficacia “explicativa” (empírica) no cabía duda, entramado como estaba con la ciencia más optimista, la física clásica. En suma y en este punto, la teoría de juegos aparece como una prometedora herramienta matemática para abordar —la formalización de— la explicación de procesos sociales que se entienden como resultado de las interacciones de individuos que actúan “conforme a propósito” y, en esa misma medida, ha sido recibida “como la matemática de las ciencias sociales”. Su origen “próximo” a las necesidades de la teoría social hace que con facilidad se ignore su condición de teoría formal y se la interprete como dependiente “del mundo empírico”. Peculiar origen que ayuda a entender las confusiones acerca de la naturaleza de la teoría de juegos, para unos una teoría social y, para otros, una teoría formal.
3. La teoría de juegos como teoría social Para esta interpretación, la teoría de juegos aparece como una especie de teoría general de la sociedad que toma cuerpo en diversas disciplinas12. Aunque no es frecuente una presentación explícita como genuina teoría social lo cierto es que determinadas descripciones de la teoría de juegos sólo pueden entenderse desde el supuesto de que se trata de una teoría social13. Piénsese, por ejemplo, en aquellas presentaciones de la teoría de juegos que apelan a compromisos metodológicos. Así se dice que la teoría de juegos está comprometida con las hipótesis de individualismo metodológico y de racionalidad (Ordeshook, 1986: 1 y ss.). Obviamente, esta afirmación no tiene sentido referida a una teoría estrictamente matemática. Sólo resulta inteligible cuando se contempla la teoría de juegos como una teoría empírica, teoría que adoptaría como patrón la explicación intencional, o como un programa de investigación de las situaciones de interacción desde un compromiso con la idea de intencionalidad. Otro ejemplo: aquellos autores que entienden la teoría de juegos como aquella teoría que se ocupa de las situaciones de interdependencia, de tres interdependencias de la vida social, aquellas en las que: 1) la recompensa de cada uno depende de las recompensas de todos; 2) la recompensa de cada uno depende de la acción de todos; 3) la acción de cada uno depende de la acción de todos (Elster, 1983: 13). 12
En este sentido, y sólo en éste, la teoría de juegos guarda afinidad con el funcionalismo clásico. Éste abarcaba diversas ciencias sociales específicas (sociología y antropología, fundamentalmente, pero también economía). El funcionalismo tenía, además, su particular ambigüedad en cuanto a su naturaleza: para unos era un simple procedimiento de explicación (la explicación funcional, la explicación de X desde sus consecuencias C para el sistema Y en donde X se inserta), mientras que para otros era una genuina teoría social. La interpretación de la teoría de juegos como “método de explicación”, aunque se puede encontrar, es menos frecuente.
13
Sería, por ejemplo, el caso de Lichbach (2003), cuando se pregunta si “Is Rational Choice Theory All of Social Choice”. Aunque Lichbach no se ocupa específicamente de la teoría de juegos, sus consideraciones inevitablemente se extienden a ésta, en tanto, para lo que aquí interesa, no hay diferencias entre la teoría de juegos y la teoría de la elección racional. Sobre lo que se ha llamado ”imperialismo de la economía˝ véanse Hirsch, Michaels y Friedman, 1987; Ovejero, 1988.
La teoría de juegos: ¿una teoría social? 115
Descripciones como las anteriores son compatibles con una triple interpretación de la teoría de juegos: a) como una metódica, como una manera de encarar explicativamente determinadas situaciones, a saber, como situaciones de interdependencia; b) como un área de investigación —como una parcela “de la realidad”— caracterizada por la existencia de interdependencias, pero que, en principio, podría ser abordada por diversos enfoques teóricos; c) como una teoría social caracterizada por ciertos compromisos conceptuales (recompensa, preferencias) y metodológicos (racionalidad, individualismo metodológico)14. La última interpretación es más fundamental y, en buena medida, implica a las otras. Ello es así porque una teoría mínimamente madura: a) delimita su propio ámbito de problemas, la “parcela de realidad” que le interesa (el problema de la determinación del lugar natural de los cuerpos era un problema para la física aristotélica; la física moderna no ha contestado a esa pregunta, sencillamente la declara ilegítima); b) acostumbra a proporcionar una manera de mirar y abordar explicativamente ese campo (en el caso de la física aristotélica concediendo un lugar a la explicación funcional15). En razón de esa prioridad, la interpretación de la teoría de juegos como teoría será la que ocupe las próximas líneas. En los ejemplos citados el compromiso último es el mismo: el modelo intencional. Los individuos (inter)actúan como lo hacen porque tienen diversos objetivos y determinadas creencias acerca de cómo conseguirlos. Cuando los individuos se encuentran e interactúan, desencadenan los procesos sociales. Los compromisos epistemológicos últimos —que la teoría de juegos comparte con mucha otra teoría social — de este enfoque han sido rescatados por Davidson: a) la acción está causada por creencias y propósitos; b) la relación entre creencias y propósitos es de racionalidad, en el sentido de que los individuos persiguen sus metas de acuerdo con lo que conocen —con sus creencias— acerca de la situación (Davidson, 1980). Por ejemplo, una alza especulativa del tipo de cambio es resultado de un comportamiento racional (adquirir la moneda, depositarla en los bancos nacionales) que a partir de lo que se cree lleva a perseguir las metas: un interés por obtener beneficios (propósitos) y una o varias creencias (que esa moneda se revaluará, que los tipos de interés son altos).
4. Problemas de la interpretación de la teoría de juegos como teoría social Las consideraciones que siguen se refieren a cualquier producto intelectual comprometido con la intencionalidad, no sólo a la teoría de juegos. En este sentido, la teoría de juegos sería un escenario particular de problemas más generales. Obviamente esa subordinación 14
No es infrecuente en ciencias sociales ese deslizamiento entre los problemas (a explicar por las teorías) y las teorías (que los explican). Sin salir apenas de los terrenos que estamos analizando, la ambigüedad entre teoría y objeto de investigación es una ambigüedad compartida —en algún grado— con la teoría de la decisión (Sen,1986) y—en mayor medida—con la “teoría” de la acción colectiva.
15
Por supuesto, ello no quiere decir que un método (o un procedimiento de explicación) esté subordinado a una teoría. Pero sí, al menos, que una teoría excluye determinados formatos explicativos. No se ve por ejemplo de qué modo la física contemporánea podría hacer uso de la explicación funcional o de qué modo la teoría del intercambio general neoclásico puede hacer uso de la explicación causal.
116 Economía, sociedad y teoría de juegos
a la intencionalidad sólo tiene sentido al referirse a una teoría empírica, no a una teoría matemática. Por otra parte, conviene advertir acerca del alcance exacto de lo que a continuación se expone. Aunque lo que se diga tiene que ver con genuinos problemas de la intencionalidad, no se pretende “despachar” la intencionalidad. Unas teorías sociales sin — algún tipo de vinculación con la — intencionalidad resultan difícilmente imaginables (y desde luego no se parecerían a lo que hoy entendemos por ciencias sociales)16. Las ciencias sociales difícilmente pueden prescindir de la intencionalidad. En el presente contexto hablar de “dificultades” cumple una simple función instrumental: mostrar los retos a los que se enfrenta entender la teoría de juegos como teoría empírica y, a través de ello, el sinsentido de esa interpretación. Las dificultades de esta interpretación se presentan en dos niveles, en el metodológico y en el teórico. En ambos planos, los problemas aparecen en torno a la idea de intencionalidad —y más específicamente— al supuesto de racionalidad. Conviene destacar una particular asimetría entre ambos planos: a) el metodológico es más básico que el teórico, habida cuenta de que si se demostrasen sin sentido las categorías de creencia o propósito, las especificaciones acerca de la idea de racionalidad se derrumbarían inmediatamente, en tanto esta idea presume aquellas categorías; b) el teórico es más específico que el metodológico, circunstancia que se deriva de su diversa funcionalidad: el supuesto metodológico de racionalidad es una simple guía de indagación y, por ende, sirve de soporte a diversos enfoques teóricos; no aparece comprometido con una idea precisa de racionalidad, únicamente con la explicación desde intenciones y creencias. De hecho, el supuesto metodológico de racionalidad, por su propia naturaleza heurística, no presenta un perfil nítido, no proporciona detalles. Queda para el plano teórico proporcionar una caracterización precisa de la conducta racional (como maximización de la utilidad esperada, por ejemplo). Esta asimetría tiene su traducción a la hora de las críticas. El plano metodológico es susceptible de crítica analítica, que muestre, por ejemplo, el sinsentido del compromiso ontológico en el que se funda; que muestre, por ejemplo, que las nociones de creencia y propósito son vacías o inconsistentes. Por su parte, el plano teórico está sometido a la posibilidad de la crítica empírica, por su inadecuación con las observaciones. Problemas teóricos. En teoría de juegos el resultado final depende de la acción que el agente adopte y de la configuración del escenario, lo que incluye lo que los demás hagan. En ese sentido, en tanto no basta con ordenar preferencias y escoger según ellas para conocer el resultado, la teoría de juegos se ocupa de situaciones de incertidumbre (en consecuencia, no ha de extrañar que en muchas de sus formulaciones aparezca comprometida con la teoría de la utilidad esperada, teoría que se ocupa de los procesos de decisión en aquellas situaciones donde la acción no conduce invariablemente a un resultado). Desde esta perspectiva, en teoría de juegos el resultado aparece como una función con dos argumentos: la decisión adoptada y la situación del mundo. A su vez la decisión es el resultado de cómo los individuos ordenan los distintos resultados y de cómo valoran lo que puede suceder. Los resultados de la literatura empírica son concluyentes, hasta el punto de formar parte de los manuales (de microeconomía, por ejemplo) recientes, que después de exponer los 16
Será la crítica de Churchland (1989; 1991) y en otro sentido Rosenberg (1994), quien atribuye buena parte del estancamiento de las ciencias sociales a su subordinación a la folk psychology. Después volveré brevemente sobre algunas propuestas que sugieren abandonar todo compromisos de la teoría social con lo que se da en llamar folk psychology. Con más detalle, Ovejero (2004).
La teoría de juegos: ¿una teoría social? 117
conjuntos axiomáticos que describen el comportamiento se ven en la necesidad de añadir que prácticamente todos ellos se contradicen con las observaciones (Kreps, 1990b: 76; Frank, 1991: 227). Recordemos un ejemplo. Disponemos de unas entradas para asistir a un partido de fútbol. Poco antes de salir empieza a llover. La teoría predice que si el disfrute esperado del partido supera los costos de ir, iremos. La realidad es muy distinta. Si las entradas las hemos pagado nosotros, iremos; si nos las han regalado, no 17. En la formación de las creencias, los resultados muestran tanto la limitada capacidad cognitiva de los individuos como la existencia de abundantes sesgos a la hora de procesar la información. No sólo no se recoge toda la información, sino que la que se recoge se recoge mal. Las investigaciones empíricas muestran la presencia de un conjunto de sesgos sistemáticos que muestran que las decisiones no se atienen a lo supuesto por la teoría: “efecto certeza”, por el que se sobrevaloran las consecuencias de aquello que se presume cierto frente a lo simplemente probable; “efecto familiaridad”, por el que se tiende a creer que un suceso es más probable (un accidente, por ejemplo) si se ha sido testigo de uno parecido que si no; “efecto precios sombra”, por el que se tienen en cuenta costos —de acciones pasadas— que no hay modo de recuperar; “efecto de inflado de las probabilidades pequeñas y de infravaloración de las intermedias”; “efecto reflexión”, por el que se produce aversión al riesgo cuando las perspectivas son buenas, mientras que se da una búsqueda del riesgo cuando son negativas; “efecto aislamiento”, por el que los individuos simplifican sus procesos de decisión a los aspectos que diferencian las alternativas, descuidando las probabilidades. A la vista de estos resultados, parece por lo menos arriesgado suponer que en la formación de sus creencias los agentes se atienen a los axiomas de la teoría de la probabilidad o de la decisión estadística, o que están en condiciones de anticipar todas las acciones y las alternativas relevantes, estimar sus probabilidades, computar los valores esperados de cada una de tales posibilidades, y procurar conseguir aquella opción que sitúan la primera en su orden de preferencias 18. En suma, la conducta de los individuos no se ajusta a la descripción que de la misma hacen los axiomas (Tversky y Kahneman, 1986). Los individuos no tienen la ilimitada capacidad que los modelos presumen (no realizan cálculos y comparaciones en un instante) (Simon, 1986), no conocen muy bien las reglas de los juegos en donde se desenvuelven (Bell, Rafia y Tversky, 1986) e ignoran la complejidad de los entornos (Luce y Raifa, 1957: 49)19. 17
Los ejemplos se pueden multiplicar. Juan está dispuesto a pagar 10 euros al hijo de su vecino, como mucho, por cortar la hierba de su jardín, pero él mismo no realizaría esa misma tarea por 11 euros en el jardín de su vecino, idéntico al suyo. Los comerciantes saben bien que no es lo mismo anunciar un producto con la etiqueta de 95% libre de materia grasa que con la de 5% de grasa. Si estamos en la cola de un cine y alguien se ofrece a comprar nuestro puesto por el doble de lo que cuesta la entrada seguramente no lo aceptaríamos, aunque si, repentinamente, duplicaran el precio de las entradas nos iríamos a casa. La cantidad de dinero que estamos dispuestos a pagar por una medicación que nos evite el desarrollo de una enfermedad a la que hemos estados expuestos con cierta probabilidad (1/10.000) no es igual a la que demandamos por participar en una investigación de una vacuna en la que existe la misma probabilidad de que desarrollemos la enfermedad. La mayoría de nosotros preferimos quedarnos sin nada antes de aceptar un reparto de dinero en proporciones manifiestamente desiguales (pongamos 90 para ti, 10 para mí) y, lo que es más, no realizamos propuestas de esa naturaleza (90 para mí, 10 para ti), aunque sepamos que la única alternativa para quienes habrían de aceptarlas es quedarse sin nada (Earl, 1990; Camerer, Loewenstein y Rabin, 2004).
18
Véase un repaso más detallado en Ovejero, 2004.
19
Hay que distinguir entre que los jugadores no conozcan el juego, que simplemente sean ignorantes, y que no puedan conocerlo, que esté más allá de sus capacidades cognitivas.
118 Economía, sociedad y teoría de juegos
Por supuesto, siempre es posible decir que, en realidad, valoramos el hecho de que la entrada la hemos comprado nosotros. Al cabo, la utilidad no es el dinero. Si hago A es simplemente porque A me proporciona más utilidad, porque A supone, en términos de utilidad más beneficios que costes. Ganancias, utilidad y preferencias se confunden y, por definición, incluyen todo lo que es relevante para mí. El problema es que, si concebimos nuestra teoría como una teoría empírica, no estamos diciendo nada, es una pura tautología, como nos recordó en su día Harsanyi: “Si hacemos nuestros supuestos motivacionales suficientemente complicados, podemos ‘explicar’ cualquier tipo de comportamiento, lo cual, por supuesto, significa que no estamos explicando nada” (Harsanyi, 1965: 518). Esta crítica empírica es bien conocida20. Menos lo resulta la referida a aspectos metodológicos, apenas formulada, que aquí simplemente se esboza y que es más radical. No se debe dejar de mencionar su carácter provisorio, pero tampoco cabe desatenderla en tanto que compromete interesantes resultados de la investigación filosófica y científica. Problemas metodológicos. La otra fuente de crítica se dirige no contra una versión particular sino contra la posibilidad misma del lenguaje teórico sobre el que parece edificarse la interpretación de la teoría de juegos como teoría empírica: racionalidad y modelos intencionales. Conviene aclarar que la crítica va más allá del simple supuesto de racionalidad21 y, en ese sentido, es más fundamental que la anterior: niega la posibilidad del lenguaje intencional en el ámbito de la actividad científica. Como se vio, la interpretación de la teoría de juegos como una teoría empírica aparece inmediatamente comprometida con la descripción davidsoniana, y más en general, con lo que se ha convenido en llamar folk psychology, esto es, con un marco categorial de intenciones, deseos, creencias, expectativas, etc. Aunque con una matriz común, las críticas a ese marco presentan una fuente diversa de inspiración: lógica, la primera; metodológica, la segunda. La primera atañe a la sintaxis en la que se expresa el lenguaje intencional que, en ciertos aspectos, violenta las reglas de los llamados “lenguajes extensionales”, los únicos que —según atendibles filósofos de la ciencia (Quine, 1990)— utiliza la ciencia. Entre las particularidades de los lenguajes extensionales está que el valor de verdad de un proposición no cambia si sustituimos uno de sus componentes por otro con el mismo referente o con el mismo valor de verdad. Si en la proposición “España es una economía de mercado y su moneda es el dólar” yo cambio la segunda parte de la conjunción por otra igualmente falsa (como: “su moneda es el yen”), el valor de verdad de la conjunción, de la proposición completa, no se modificará, será igualmente falso. Pero esto es algo que no sucede con el lenguaje de creencias e intenciones. Términos como “creo”, “quiere” o “espera” actúan de modo muy particular desde un punto de vista lógico. Piénsese en una sentencia sencilla 20
De la claridad del signo de la literatura en este terreno es muestra el pesimismo de Selten, quien niega a la teoría de juegos cualquier relevancia empírica (Selten, 1985: 82). Tomada es sentido estricto esa afirmación parece querer decir algo más, incluso, que reiterar la condición formal de la teoría de juegos; parece querer decir que la teoría de juegos no resulta de utilidad, que la teoría de juegos no encuentra modelos reales. Ello, por supuesto, no la descalificaría como teoría matemática, pero sí como herramienta interesante para las ciencias sociales.
21
Por supuesto que, desde una perspectiva teórica, se pueden mostrar, por ejemplo, los sesgos que regulan el comportamiento de los individuos, desviándolos de los modelos de racionalidad, o los diversos mecanismos psicológicos que pervierten la formación de las preferencias (comportamiento acrático, preferencias adaptativas, etc.) (Elster, 1983; Mele, 1987). Ésa es una crítica que alcanza al supuesto de racionalidad, no a los modelos intencionales.
La teoría de juegos: ¿una teoría social? 119
como “Pedro se pregunta si von Neumann es....”. Si nosotros llenamos los puntos suspensivos con “uno de los autores de Teoría de juegos y comportamiento económico”, pudiera muy bien suceder que la proposición fuese verdadera. Si Pedro no está muy versado en ciencias sociales es muy posible que se pregunte acerca de la autoría del clásico libro. Pero si sustituimos los puntos suspensivos por “von Neumann” (el mismo referente) la proposición será, a buen seguro, falsa. A pocas luces que tenga, Pedro no se pregunta si von Neumann es von Neumann. En suma, el léxico de razones, creencias, el lenguaje intencional, en general, es ajeno a la ciencia: cualesquiera que puedan ser sus virtudes, aparece comprometido con sintaxis lógicas —llamadas “intensionales” 22 — ajenas que no se corresponderían con la que ha permitido edificar la mejor ciencia que conocemos 23. El punto de partida de la crítica son las implicaciones epistemológicas de la investigaciñon empírica. En opinión de los filósofos de la ciencia más atentos a los resultados de la neurobiología, términos como creencias y deseos pertenecen a una genuina teoría psicológica. Pero se trata de una teoría falsa, sustentada en una ontología incompatible con lo que conocemos. Ese lenguaje “explicativamente padece de enormes carencias, ha permanecido estancado durante veinticinco siglos, y su marco categorial se ha mostrado inconmensurable con las categorías de la ciencia física” (Churchland, 1989: 9). Estos autores admiten que aquella terminología puede ser útil en nuestra vida diaria, como lo sigue siendo la física tradicional. Seguimos diciendo que “el sol sale” o que “este libro cae mas rápido que aquel otro porque es más pesado”, aunque no consideramos aceptables los implícitos supuestos de esos enunciados a la luz de nuestros conocimiento. Experimentos psicológicos han mostrado que la idea de que un cuerpo sólo se mueve si es movido o impulsado por otro, la vieja física del impetus, forma parte de nuestra experiencia cotidiana y guía nuestra conducta más que la física newtoniana (McCloslkey, 1983). Afortunadamente, el sentido común no es un requisito necesario de la buena ciencia, sino que las más de las veces oculta un compromiso ontológico insostenible, una presunción sobre la existencia de entidades o marcos categoriales que no tiene otro fundamento que una intuición víctima de las muchas presunciones de nuestro lenguaje natural y constreñida a un estrecho ámbito de perpepción neurosensorial 24. Eso sucedería, en opinión 22
No es extraño que Quine —como Dumett— se declare conductista. Interesante resulta que Davidson —el filósofo de la explicación desde las “razones” (como causas, eso sí, no a la Wittgenstein)— muestre la misma desconfianza hacia los sistemas intensionales.
23
Conviene también ahora advertir que está lejos de ser una tesis sin problemas. La tesis de que la física puede prescindir de enunciados intensionales es discutible. Propiedades disposicionales (“ser soluble”, p.e.) y enunciados probabilísticos parecen requerir el uso de lenguajes intensionales.
24
Muy posiblemente tales teorías falsas se han instalado en nuestro cableado mental porque en algún sentido resultaban interesantes adaptativamente: dadas nuestras limitaciones computacionales, la necesidad de adoptar respuestas rápidas y con informaciones parciales, resultaban “suficientemente” buenas para el tipo de previsiones que, en la práctica, podríamos necesitar (Stein, 1996, para un intento fuerte de basar en ventajas adaptativas, entre otras, las teorías lógicas; y lo mismo para la teoría de la utilidad: Cooper, 2001). El viejo problema de “la justificación del razonamiento inductivo” —el que la inducción funcione a pesar de ser un razonamiento “inseguro”, no demostrativo— quizá encuentre solución por aquí: no hay tal justificación, sólo explicación (como tampoco hay justificación de la visión, sino explicación, y en ambos casos cometemos errores: “el procedimiento” es inseguro). Para ideas al respecto, Kornblith (1993).
120 Economía, sociedad y teoría de juegos
de estos autores, con la folk psychology popular, que se mostraría inconsistente con lo que sabemos sobre el cerebro humano. La quimera radicaría en esperar que podamos encontrar una teoría más básica —de base neurológica— que fundamentase tales conceptos: una reducción al modo como existe una explicación física del enlace químico. No hay reducción posible, porque sencillamente el marco categorial es falso. Del mismo modo que no se encontraron fundamentaciones químicas del flogisto o del calórico o que las “teorías” de la alquimia no se redujeron a las de la naciente química, sino que se eliminaron, se declararon sin sentido; del mismo modo, ha de descartarse el lenguaje intencional (Stich, 1985). Las críticas mencionadas son objeto de disputa en sus respectivos campos 25. No se puede ignorar que no se trata de críticas concluyentes, que no son críticas “científicas”, sino de principio, críticas “metacientíficas”, si se quiere26. No es que se haya mostrado que la teoría de juegos se funda en inconsistencias lógicas o en supuestos empíricos “destrozados” por la neurobiología. Por ejemplo, como se ha visto, la segunda crítica busca parte de sus razones en la propia historia de la ciencia, en paralelismos con revoluciones científicas clásicas27. Pero no es menos cierto que la crítica no puede ser de otro modo. Precisamente por lo que afirma: que no hay modo de demostrar que el aparato conceptual de la folk psychology es falso, que no se le encuentra soporte neurológico. Las declaraciones de ese estilo no son ni pueden ser resultado de la ciencia. Obligadamente, se trata de tesis metacientíficas.
5. Las réplicas En cualquier caso, sin valorar ahora la calidad última de los argumentos mencionados, resulta indiscutible que, de ser ciertos, sus implicaciones para la teoría de juegos —entendida como teoría empírica— resultan inequívocamente corrosivas. Y lo cierto es que han tardado en ser —si es que han sido— atendidas28. Bien es cierto que la descalificación de 25
Para una exposición de la historia y estado actual de los sistemas intensionales véase Gamut (1991, vol. 2). En la discusión en torno a la psicología popular hay, además de la tesis recordada, al menos dos enfoques diferentes dignos de atención: quienes sostienen que hay lugar para leyes que apelen a propiedades intencionales (Fodor) y quienes —con talante instrumentalista— ven en el lenguaje de la folk psychology un esquema útil frente a las personas (y los animales y los computadores) que nos permite realizar algunas predicciones (Dennet). Véanse los textos clásicos en Lycan (1990).
26
El propio Stich, uno de los protagonistas de las “descalificaciones filosóficas”, años después, cambió de punto de vista y se ha mostrado cada vez más escéptico respecto a las estrategias de los filósofos de realizar “a priori ultimatums to science” (1993: 11).
27
Sin embargo, mientras tales revoluciones apelaron a resultados de las nuevas teorías o a problemas no resueltos de las antiguas, en este caso la argumentación, en buena medida, se sustenta en la analogía: “del mismo modo que el flogisto o calórico no se explicaron —o redujeron—a los conceptos de la moderna ciencia, tampoco las categorías de creencia....” Por lo demás, estas argumentaciones son muy frecuentes en las ciencias cognitivas. Así, no son infrecuentes argumentos del siguiente tipo: del mismo modo que existe un módulo cerebral especializado en reconocer las caras debe existir un módulo cerebral especializado en la tarea x”. No es necesario recordar que esta argumentación muestra, a lo sumo, la simple posibilidad de existencia.
28
Un excepción clásica fue Jeffrey (1983). Excepciones recientes son Pettit (1991) y Schick (1991).
La teoría de juegos: ¿una teoría social? 121
la “crítica metodológica” es tan de principio que no cabe la réplica sencillamente cuestiona el terreno mismo donde se edificaría la teoría de juegos. Frente a la otra crítica la reacción ha sido tardía y, en todo caso, lo que se ha buscado es desarrollar una teoría de juegos más realista, más acorde con el comportamiento de los individuos y con escenarios más realistas (Camerer, 2003). Sea como sea, en líneas generales, la reflexión sobre la teoría de juegos entendida como teoría social no ha alcanzado muy alto vuelo. De su repaso se pueden, sin embargo, rescatar dos líneas de réplica a los argumentos expuestos29. La primera apelaría a razones epistemológicas para sostener que las teorías no se miden por la calidad (realista) de sus supuestos. La otra intentaría “expulsar” el problema aduciendo que los compromisos que la teoría de juegos toma como punto de partida son eso, puntos de partida que hay que explicar desde fuera, desde un desarrollo independiente de la teoría de juegos. La primera línea de defensa no haría sino rescatar una vieja disputa —plagada de equívocos— entre economistas acerca del realismo de los supuestos (véanse los textos en Caldwell, 1984: 1-200). Frente a quienes señalaron la falta de plausibilidad de muchos axiomas de la teoría económica, otros economistas (Friedman, 1953) defendieron la licitud de utilizar cualquier tipo de supuestos, por más irreales que fueran, siempre que de ellos se pudieran obtener predicciones empíricas compatibles con las observaciones. En el proceso de extensión de los modelos microeconómicos al conjunto de la ciencia social, las mismas palabras se han repetido una y otra vez30. Sin volver ahora a los viejos argumentos, vale la pena hacer algunos comentarios al hilo de nuestros presentes problemas 31; en particular, sobre el modo en el que no se pueden defender las tesis, tanto las de los defensores del irrealismo como las de sus críticos. 1. Algunas defensas de la irrealidad de los supuestos son incompatibles con la defensa del individualismo metodológico, tesis fundamental a la hora de utilizar explicativamente la teoría de juegos. Dicha defensa empieza siempre por recordar el sinsentido de muchas predicaciones de ciertos términos de las teorías: las clases no tienen “consciencia”, las naciones no tienen “voluntad”, el sistema capitalista no tiene “intereses o necesidades”; “conciencias”, “voluntades” e “intereses” son características que únicamente pueden encontrase en sujetos de decisión (individuos o, en otros casos, organizaciones dotadas de un sistema de toma de decisiones). Esta defensa del individualismo metodológico no hace sino mostrar el sinsentido de buena parte del léxico de las ciencias sociales, su incompatibilidad con lo que conocemos. Ese proceder equivale a cuestionar la aceptabilidad de explicaciones en virtud de la irrealidad de su andamiaje teórico, sin atender a su potencial 29
Las consideraciones que siguen no se refieren estrictamente a la teoría de juegos, abarcan a otras teorías que también suscriben supuestos fuertes de racionalidad (el núcleo clásico de la microeconomía, la teoría de la decisión, etc.). En la medida que la teoría de juegos se interpreta como una teoría empírica y se entiende comprometida con los procedimientos explicativos de esas teorías, sí que se ve afectada por lo que aquí se dice. Para una descripción clarificadora de esas relaciones, veánse los grafos temáticos de Guerreen (1996: 9-17).
30
Para un repaso crítico véase Ovejero (1988).
31
No es infrecuente en ciencias sociales que disputas teóricas se intenten conjurar con argumentos metodológicos. Recuérdese la apelación de Samuelson (1962: 201) a la licitud de “parábolas útiles“ (para una economía de un único bien, p.e.) en el marco de la famosa disputa del capital, para poder salvar las objeciones analíticas a los problemas de agregación de la función de producción (Harcourt, 1972; Cohen y Harcourt, 2003).
122 Economía, sociedad y teoría de juegos
predictivo32. Si se insiste en la licitud de cualquier tipo de hipótesis, habrá que empezar a pensar en abandonar esta estrategia de argumentación33. 2. La irrealidad de supuestos resulta estéril cuando las explicaciones son retrodicciones, cuando se intenta dar cuenta de sucesos, procesos o estados ya acontecidos. En tal caso carece de todo valor apelar al ajuste de las predicciones con las observaciones, inevitable por construcción, por punto de partida. Si en el plano observacional (por “abajo”) no hay posibilidad de refutación, porque la historia que se está contando empieza con el único requisito de adecuarse a él; y en el plano más propiamente teórico (por “arriba”) se dice que no hay que preocuparse por la plausibilidad empírica, en tanto cualquier supuesto es lícito, no hay control alguno de las explicaciones. Si por “arriba”, en los supuestos, todo vale, en nombre de la “irrealidad”, y por “abajo”, por los datos, se arranca con lo conocido, las explicaciones se convierten en enormes tautologías: un proceder que ha resultado cada vez más frecuente con la extensión de las estrategias metodológicas de la economía a otras disciplinas sociales donde hay poco lugar para las predicciones, y en las que, por lo general, las explicaciones son siempre retrospectivas. En muchos casos las teorías realizan una atribución, de entrada, de la propiedad de equilibrio —en un sentido, por lo general, poco preciso34 — a la situación que estamos analizando. Una explicación que arranca con una situación dada, la reconstruye como una situación de equilibrio, y luego se remata desde unos supuestos arbitrarios, carece de criterio de calibración. 3. La apología simplista de la irrealidad de supuestos descalifica buena parte de los trabajos en teoría de juegos, interesados en modelizar juegos que “jugadores reales puedan jugar” (Scharpf, 1990), en juegos evolutivos y dinámicos, acordes con escenarios sociales e institucionales “de cada día” (Binmore, 1998; Skyrms, 1996) o con los resultados de la teoría psicología, las ciencias cognitivas y la teoría evolutiva (Gintis, 2000; Camerer, 2003, Leinfellner y Köhler, 1998). Con independencia de sus (indiscutibles) problemas metodológicos, la interpretación de la teoría de juegos como una teoría social tiene la 32
Resulta difícil aceptar como único criterio la capacidad predictiva. Si tal es el único criterio, lo mejor es apostar por la introducción de contradicciones entre los supuestos, al cabo, de una contradicción se sigue cualquier cosa. Por lo demás, las teorías amparadas en conceptos “holistas” tienen bastante “potencia explicativa” y mucha parsimonia. Con “la consciencia colectiva” se puede explicar casi todo con muy pocos supuestos. Problemas típicos de la teoría social como por qué la gente vota, por qué se dan acciones colectivas o los fenómenos religiosos y nacionales, no lo son para conjeturas que partan de entelequias como aquella.
33
Se podría replicar que una cosa es el problema metodológico del sinsentido de ciertas predicaciones (del tipo “intereses nacionales”) y otro el teórico de la plausibilidad de los supuestos (la incompatibilidad con lo conocido, la falsedad empírica). Pero esa distinción me parece falaz: la exigencia de “compatibilidad con el conocimiento disponible” es una regla metodológica que reclama que la predicación sea verdadera (o simplemente pertinente), por eso no aceptamos “zapatos habladores” o “electrones amarillos”. No hay predicaciones “naturales”, preteóricas, sino predicaciones a la luz de lo que sabemos. El lenguaje natural siempre oculta compromisos ontológicos ignorados que, por lo común, se amparan en “intuiciones” que no se corresponden con lo que la ciencia —bastante alejada de la intuición en muchas ocasiones— nos informa (esto es lo que sucedería con la folk psychology en opinión de los Churchland). Se podría parafrasear a Keynes y decir que no pocos filósofos del lenguaje son víctimas de una teoría científica superada y no lo saben. La nueva información obliga a revisar la pertinencia predicativa. Si, por ejemplo, se descubriese una especie de sistema neuronal que conectase a los miembros de una clase social, la noción de “consciencia de clase” tendría sentido.
34
Sobre diversas ideas de equilibrio en ciencias sociales véase Ovejero (1994: 282-289). Sobre la ambigüedad del “equilibrio” en teoría de juegos véase Guerrien (2002: 50-63).
La teoría de juegos: ¿una teoría social? 123
ventaja —un modo de escribir derecho con los renglones torcidos—de comprometer a los investigadores con desarrollos útiles para la explicación de los procesos sociales. En la medida en que se desvincula de toda vocación de realismo en los supuestos, esa virtud —acaso la única— de la teoría de juegos como teoría social desaparece. 4. El irrealismo no puede buscar sus defensas en la disputa sobre “el realismo de las teorías” que ocupa a los filósofos de la ciencia, al menos en lo que son sus problemas centrales35. No se debe confundir la distinción entre términos teóricos y no teóricos —relacionada con la posición jerárquica en el seno de un teoría— con la distinción entre entidades observacionales y no observacionales. Cuando explicamos la desaparición de un pedazo de queso (y la presencia de unos excrementos) apelando a un ratón no nos enfrentamos al mismo problema que el físico que postula la existencia de entidades que explican un trazo en una cámara de burbujas (van Fraassen, 1980: 21). El ratón —como el agente racional— es observable, las partículas sólo detectables (Bourgeois, 1987: 305). En física, en ocasiones, una y otra distinción se superponen y con frecuencia explicamos con los inobservables electrones —como términos teóricos— las observables propiedades químicas. Pero no hay ningún problema observacional con el comportamiento de los individuos. Sabemos y sabemos bastante. El problema es que lo que sabemos no se ajusta a lo que suponemos (Lea, Tarpy y Webley, 1987). 5. Pero también hay críticas al irrealismo, en el contexto que nos ocupa, que no son de recibo. 1) Mostrar mediante un experimento mental que, en ciertos contextos, algunas hipótesis pueden no ser verdaderas (que, por ejemplo, la transitividad de las preferencias, puede no darse), no es mostrar que son falsas tout court, sino que pueden ser falsas, esto es, que son refutables, que tienen contenido empírico; 2) criticar los supuestos de la teoría de juegos porque “las personas no son egoístas”, es errar el tiro, la teoría de juegos no presume tal hipótesis; 3) no se deben confundir dos planos: no es lo mismo que la gente no se comporte como la teoría dice o asume —lo que es mala cosa para la teoría— que sostener que la gente es consciente de la teoría que describe su comportamiento (lo cual no es un asunto epistémico: nosotros, por ejemplo, no conocemos las redes neuronales —bien reales— que “usamos”; un galgo cuando persigue a una liebre y busca la intersección de su trayectoria no conoce los sofisticados cálculos que su cableado mental ejecuta; y, desde luego, una planta que “calcula”, antes de “decidirse” a florecer la temperatura media para saber si es otoño o primavera no sabe lo que hace)36; 4) cuando la argumentación se desarrolla en un plano normativo, las exigencias de realismo se relajan, en tanto no estamos ocupándonos del mundo real (existente y único) sino de un mundo posible37: no nos ceñimos a lo que los individuos hacen, sino a lo que pueden llegar a hacer, a lo que no es excluido por lo que sabemos sobre su repertorio de comportamientos (Ovejero, 1989)38. 35
Sobre este debate en ciencias sociales véase Ovejero (2003a: apéndice).
36
Un individuo puede tener aversión al riesgo e ignorar que la tiene (y, por supuesto, la teoría en la que ese concepto se inserta al dar cuenta de sus acciones). Pero lo que ya es distinto es hacer —por “necesidades de explicación“—“como si“ el individuo tuviera aversión al riesgo cuando de hecho no la tiene.
37
Por lo demás, también lo que sabemos sobre la mente humana, sobre su modularidad, avala la diversidad de los comportamientos (Sperber, 1996: 166).
38
Es esta una razón adicional para otorgar mayores licencias a la fundamentación —más “irreal“— de Harsanyi (1977).
124 Economía, sociedad y teoría de juegos
Pasemos ahora a la otra potencial defensa de los supuestos de partida de la teoría de juegos interpretada, no se olvide, como teoría social, aquella que “los expulsa”. Esta defensa podría decir que la teoría de juegos no empieza con tales compromisos, sino más tarde, que los presume, pero que no los asume (al modo como los economistas toman como dadas las preferencias —los gustos— de los consumidores, sin ahondar en su gestación). Quedaría para una teoría o, más sencillamente, para una argumentación independiente dar cuenta de aquellos supuestos. De ese modo, el problema de fundamentación quedaría conjurado de la teoría de juegos. A la vista de las líneas de trabajo existente se pueden identificar diversas vías posibles de fundamentación39: a) Un primer procedimiento consiste en apelar a mecanismos autónomos que “producen” conductas que parecen intencionales, pero que no son resultado de un proceso intencional. El candidato por excelencia es la selección natural: un algoritmo que opera sobre un conjunto de patrones en condiciones de reproducirse, una variación ocasional sobre ese conjunto, un mecanismo de selección y la heredabilidad de las unidades seleccionadas. Ese mecanismo, ciego y pautado, sin nadie que programe o que suministre instrucciones, produce resultados que parecen obra de una inteligencia, organismos que se pueden contemplar como maquinas diseñadas óptimamente para resolver problemas adaptativos (Dennet, 1996). Por supuesto, la escala temporal de los problemas habitualmente tratados con teoría de juegos es menos dilatada. Pero la estrategia es la misma: realizaciones que parecen el producto de la intencionalidad (o de la racionalidad) prescindiendo de la intencionalidad (o la racionalidad). Pensemos, por ejemplo, en los intentos de utilizar modelos de selección natural —la selección de mercado por ejemplo (Jacquemin, 1989)— que garantizarían que las conductas adoptadas fuesen racionales (óptimas) con independencia de su proceso de gestación40. La elección de lo mejor no sería el resultado de un proceso intencional, sino de la eliminación de lo ineficiente. La conducta racional no sería resultado de una elección, sino lo que “queda” de la extinción de otras conductas (ineficientes) 41. b) Otra posibilidad consiste en “expulsar” sólo aquello que no cuadra. Así, se sostendría que nuestra teoría explica un segmento de la conducta, que nuestras hipótesis de comportamiento deben complementarse —pero no sustituirse— con otros desarrollos 39
Como se dijo, dada la naturaleza de las críticas a las que pretenden responder, que se refieren al marco categorial de intenciones, creencias, etc., las “réplicas” que siguen suponen una defensa no sólo de la teoría de juegos como teoría social, sino también de cualquier teoría que se comprometa con supuestos más o menos fuertes de racionalidad.
40
En este caso hablar de “racionalidad” vendría a ser un modo económico de expresarse. Algo parecido a lo que sucede en biología con las explicaciones funcionales, cuando se da cuenta de cierto rasgo por sus consecuencias benéficas para un organismo. Tal cual esa explicación es insatisfactoria, pero damos por supuesto que, por debajo, opera un mecanismo de selección natural que resulta prolijo recordar en cada ocasión.
41
Algunos de los problemas particulares de esta propuesta: a diferencia de la acción racional (que, por ejemplo, puede decidir no escoger un camino o dar marcha atrás a la espera de una situación posterior favorable) la selección natural consigue lo menos malo no lo mejor (el óptimo); el mecanismo biológico se ampara en una diversidad de velocidades (entre cambios de escenarios y mutaciones) que no tiene paralelo en lo social; en los escenarios sociales no hay una especificación de los filtros y de la unidad de selección, etc. (Elster, 1979; van Parijs, 1981).
La teoría de juegos: ¿una teoría social? 125
referidos a aspectos normativos o psicológicos, “irracionales”. La teoría no resultaría falsa; todo lo más, la explicación incompleta42. También aquí el paralelismo habría que buscarlo en la biología: la explicación de los procesos evolutivos no se agota en la teoría de la selección natural; también se darían otros mecanismos, como el azar (a través de la deriva genética, por ejemplo) o la autoorganización física de los componentes biológicos. Una ligera variación de esta estrategia consistiría el limitar el ámbito de explicación, y, por ejemplo, sostener que el número de sistemas reales en donde resulta aplicable la teoría de juegos es escaso (y en los otros no se aplicaría), al modo en que sucedió con un artículo clásico sobre la teoría del equilibrio general que mostraba que los intercambios en un campo de concentración eran uno de los escasos escenarios reales en donde se cumplía dicha teoría (Radford, 1945). c) Otra opción es el “exilio interior”, esto es, sugerir que la explicación del punto de partida es cosa de otro desarrollo alternativo, pero dentro de la misma teoría de juegos o, más en general, dentro de alguna teoría de la racionalidad. Así cabría decir que el comportamiento observable —que se desvía de nuestras hipótesis— se podría abordar desde un modelo más complejo, de modo que conductas irracionales, tradicionales o altruistas aparezcan como estrategias convenientes de otro juego —racional— más básico43. En una interpretación más reciente se adopta la estrategia de reducir los resultados de la propia investigación neurobiológica, aquellos que en principio estarán llamados a ser el punto de partida de las ciencias sociales, a la teoría de la racionalidad. En lugar de afirmar la teoría social en la psicología biológica44, se buscaría asegurar los fundamentos de la neurología en la economía. No se fundamentaría la teoría de juegos en la neurobiología, sino la neurobiología en la teoría de juegos: “La teoría económica puede servir como un excelente modelo computacional de cómo el cerebro solventa algunos problemas de decisión” (Glimcher, 2003)45. d) Una versión que se podría calificar como “estadística” vendría a decir que los modelos se aplican a “grandes números”, que “a la larga y por lo general” la conducta racional se impone (Aumann, 1985: 36)46. e) Una (hipotética) versión “fundamentalista” podría apelar a algún tipo de prioridad lógica (distinta de la reducción, que sería prioridad teórica). Unos podrían sostener que las condiciones de modelización exigen trabajar en el límite, en condiciones ideales: 42
Para comentarios críticos y referencias Elster (1987).
43
Heiner, 1983. Buena parte de estas propuestas son intentos de superar los “problemas” de la teoría de la racionalidad satisfaciente de Simon (1986). Según éste, los individuos no se comportan persiguiendo lo mejor, se contentan con un suficiente. Vuelvo sobre esto en el punto e).
44
Es la estrategia de Camerer, Loewenstein, Prelec (2004).
45
Para una crítica véase Ovejero (2005). Vale decir que otros investigadores, que también acuden al amparo de la denominación de origen “neuroeconomía”, han destacado que “aunque la perspectiva de la toma de decisiones basada en la maximización de utilidad resulta persuasiva, las decisiones humanas rara vez se conforman a ella”. Antes al contrario, sus investigaciones sobre marcadores somáticos muestran que las decisiones “están ancladas en el lado emocional y muy alejadas del constructo del homo economicus” (Bechara y Damasio, 2005).
46
Obviamente, esto nada tiene que ver con los juegos iterados o dinámicos.
126 Economía, sociedad y teoría de juegos
mientras la conducta “óptima” es única, las que se contentan con un “bastante” son muchas y, por ende, no se dejan modelizar cómodamente47. f) Frente a las críticas metodológicas más fuertes, las que insisten en cuestionar la “ontología” de razones, de creencias y propósitos, cabría una estrategia de “irrealismo ontológico”. Vendría a ser el equivalente de la teoría del error de Mackie en ética (1977). Según éste, aunque nosotros podamos entender y llegar a acuerdos para afirmar que “la acción X es buena”, el conjunto de nuestro lenguaje moral carece de sentido ontológico, se refiere a unas propiedades (“morales”) inexistentes, lo que hace que nuestros juicios morales sean falsos. Nuestra “objetividad” semántica sería una superstición compartida, semejante a la que nos permite decir que “el sol sale”. En el mismo sentido se podría decir que, aunque edificada sobre una ontología falsa, la teoría de juegos —o la teoría económica—puede realizar predicciones y “explicaciones”. Las disputas se podrían dilucidar al modo como se resuelven las disputas sobre convenciones o reglamentos, de un modo no muy diferente del que permite a astrólogos o teólogos, que comparten lenguaje y protocolos, resolver sus polémicas. Sólo que en este caso, además, cabría realizar predicciones atinadas (al igual que sucede con la folk physics: “si saltas por el balcón, caerás”, etc.) 48. Cada una de esas versiones presenta dificultades propias. Pero más allá de ellas, hay un problema más fundamental en el propósito mismo que las inspira. Porque el ejemplo que vale aquí no es el de las preferencias “que se toman como dadas”. Aquí ya hay problemas con “el dato de partida” que, a la vista de la investigación empírica, es cualquier cosa menos un “dato fiable”. La posible comparación sería otra. Podría ser la de un biólogo que, después de apelar a algún tipo de “impulso vital”, remitiese a los químicos la tarea de encontrarle fundamento; o el de otro que, después de proclamar que toma como punto de partida los genes, no se mostrase dispuesto a aceptar los resultados que la bioquímica le proporciona y manejase su propia idea de “gen”. El problema no es que quede para una teoría independiente el encontrar los “supuestos”: ya disponemos de tales teorías independientes y no cuadran. Es lícito “expulsar” el problema a una disciplina independiente, pero es obligado atender a sus resultados e incorporarlos como “datos”. El químico no se sentirá obligado a entrar dentro del átomo, pero el átomo que él maneja no se lo puede inventar, es el que el físico le proporciona. En principio, no resulta impertinente confiar en resultados independientes proporcionados por otra disciplina, pero sí lo es —bajo pecado de inconsistencia— no atender a los ya disponibles. 47
48
Es lo que dicen los críticos de la teoría de la “racionalidad satisfaciente”. Los críticos lamentan que esta teoría no se presente en una anatomía formal única que la haga susceptible de incorporarse a la microeconomía convencional. Crítica que parece ignorar lo que está implícito en la propia teoría de Simon: mientras lo mejor (el óptimo) es único, los suficientes son diversos. No quiero decir que no quepa una formulación precisa de lo que es impreciso (ahí está la teoría de conjuntos borrosos, como ejemplo) sino algo más sencillo, a saber, que las condiciones normales de modelización (“esos tipos ideales“) se avienen mejor con el “óptimo“ (único) que con los (muchos) “suficientes“. No debe confundirse este “fundamenalismo” con otro que podría apurar forzadamente una sugerencia de Elster para el comportamiento egoísta. Según éste, razones “puramente lógicas invitan a dotar de prioridad metodológica a las motivaciones egoístas“ (Elster, 1990: 15): la existencia de al menos un egoísta es condición de posibilidad misma del altruista (en tanto este último necesita del algún otro en el que depositar su generosidad). Es inexacto hablar de teorías en estos casos. Una teoría o se enuncia explícitamente o no lo es. Por eso es exagerado hablar, como se hace, de que también los chimpancés tienen sus teorías “físicas”, su folk physics (Povinelli, 2003).
La teoría de juegos: ¿una teoría social? 127
Los problemas anteriores aparecen en la interpretación de la teoría de juegos como una teoría social. Las acusaciones de vaciedad, tautología, sofisticación o inadecuación empírica carecen de sentido referidas a una disciplina formal. De hecho, tales características son propias del estilo matemático. La “sofisticación” no es más que la otra cara de la preocupación por la anatomía lógica. Otro asunto es que en ciencias sociales acaso sea más importante disponer de explicaciones —de “mecanismos” (Hedström y Swedberg, 1998)— que de teorías y las primeras no acostumbran a presentarse en forma “sofisticada”49. De hecho, hay razones para pensar, con Schelling, que “aquello que es rudimentario en teoría de juegos es lo que será durante mucho tiempo lo más valioso” (Schelling, 1984: 241). Aunque sería mejor hablar de “sencillo” antes que de “rudimentario”. Usar modelos elementales es cosa distinta de usar torpes inferencias50. El teorema de Pitágoras es más elemental, pero no peor —más tosco— que cualquier otro generado en la geometría de Riemman. No podemos ignorar que las argumentaciones “informales” con frecuencia ocultan arriesgados compromisos ni que las analogías son sobre todo valiosas como instrumentos heurísticos51. En casos como esos hay que saber qué es lo que se hace.
6. Interpretación formal La otra interpretación de la teoría de juegos reconoce su condición de teoría matemática. La teoría de juegos sería, desde la perspectiva de las ciencias sociales, una herramienta formal, como lo es el análisis, la aritmética o cualquier otra pieza del magnífico edificio de la matemática. La teoría de juegos se entiende como un lenguaje formal que debe interpretarse en los diversos sistemas reales en los que se aplica, en los diversos contextos explicativos. Con un ejemplo: mientras que en la interpretación anterior el dilema del 49
Más de una vez se ha dicho: los grandes hallazgos de las ciencias sociales son las explicaciones (Ovejero, 2003a: 143 y ss.). En la medida que, por esa vía, se acercan a estrategias “narrativas”, las ciencias sociales resultan propicias a diversos “descuidos” metodológicos. Las “razonables” y realistas argumentaciones de muchos textos de ciencias sociales están saturadas de pequeñas trampas y falacias que escapan incluso a sus propios gestores: términos que no se definen o que se usan de modo diferente en distintos lugares; léxico común que se utiliza con pretensiones técnicas pero sin reparar en su natural polisemia; pasos argumentales con una apreciable dosis de arbitrariedad; inferencias descontroladas a partir de evidencias limitadas; secuencias causales que se ignoran y que operan en dirección contraria a la que se destaca. Puestos a decirlo todo, tampoco es realista una visión de las “ciencias de la naturaleza” como ciencia de “teorías”; resultan más “narrativas” de lo que parece (Cartwight, 2002).
50
Sin ir más lejos, el dilema del prisionero (o el del gallina), bien sencillos, han encontrado la obligada precisión —y operacionalización— que exige su utilización en programas de inteligencias artificial, al servicio, además, de la justificación de la moralidad. Véase, por ejemplo el intento de mostrar la racionalidad (egoísta) de ser moral (la tesis de Gauthier, 1986) a través de juegos realizados por robots “morales“ (Danielson, 1992).
51
Véanse, p.e., las críticas al uso informal de Elster (Wolf, 1990). De otro modo corremos el peligro de confundir las metáforas con los argumentos. Ello sucede con frecuencia con la interpretación dinámica de modelos estáticos. Algo que, por cierto, ha sucedido con algunos de los diagramas de Schelling (en manos de Elster, 1989: 27 y ss.). Los famosos diagramas no permiten esas lecturas del tipo “al principio se incorporan los altruistas y luego cuando hay suficiente recompensa aparecen los kantianos, etc.“. Allí sólo hay dos dimensiones: número de individuos y retribuciones; no hay tiempo. Sin duda ayudan a pensar y son eficaces pedagógicamente, pero, obviamente, no prueban nada y, en sentido estricto, son falsos.
128 Economía, sociedad y teoría de juegos
prisionero se entendería como una teoría social general, capaz de explicar —de subsumir— resultados dispersos de la sociología, la economía o la ciencia política; aquí, por contra, se vería como una estructura formal que adquiere un contenido específico cuando a sus términos y relaciones les damos una particular interpretación (votantes, huelguistas, contribuyentes; salarios, costes de información, impuestos, etc.). Desde esta perspectiva carecen de sentido afirmaciones como “la teoría de juegos (el dilema del prisionero) ha quedado refutada porque es el caso que X (que la gente vota, a pesar de no obtener beneficios, p.e.)”. En todo caso lo que quedaría refutado es la hipótesis empírica: “este sistema real (el proceso de votar, la acción colectiva, etc.) es un modelo de la teoría de juegos”, o más toscamente: “este pedazo de matemáticas es aplicable —sus propiedades son isomórficas— con este pedazo de realidad”52. Términos (jugadores) y relaciones (ordenes de preferencias) vendrían definidos implícitamente por los axiomas de la teoría. El hecho de que “nos suenen a algo”, de que estén provistos de algunas connotaciones, sería completamente circunstancial. Tampoco los conceptos algebraicos de “anillo” o “grupo” guardan relación alguna con la industria joyera o la práctica asociativa. Las connotaciones habituales, quizá útiles a efectos pedagógicos, deben desaparecer. Los teóricos de los juegos se encontrarían en situación parecida a los geómetras del XIX, cuando abandonan su idea de una ciencia “descriptiva del espacio real”, por otra más formal y abstracta en la que no se pretende otra cosa —nada menos— que diseñar una teoría internamente consistente. Los cultivadores de la teoría de juegos aspirarían a realizar lo que Hilbert hizo con su axiomatización de la geometría euclidiana, prescindiendo de las significaciones habituales de “punto”, “línea” o “entre” y quedándose con la “significación” definida implícitamente en sus axiomas. Al igual que algunas geometrías, como la euclidiana, encuentran modelos, sistemas reales (el espacio ordinario en este caso) en los que sus postulados son verdaderos, algunas partes de la teoría de juegos encuentran modelos reales. Pero, también, del mismo modo que otras geometrías (n-dimensionales) no encuentran sus modelos, otras partes de la teoría de juegos carecerían de referentes. No existirían sistemas reales que pudieran ser abordados —como modelos— de la teoría de juegos. Obviamente, esa falta de “realismo” no impide ni hace ilícito su cultivo. Sencillamente la realidad “no es su problema” (aunque lo pueda ser desde la perspectiva general del conocimiento, pues tiene escaso interés cultivar teorías que no sirven para nada, al menos, hasta el momento)53. La teoría se desarrolla por la generación de nuevos teoremas, no por la aplicación a nuevos escenarios, por el cultivo de las explicaciones. Desde esta perspectiva, la teoría de juegos nos proporcionaría un conjunto de estructuras algebraicas, un conjunto diferente de “juegos” que podrían encontrar diferentes modelos: el juego de la seguridad en la revolución china, el dilema del gallina en determinada batalla, cierto juego dinámico en procesos de evolución biológica o cultural, etc. Los sociólogos interesados en la acción colectiva, los politólogos interesados en la paradoja del voto y los economistas que se ocupan de los bienes públicos están trabajando en diferentes campos, aunque existe una estructura isomórfica idéntica que una vez identificada permite aplicar un mismo instrumento matemático. Pero sería erróneo decir que se trata 52
Pero no la teoría de juegos. Al cabo, podría existir otro juego (el de la seguridad, p.e.) que ayudara a dar cuenta de X, a hacer verdadera la hipótesis empírica.
53
Lo que no quiere decir que cierto día no encuentren aplicación, que ciertas teorías empíricas, en su desarrollo, requieran de teorías matemáticas a las que nunca se había prestado atención.
La teoría de juegos: ¿una teoría social? 129
de una teoría común, del mismo modo que nadie sostiene que el análisis matemático sea la teoría común de las diversas disciplinas en las que se utiliza. Tampoco se trata de reducción a una teoría más básica. No estamos frente al equivalente de la explicación de los fenómenos eléctricos y magnéticos desde una única teoría ni tampoco frente a la explicación de las reacciones químicas a partir de las combinaciones atómicas o del calor como resultado de moléculas chocando al azar. Una vez que se reconoce el carácter matemático de teoría de juegos desaparecen los problemas antes vistos. Para empezar la teoría no está comprometida con ninguna hipótesis empírica o con principios metódicos o epistémicos, en particular con la hipótesis de racionalidad. De hecho es consistente con los modelos de jugadores irracionales (Basu, 1990); y también lo es con el uso de la teoría de juegos en biología (Maynard Smith, 1982), sin tener que hacer supuestos sobre la racionalidad de los organismos54. Por otra parte, este enfoque desvincula definitivamente a la teoría de juegos de confusas discusiones. Como antes se sugirió, es errado suponer que la teoría de juegos adopta algún tipo de egoísmo antropológico. (En realidad, como más arriba se dijo, ni siquiera la teoría de la utilidad está comprometida con ninguna hipótesis egoísta. Maximizar la propia utilidad sujetiva no quiere decir que se quiere maximizar la propia retribución. Alguien que, a su propia costa, prefiere que los otros obtengan mayor retribución, estaría maximizando su utilidad (aunque no su payoff)55. Por lo demás, la crítica al “supuesto egoísta”, con frecuencia, oculta ignorancias previas y más elementales, por ejemplo, una confusión entre el individualismo metodológico (una estrategia explicativa: las unidades explicativas últimas son unidades de decisión), el individualismo ético (una hipótesis de filosofía moral, bastante razonable por lo demás, según la cual los sujetos de valoración última —de derechos, por ejemplo— son las personas) y el egoísmo (una teoría moral, debemos hacer aquello que nos asegura una mayor retribución; o empírica, los individuos hacen aquello que les garantiza una mayor retribución). Pero nada de eso afecta a la interpretación que nos ocupa, que no sólo se desvincula del egoísmo (como la otra 54
Quizá no esté de más recordar que la hipótesis de racionalidad para los animales no es insensata. Con esa maravillosa capacidad de los filósofos para resolver “definitivamente” ciertos asuntos (y en la que los analíticos de Oxford han sido a veces buenos exponentes: The concept of Mind de G. Ryle fue el texto clásico y genial en donde esa tesis tomó cuerpo), durante bastante tiempo se sostuvo —arrancando de Wittgenstein— que sólo quien usa un lenguaje puede actuar conforme a propósitos, tener intenciones y creencias. Hoy sabemos que las cosas no son tan sencillas (para una repaso de los resultados sobre cognición y experiencia consciente desde los resultados de la etología y las ciencias cognitivas: Griffin, 1992; Parker y Mckinney, 1999; VV.AA. Biology and Philosophy, 2004; Povinelli, 2003). Otra cosa es el problema, ya mencionado, de las explicaciones (neuro)biologicas y las conductas intencionales (una compilación ceñida a estos aspectos: Mohyedin, Newton-Smith, Viale y Wilkes, 1990). Un tercer asunto son los problemas de los supuestos de optimización en biología (cfr. Dupré, 1987; Sober, 1986), esto es, la utilización explicativa de modelos que —según los críticos— parecen presumir una intencionalidad (y más que intencionalidad, una capacidad de echar cuentas para escoger lo mejor) no ya sólo en organismos, sino en procesos que son resultado de la acción de muchos (individuos y organismos). De todos modos, sobre esto último, véase lo dicho en el texto, en el punto 5 del anterior epígrafe.
55
De ahí que algunos (Gintis, por ejemplo) distingan entre comportamiento sef-regarding y self-interested.
130 Economía, sociedad y teoría de juegos
interpretación), sino también —y aquí se separa— de cualquier hipótesis metodológica, de cualquier referencia a intenciones, creencias o deseos. Adicionalmente, esta interpretación ayuda a entender una circunstancia que no siempre ha sido bien comprendida, a saber, que la teoría de juegos puede ser utilizada en diversos niveles de abstracción, que puede servir a una teoría y a una explicación, a una teoría general (como la teoría del equilibro, como la teoría del monopolio) y, también, para escenarios particulares, como una revolución o un proceso social. Una teoría empírica no se mueve fácilmente en diversos niveles de abstracción. Por su parte, una teoría matemática no reconoce el problema de los diversos grados de abstracción, porque toda ella es abstracta. Como se ve no hay problemas de confusión conceptual aquí. Otra cosa es que sea fructífera desde la perspectiva de la teoría social. Considerar la teoría de juegos como una teoría matemática hace que los problemas técnicos, de consistencia, elegancia formal, devengan más importantes que los de plausibilidad empírica (en realidad, son los únicos problemas). Lo importante es disponer de teoremas, sin importar mucho si disponemos de sistemas reales con las propiedades postuladas por la teoría. Es en este contexto donde se hace inteligible la opinión antes citada de Schelling, así como esa circunstancia tan peculiar de que los mismos autores que están desarrollando la teoría no desatienden la oportunidad de mostrar su escepticismo respecto a muchos optimismos insensatos (Kreps, Binmore, Dasgupta, Selten)56.
7. Conclusión Se han visto dos interpretaciones de la teoría de juegos. Por diferentes razones, cada una presenta diferentes tipos de problemas y diferentes tipos de riesgos. Por el gusto de la paradoja se podría afirmar que la primera interpretación, aunque errada, resulta más interesante para la teoría social que la segunda, impecable desde la perspectiva de la teoría de la ciencia. Entendida como teoría empírica la teoría de juegos alienta una buena disposición realista, disposición particularmente conveniente en determinadas ciencias sociales, como la economía. Los interesantes resultados de la llamada Behavioral Game Theory (Camerer, 2003) son el mejor testimonio de esa circunstancia. Ahora bien, también hemos visto las dificultades de sus compromisos teóricos y metodológicos. Como teoría formal esas dificultades se disipan pero aparece el riesgo de la irrelevancia para la teoría social57. 56
Tampoco puede ignorarse cierto dimensión “pragmática”, por así decir, y que Binmore ha destacado para el caso de la biología: “los biólogos evolutivos, por lo general, tienen escaso conocimiento matemático, por ello encuentran muy complicada la literatura sobre teoría de juegos y se pasan la vida reinventando la rueda” (Binmore, 2003: xvii).
57
Camerer (2003: 3), distingue entre: games (taxomonía de situaciones estratégicas), analytical game theory (derivación matemática de lo que jugadores con diferentes capacidades cognitivas pueden hacer en los juegos) a la que también se refiere como game theory (con las notas añadidas de basada en la instrospreción y altamente matemática), y behavorial game theory (acerca de lo que los jugadores realmente pueden hacer). Creo que la propuesta que aquí se hace basta para capturar las diferencias que Camerer intenta destacar, incluidas sus interesantes investigaciones en el ámbito empírico. En realidad, da la impresión de que está intentado “reconocer” las diferentes implicaciones heurísticas que se siguen de entender la teoría de juegos como teoría social o como teoría matemática.
La teoría de juegos: ¿una teoría social? 131
En cierto modo esto recuerda la historia con la que empezamos. Unas matemáticas que nacen de los requerimientos de la teoría social, pero que en la medida que reconocen su genuina naturaleza se alejan de las necesidades que las inspiraron. Ahora su heurística, su línea de desarrollo, viene marcada por sus demandas internas, por sus propios problemas, que no tienen por qué coincidir con los de la teoría social. No tiene sentido la afirmación (o la esperanza) de que la teoría de juegos va a “solucionar los problemas de la teoría social”. Quienes hacen afirmaciones de ese cariz pocas veces están en condiciones de ilustrar con productos teóricos su optimismo. Las mayoría de las veces lo que proporcionan son “reescrituras” de problemas clásicos de la ciencia social (y no cabe ignorar que, en ocasiones, la reescritura es condición de posibilidad de la solución). No ya por lo dicho, porque por su propio desarrollo se aleja de los problemas que estuvieron en su origen, sino por una cuestión de principio: porque el primer requisito para poder aplicar una teoría matemática —como la teoría de juegos— es la clarificación conceptual del terreno. Sabemos bien, al menos desde Galileo, que para empezar a medir hay que saber qué se mide (que es cosa distinta de tener clara la noción de medida) y ello requiere que la propia teoría tenga clara su anatomía. La condición de posibilidad de cualquier uso sensato de los instrumentos formales es la especificación de las relaciones y conceptos que constituyen la teoría que los va a utilizar. Una vez se dispone de la teoría se ha de buscar la estructura formal —la teoría matemática— adecuada, respetuosa con el conjunto de relaciones de la teoría. Sobre el trasfondo de lo anterior y de la discriminación entre las dos interpretaciones de la teoría de juegos se pueden hacer algunas consideraciones finales que algún talante amigo podría calificar como conclusiones. 1. El reconocimiento de la fecundidad de la interpretación “errada”, empírica, de la teoría de juegos, no supone, en ningún caso, poner en duda el provecho para la teoría social de la formalización, de la introducción de las matemáticas. Las dos interpretaciones examinadas, cada una a su manera, no hacen más que confirmar la importancia de la formalización. Quizá no esté de más enumerar algunas de esas ventajas. La primera: para poder aplicar una teoría matemática hemos de hacer explícitos los supuestos de la teoría o, lo que es lo mismo, hemos de precisar las relaciones y los conceptos presentes en la argumentación. La segunda: el instrumental lógico o matemático permite asegurarnos de que nuestras cadenas inferenciales no contienen errores, de que las conclusiones se siguen de las premisas. La importancia de esas funciones no puede desatenderse. Las argumentaciones “narrativas” que tan persuasivas nos parecen, las de los historiadores clásicos, por ejemplo, están plagadas de conjeturas espontáneas propias del sentido común, de complicidades con el lector, o de relaciones de causalidad simplemente plausibles, que, por detrás de su aparente naturalidad y realismo, escamotean un montón de presunciones que no por no mencionadas, no existen. La tercera: incrementa la fuerza expansiva de la teoría, la posibilidad de extraer un amplio número de consecuencias, resultado de que, una vez se ha producido el adecuado proceso de formalización, cabe apoyarse en el potencial inferencial, deductivo, de la teoría matemática utilizada, siempre más poderosa que las implicaciones obvias y limitadas concedidas al lenguaje ordinario. La cuarta: hace posible manejar teorías complejas, con muchas variables. La quinta: facilita la comparación entre teorías, al detectar si son reducibles, redundantes, independientes o consistentes. La sexta: aumenta la calidad contrastadora, como consecuencia tanto del desarrollo de un
132 Economía, sociedad y teoría de juegos
amplio número de contrastaciones como de su mayor precisión (pace ciertas apologías de la investigación cualitativa, los adjetivos son finitos, los números, no; éstos nos permiten enunciados más precisos, más informativos y más falsables: por ello nos interesa más el enunciado “la mesa mide 130 centímetros” que el enunciado “la mesa es grande”). En suma, la introducción de las matemáticas supone un punto y aparte en la maduración y desarrollo de una teoría y su provecho para las ciencias sociales resulta indiscutible. 2. La formalización no sustituye a la teorización. Nada de lo anterior tiene sentido sin una teoría previa sobre la que se practica la tarea formalizadora (Ovejero, 2003b). Finalmente, lo que nos proporciona la teoría de juegos es un formato matemático adecuado para ciertas teorías empíricas. En un sentido más elemental, es lo que sucede con la operación material de agregar pesos y la de combinar longitudes: las dos comparten unas relaciones básicas que permiten hacer uso de la operación suma de la aritmética ordinaria. Algo bastante sencillo que nada tiene que ver con reducir, con subsumir unas teorías en otras. Lo único que nos recuerda es que introducir una estructura matemática exige, primero, dilucidar las relaciones básicas (la teoría) del sistema que se quiere explicar y, después, buscar en el arsenal de la matemática un sistema formal isomorfo con aquel, un sistema que pueda servir a cualquier teoría que incorpore relaciones básicas semejantes, pero no a otras. Por eso, la operación suma sirve para las longitudes y los pesos, pero no para las temperaturas (un líquido a 5 ºC y otro a 30 ºC, combinados, no nos dan otro a 35 ºC). En el camino hacemos uso de una hipótesis empírica del tipo “este sistema real queda bien descrito por este sistema formal”. En nuestro caso: “este conjunto de individuos actúan según los axiomas (referidos a preferencias, etc.) X”. Una hipótesis que puede ser verdadera o falsa, pero no hay que confundir el orden. Primero hay que conocer cómo son las cosas y después acudir a la estructura matemática más adecuada, respetuosa con las relaciones empíricas que se analizan 58. 3. Una misma teoría puede encontrar formatos metodológicos y matemáticos diferentes. La biología evolucionista pasa de un uso exclusivo de la explicación funcional a incorporar la explicación causal. La teoría de Marx se ha podido formular con explicaciones funcionales (Cohen, 1978) y con explicaciones intencionales (Elster, 1985) y fragmentos de su teoría económica —como la teoría de la explotación— con teoría de juegos (Roemer, 1982) y con álgebra matricial (Morishima, 1973). La teoría —y con más razón el objeto de investigación— puede sobrevivir a los instrumentos de que se sirve. La teoría de la acción colectiva es una cosa, los procesos de acción colectiva otra y una tercera la teoría de juegos. La primera se puede servir de la tercera para analizar la segunda, pero ésta puede ser abordada desde otras perspectivas. Que la teoría de juegos sea un instrumento que se avenga bien con la teoría de la acción colectiva y que ésta —como cualquier teoría un poco madura— defina y constituya su ámbito de problemas, el propio asunto de la acción colectiva, no niega la pertinencia de la distinción entre los diversos planos. Precisamente esos que confunde la primera de las interpretaciones de la teoría de juegos. 4. Las dos ideas acerca de la identidad de la teoría de juegos alientan dos tipos de desarrollo diferentes, de heurísticas. No es lo mismo una aplicación brillante en una explicación que un desarrollo formal, o para decirlo con nombres propios, no es lo mismo el trabajo de Schelling que el de Nash; no es lo mismo la explicación de una transición 58
Sobre los problemas de medición y cuantificación en economía, véase Rima (1995).
La teoría de juegos: ¿una teoría social? 133
política o del movimiento de los derechos civiles —y no hay que descuidar que, posiblemente, esos procesos no se pueden explicar solamente con modelizaciones de teoría de juegos— o el desarrollo de modelos de negociación o de acción colectiva que la generación de teoremas; no son de la misma naturaleza los desarrollos conceptuales de “masa crítica” y el de “estrategia mixta” 59. Los segundos son los que hacen la propia historia de la teoría de juegos. Los primeros son desarrollos de la teoría social, relativamente independientes de la sintaxis formal que utilicen y, en ese sentido, no podemos descartar la posibilidad de que encuentren —que utilicen— instrumentos formales distintos de la teoría de juegos para expresarse 60. 5. Reconocer las diferentes reglas de juego de ambas líneas y admitir que la segunda interpretación tiene un fundamento más sólido, no implica incurrir en el pecado del formalismo. Después de clarificar el terreno, de separar el plano empírico del formal, podemos empezar a preguntarnos por la fecundidad de la teoría de juegos o, con más precisión, por cómo se relaciona la teoría de juegos con la teoría social, o, con más sencillez, qué significa “usar”, aplicar, la teoría de juegos. Entendida como teoría matemática las cosas están claras: se trata de identificar en los procesos reales un sistema (un conjunto de relaciones) que resulte isomórfico con respecto a una estructura formal, a un “juego”. Pero, conviene insistir, con eso no estamos comprobando la teoría de juegos, como no comprobamos la aritmética cuando realizamos un suma. Sí lo hacemos con la hipótesis empírica: “este modelo matemático describe este sistema real”. En todo caso, una vez realizada adecuadamente la aplicación, el potencial demostrativo, los teoremas que la propia teoría de juegos utilizada haya desarrollado, nos permitirán desarrollar nuestra propia teoría, a través de nuevas predicciones, por ejemplo (nuevas aunque ya contenidas implícitamente en la teoría: una deducción no “incrementa” el contenido empírico de una teoría)61. 59
Por supuesto, un concepto desarrollado en el marco de la interpretación empírica puede acabar por desprenderse de todo contenido y acabar por integrarse en la teoría matemática. En buena medida ésa es la historia de la “masa crítica”, originariamente cultivada por necesidades prácticas, para dar cuenta de procesos migratorios, de la asistencia a actos públicos, entre otros (Schelling, 1978). En cierto modo es el mismo itinerario que el análisis matemático.
60
No se puede ignorar que, a veces, los cambios en los formatos suponen campos en los conceptos, en la teoría. Es precisamente lo que sucedió con la teoría marxiana de la explotación. Durante mucho tiempo parecía inevitablemente comprometida con la teoría del valor-trabajo: explotado es aquél que recibe bienes que valen menos (que incorporan menos trabajo) que lo que aporta a la producción. Una idea sencilla en su exposición, pero que arrastraba las debilidades de la teoría del valor-trabajo. De todos modos, ese matrimonio se ha mostrado innecesario y la teoría de la explotación se ha redefinido de manera analíticamente impecable apelando a las consecuencias distributivas del desigual acceso a los medios de producción: un individuo es explotado si su situación material pudiera ser mejorada con una distribución igualitaria de los medios de producción. En un formulación muy sumaria, ésta es la definición de explotación capitalista de Roemer, 1982. Vale decir que la explotación puede verse de tres modos (los dos primeros están conceptualmente relacionados): como apropiación por parte de unos del trabajo de otros; como intercambio desigual (de trabajo por salario); contrafácticamente, en relación con una distribución alternativa de los medios de producción, al modo de Roemer. No han sido menores los “reajustes conceptuales” en el caso de la teoría del equilibrio general (Mandler, 1999; Mas-Colell, 1987; Donzelli, 1986; Ingrao e Israel, 2004).
61
Esta descripción de “como debería ser la teoría“ es “clásica”: como un conjunto de axiomas interpretados que generan teoremas. Los problemas de la interpretación “clásica“ —sintáctica— de las teorías son conocidos (Suppe, 1974).
134 Economía, sociedad y teoría de juegos
6. Los problemas de fundamentos adquieren una perspectiva distinta según la interpretación adoptada. En la interpretación empírica eran los ya vistos, la plausibilidad de los supuestos, en uno u otro sentido. Para la interpretación formal los problemas son otros. Aunque la fundamentación habitual desemboca en la teoría de la utilidad esperada en ambas interpretaciones, la perspectiva es diferente. Mientras en un caso se trata de problemas de plausibilidad empírica y se busca realizar ajustes para compatibilizar el punto de partida con los comportamientos reales de los individuos en situaciones de elección; en el otro, simplemente, se trata de problemas de fundamentación lógica, de clarificaciones conceptuales 62. La teoría de la utilidad es un escenario común de confusiones entre ambas dimensiones 63. 7. Del hecho de que la teoría de juegos pueda cumplir diversas funciones no se sigue que tenga diferentes naturalezas. Por ejemplo, el dilema de prisionero puede: a) ayudar a explicar la catástrofe en un cine cuando se produce un incendio; b) invitar a buscar respuestas a por qué la gente se decide a votar o a participar en la acción colectiva (a pesar de que no tenga “razones retributivas” para ello). En el primer caso cumple una función teórica; en el segundo, heurística. Como teoría empírica, en un sentido muy estrecho, el dilema del prisionero es escandalosamente falso: la acción colectiva, las revoluciones, el ejercicio del voto y otros muchos problemas de las ciencias sociales, son ejemplares “refutaciones” del dilema. No hay que olvidar que la acción colectiva es un problema para una teoría social que lo reconoce como tal, que contempla como necesitado de explicación el hecho de que la gente se comprometa en empeños comunes cuando, “según la teoría”, no tiene razones para ello 64 (en cambio, la acción colectiva no sería un problema para una “teoría” que apelase a inconscientes colectivos, conciencias de clase o espíritus nacionales). En ese sentido se puede utilizar la teoría de juegos para reconocer problemas que necesitan explicación 65.
62
Vale la pena insistir en que: a) los conjuntos axiomáticos, como tales, no son problemáticos, y pueden ser tan arbitrarios como queramos; b) los problemas (de mediación de utilidad) no son de teoría de la metrización, ésta está bien desarrollada y conocemos bien los diferentes tipos de escalas métricas y los requisitos de su aplicación (Roberts, 1979); c) los problemas aparecen a la hora de obtener una función métrica que represente las utilidades (aquí ya estamos en el plano empírico), que es algo más que describir las condiciones de posibilidad —los requisitos que permiten— de una función de utilidad: no es lo mismo definir los requisitos de una escala cardinal que medir, que realizar la operación de medición, que asignar un número —que mide una propiedad— a un objeto.
63
Frente a tanto entusiasmo de los distintos gremios por la “utilidad“, por la presunta claridad de una noción que algunos ven como el cimiento básico de la teoría social, bueno es recordar la franqueza de Sen, quien reconoce su escepticismo a la hora de identificar “el significado oficial de la utilidad en economía“ (Sen, 1991: 280). Escepticismo compartido por otro economista con sensibilidad filosófica que recomienda prescindir de la palabra y seguir trabajando (Broome, 1991).
64
Habida cuenta de que participaría de los beneficios obtenidos tanto si toma parte en la acción —si incurre en costes— como si no.
65
En el mismo sentido en que el “problema” de la flecha que persiste en su movimiento una vez abandonado el arco, era un problema para una teoría aristotélica que sostenía que “todo lo que se mueve es movido por algo” (de ahí la teoría del impetus) pero no lo es para una teoría que contempla el movimiento continuo y uniforme “como un estado natural”.
SEGUNDA
PARTE
APLICACIONES CONCRETAS
Capítulo
7
Economía experimental y teoría de juegos Pedro Rey Biel1
1. Introducción La imagen que se tiene del trabajo empírico de los economistas es que utilizan una serie de variables cuantitativas —como el IPC, el PIB, el tipo de cambio, etc.— para contrastar la validez de sus teorías y con ellas predecir la evolución de la economía. El economista empírico dispone a menudo de bases de datos ya existentes y procedentes del mundo real para su trabajo. Sin embargo, existen otras opciones. No hay que olvidar que una parte de la economía, la microeconomía, estudia las decisiones individuales de los agentes económicos. En este entorno, el economista puede obtener sus propios datos diseñando una situación controlada, un experimento, en el que ciertos individuos tengan que tomar decisiones con consecuencias económicas, y observar cómo se toman esas decisiones y qué características del diseño experimental influyen en ellas 2. La codificación en una base de datos utilizando la información proveniente de las decisiones de los individuos puede convertirse en una herramienta útil y de primera mano para el economista con intereses aplicados. No es de extrañar que una gran parte de lo que hoy entendemos como “economía experimental” se haya dedicado a la teoría de juegos. A fin de cuentas, el objeto de estudio de la teoría de juegos es la interacción estratégica, y precisamente lo que nos permite un experimento es poder observar cómo los sujetos interactúan dentro de entornos estratégicos controlados. Un experimento económico típico comienza cuando un grupo de individuos o “sujetos”, habitualmente estudiantes universitarios, acuden a un “laboratorio”, normalmente un aula de la universidad o una sala de informática con ordenadores interconectados, aunque cada vez existen más espacios construidos con el fin específico de albergar 1
Agradezco los comentarios de Miguel Ángel Ballester, Jordi Brandts, Laura Diego, Inés Macho-Stadler y Javier Rey sobre una versión previa de este capítulo.
2
Aunque existe un número creciente de experimentos en macroeconomía, razones prácticas y legales limitan su extensión. En todo caso, la aplicación de nuevas políticas públicas y el estudio de sus consecuencias se puede considerar en ocasiones un “experimento”.
137
138 Economía, sociedad y teoría de juegos
experimentos. Allí se les entregan unas instrucciones que indican qué decisiones pueden tomar y cómo sus pagos dependen de sus decisiones y de las decisiones de los otros participantes. Nótese que precisamente la definición formal de un “juego” consiste en un “conjunto finito de jugadores”; es decir, los sujetos participantes en el experimento, un “conjunto no vacío de acciones disponibles para cada jugador”, que podemos explicitar en las instrucciones del experimento, y una “relación de preferencias entre las acciones para cada jugador”, que en un experimento vendrán dadas por las consecuencias económicas, los pagos, asociados al resultado de las decisiones de los participantes. Por ello, es relativamente sencillo reproducir las condiciones de los juegos estudiados de forma teórica y observar cómo se comportan personas reales ante situaciones experimentales que representan esos juegos. La economía no es la única de las ciencias sociales en la que se realizan experimentos. De hecho, los economistas experimentales hemos aprovechado una parte importante de la metodología utilizada para diseñar experimentos en psicología y sociología. Sin embargo, la economía se distingue de otras ciencias sociales por su énfasis en los incentivos de los agentes que toman decisiones. Como consecuencia de ello, lo que distingue a los experimentos económicos es el uso de incentivos reales para motivar las decisiones de los participantes. Normalmente, cuando analizamos las respuestas de un sujeto a un cuestionario psicológico, necesitamos suponer que el sujeto de verdad contesta lo que cree, siente o piensa y no nos engaña; es decir, que realmente prefiere ser honesto no importándole, por ejemplo, cuán embarazosa sea la pregunta. Por contra, en un experimento económico el sujeto recibe pagos distintos dependiendo de sus decisiones (y las de los demás) y por ello el experimentalista puede tener mayor control sobre las preferencias de los sujetos pues sólo necesita suponer que toman aquellas decisiones que creen que les van a reportar un mayor pago. Es decir, los sujetos en un experimento económico tienen incentivos tangibles “para decir la verdad”, para tomar la decisión que realmente creen que más les conviene, porque esperan que dicha decisión les reportará un mayor pago 3. Los incentivos que suelen darse en un experimento económico son normalmente pequeños pagos monetarios contingentes a las acciones tomadas. No obstante, también es frecuente el uso de otros incentivos como puntos extra en una asignatura en la que el experimentalista es profesor (cuando los sujetos son estudiantes), caramelos o incluso grandes cantidades monetarias (habitualmente en países en los que el tipo de cambio es muy bajo y uno de los objetos de estudio es el efecto de aumentar el tamaño de los incentivos). En todo caso, para que los incentivos del experimento permitan cierto control sobre las preferencias de los sujetos es necesario que se cumplan tres condiciones: 1. Contingencia: la cantidad de incentivo recibido debe depender al menos de la decisión tomada por el propio sujeto. 2. Dominancia: los cambios en la satisfacción del sujeto con el experimento se tienen que deber fundamentalmente a cambios en las cantidades de incentivo recibido. 3. Monotonicidad: un mayor pago del incentivo debe ser siempre preferido a un pago menor, y los sujetos no deben llegar a estar saciados. 3
Esto no es incompatible con que en ocasiones los sujetos experimentales tomen decisiones que les reportan pagos menores para, por ejemplo, aumentar los pagos de otro sujeto. Esta renuncia será una indicación de que quizá las preferencias de estos sujetos incluyan también el bienestar de otros individuos o conceptos morales como la justicia distributiva.
Economía experimental y teoría de juegos 139
Estas tres condiciones determinan cuál es el incentivo más adecuado para cada tipo de experimento. Por ejemplo, el pago con dulces puede no satisfacer la condición de monotonicidad debido a que puede ocurrir que a algunos individuos no les guste el dulce particular con el que se les paga (y no hay posibilidad de intercambiarlo) o por que la cantidad de dulces que obtengan en el experimento no haga muy recomendable su ingesta. Si los pagos son notas extra de clase, puede ser que no se satisfaga la dominancia, puesto que a los alumnos puede importarles más la imagen que puedan dar ante su profesor (y experimentalista) o sus compañeros a tomar una determinada decisión que unos pocos puntos en su nota final del curso, algo que quizá no ocurra cuando los pagos monetarios sean suficientemente altos. Debido a estas razones el uso de pagos monetarios como incentivos es el más extendido 4. La economía experimental ha alcanzado en los últimos cuarenta años un nivel de “normalización” que en la actualidad la equipara a otras ramas de la economía como la macroeconomía, la microeconomía, la econometría o las finanzas. De hecho, su metodología se ha aplicado a todas estas ramas y se ha establecido como un instrumento más que complementa y amplía el estudio de otros campos. Dos de los galardonados con el Premio Nobel por sus aportaciones a la teoría de juegos, John Nash y Reinhard Selten en 1994, y uno de los galardonados en 2005, Thomas Schelling, son precursores de la aplicación de experimentos económicos a problemas microeconómicos; si bien es cierto que el otro de los teóricos de juegos premiados en el 2005, Robert Aumann (1990), se muestra más crítico 5. La economía experimental tiene incluso su propio premiado con el Nobel de economía de 2002, Vernon Smith, “por haber convertido la experimentación en laboratorio en un instrumento de análisis económico empírico, en particular en el estudio de los distintos mecanismos de mercado” 6 . Hasta llegar a este reconocimiento, la trayectoria histórica de los primeros experimentos en economía nos ofrece algunas enseñanzas sobre las ventajas y los problemas de la aplicación de la metodología experimental. La primera serie de experimentos económicos se realizó en el campo de la elección individual en los años treinta del siglo pasado y consistió en la estimación de funciones de utilidad (que miden la satisfacción de los individuos con sus acciones o con las dotaciones de bienes que tienen) a partir de las decisiones de varios individuos entre diversas cestas de consumo hipotéticas 7. Tras la revolución que supone la publicación en 1944 del libro de John von Neumann y Oskar Morgersten y la definición en 1950 del concepto de 4
Incluso con incentivos monetarios, Loewenstein (1999) advierte que “los sujetos pueden verse motivados de forma importante por otros objetivos que no sean la maximización de beneficios. Entre estos motivos se encuentran el deseo de comportarse de cierta forma, el cumplir con ciertas expectativas del experimentalista, dar la impresión de ser listo, buena persona, un ganador...”.
5
Aumann se refiere fundamentalmente al problema de motivar correctamente a los sujetos experimentales y a los problemas de comprensión de los mecanismos de pagos. En ambos aspectos se han hecho importantes progresos en los últimos 20 años.
6
Smith compartió el premio con el psicólogo cognitivo Daniel Kahneman, que es uno de los precursores de la economía del comportamiento, una rama con muchos puntos de contacto con la economía experimental.
7
Aunque Alvin Roth (1995) fija el primer experimento económico en la Paradoja de San Petersbugo, realizado por los hermanos Bernoulli.
140 Economía, sociedad y teoría de juegos
equilibrio de John Nash, la teoría de los juegos, y en concreto algunos de los juegos sencillos más conocidos, pasan a ser objeto de estudio en el laboratorio. El primer juego en ser testado de forma experimental fue el dilema del prisionero (Flood, 1952), ante cuyos resultados el propio Nash se sintió decepcionado, pues mostraban que su concepto de equilibrio no explicaba las decisiones de un gran número de sujetos. No obstante, Nash conjeturó que una posible causa podía ser que en el diseño del experimento los mismos sujetos repetían el juego 100 veces. De esta forma, las observaciones de Nash sobre cómo sujetos reales jugaban varias veces consecutivas el dilema del prisionero, anticiparon el concepto teórico de que el equilibrio del juego repetido no tiene por qué coincidir con el equilibrio de una única realización del juego. En la conferencia de la RAND Corporation de 1952, que reunió a los teóricos de juegos más destacados de la época, estos se mostraron desilusionados con los resultados de los experimentos realizados hasta entonces.8 En cualquier caso, esta desilusión fue enriquecedora pues se tradujo en la mejora en el diseño de los experimentos y en la creación de nuevas teorías. Por ejemplo, Thomas Schelling utilizó su teoría de los puntos focales para señalar que, si en ciertos experimentos los sujetos eligen distribuciones equitativas, se puede deber a que tales distribuciones son prominentes y por tanto suponen un punto en el que los individuos pueden coordinar sus decisiones. Estos son dos ejemplos de cómo teoría y experimentos pueden retroalimentarse y dar paso a nuevas teorías y a nuevos experimentos. La historia posterior de la economía experimental muestra ejemplos similares de cómo avanzar en el conocimiento mediante el diálogo entre teoría y datos. En el campo de la teoría de juegos, los experimentos se han utilizado para estudiar temas clásicos como la coordinación, los equilibrios en estrategias mixtas, el aprendizaje en juegos repetidos, los juegos con dominancia iterada, la señalización o la reputación. En cuanto a las aplicaciones, se han diseñado experimentos que estudian las preferencias sociales, la negociación (estructurada o no), las subastas, los bienes públicos o las finanzas. Una aplicación clásica de la economía experimental es el diseño de distintos mecanismos de mercado 9. En un experimento podemos ver cómo distintas reglas de transacción pueden llevar a resultados más o menos eficientes y cómo variar el diseño del mercado afecta a esos resultados. En esencia, una de las funciones de los mercados es agregar la información entre los individuos y precisamente los experimentos permiten un método para capturar y procesar esa información. Una ventaja añadida es que se pueden llevar a cabo experimentos que testen el diseño de un nuevo mercado (o una medida política) antes de introducir una reforma, por lo que se puede comprobar su efectividad a un coste razonable y hacer cambios si se perciben efectos indeseables no anticipados en la fase de diseño. A pesar de los reconocimientos mencionados y de la aceptación de la economía experimental como un instrumento de análisis más, siguen existiendo algunas reticencias sobre el modo en que algunos experimentos se llevan a cabo y son analizados. Estas fricciones se deben parcialmente a la relativa novedad del método y a que los criterios sobre qué es un buen experimento comienzan sólo ahora a fijarse. La siguiente sección 8
Esta reunión se describe en Friedman y Sunder (1994: Capítulo 9) y en Nasar (1998).
9
Área en la que es pionero el ya mencionado Vernon Smith.
Economía experimental y teoría de juegos 141
ofrece una serie de comentarios sobre los criterios hasta ahora establecidos y sobre otras cuestiones prácticas a la hora de acercarse a la economía experimental. La manera de presentarlos es siguiendo la secuencia cronológica de pasos que requiere la realización de un buen experimento.
2. Etapas de la investigación experimental 2.1. Elaboración de una pregunta económica El primer paso de toda investigación es preguntarse qué es lo que se quiere estudiar, y en particular, por qué la metodología elegida, en este caso un experimento, es la más apropiada para dicho estudio. Los experimentos pueden cumplir alguna de las siguientes cuatro funciones: 1. Descubrir nuevas regularidades empíricas en áreas en que la teoría existente no ofrezca ninguna hipótesis. Por ejemplo, la observación de cómo los sujetos reparten cantidades monetarias en el laboratorio ha dado lugar a nuevas teorías sobre los criterios de justicia de los individuos o sobre sus preferencias por distintas distribuciones de pagos. 2. En el caso de que existan diversas hipótesis teóricas que compitan, los experimentos pueden ayudar a delimitar el rango bajo el que cada una de esas hipótesis puede cumplirse. Por ejemplo, los experimentos contribuyen en el problema de la selección de la solución empíricamente más relevante en juegos en los que teóricamente existen multiplicidad de equilibrios. 3. En el caso de que sólo exista una teoría aplicable, los experimentos pueden mostrar si existen condiciones bajo las que la teoría se cumple en los datos, y en ese caso validar su robustez. Por ejemplo, algunos resultados teóricos son sólo reproducibles cuando se mantienen condiciones de anonimato entre sujetos, por lo que una mejora de la teoría debería decirnos cuál es el rol que el anonimato juega en esas situaciones. 4. Finalmente, los experimentos pueden servir para estudiar nuevas instituciones en el laboratorio antes de introducirlas en el “mundo real”. Es el caso, por ejemplo, de los experimentos realizados por un equipo de teóricos de juegos dirigido por Ken Binmore, que observó el comportamiento de sujetos bajo distintos tipos de subastas y que fue utilizado por el gobierno británico para diseñar las subastas de las licencias de telefonía móvil de tercera generación en 2000 10. Es importante remarcar que las predicciones de la teoría de juegos dependen crucialmente de los detalles que definen el juego. En particular, las predicciones dependen de forma muy sensible del número de posibilidades que los jugadores tienen, de cómo se valoran los distintos resultados, de qué información tienen los jugadores o incluso del orden en que toman sus decisiones. Al contrario de lo que ocurre con datos de campo, el diseño experimental permite precisamente controlar todos estos detalles, aislándolos de otras posibles variables cuyos efectos pueden ser confundidos en una muestra de datos reales. Una ventaja añadida es que mediante la réplica del experimento original, podemos también observar cómo variaciones en esos detalles afectan a los resultados. 10
Véase, por ejemplo, Binmore y Klemperer (2002).
142 Economía, sociedad y teoría de juegos
Sin embargo, los experimentos también pueden tener algunas desventajas: 1. Validez Interna: dado que los detalles del juego son cruciales, es vital reproducir el mismo juego que se quiere estudiar en el laboratorio bajo las mismas condiciones, y cuidar que aspectos como la información que obtienen los sujetos, la percepción del juego en el que participan o los pagos que se obtienen no varíen respecto al juego teórico y por tanto, que los resultados del experimento permitan realmente ofrecer conclusiones sobre el juego y no sobre la situación, hasta cierto punto artificial, que se ha creado en el laboratorio. 2. Validez Externa: la “artificialidad” del laboratorio puede también afectar a las conclusiones, cuando se hace una traslación directa entre cómo se comportan los sujetos dentro del laboratorio y cómo se comportan en el mundo real. Dado que se pretende el mayor control sobre las variables que pueden afectar la decisión de los individuos, la abstracción de algunos diseños experimentales puede provocar que algunas de las variables que afectan de forma importante a las decisiones en el mundo real queden fuera del diseño del laboratorio y por ello no se puedan obtener conclusiones aplicables al exterior. Ambos peligros pueden ser afrontados con un buen diseño experimental que controle que no se introduzcan dentro del laboratorio aspectos que el experimentalista desconozca y manteniendo la honestidad científica al explicar bajo qué condiciones, eminentemente restrictivas, pero en todo caso científicamente interesantes, se han obtenido los resultados. En cualquier caso, la robustez de un resultado teórico se demuestra en su aplicabilidad al mayor número de casos particulares, incluido el “caso particular” del laboratorio. Finalmente, un buen experimento no debe evitar que una vez que se hayan conseguido identificar las variables que más afectan al fenómeno que se estudia en el laboratorio, la investigación continúe con datos de campo utilizando lo aprendido con el experimento.
2.2. Diseño de un experimento Un buen experimento es aquél que permite controlar las hipótesis más plausibles que expliquen el fenómeno que se quiere estudiar y por tanto, permita discriminar entre ellas, si bien la definición de “hipótesis más plausible” es difusa y en todo caso depende del contexto y de las teorías disponibles. El diseño experimental no debe pretender replicar el mundo real o un modelo teórico particular, sino que debe permitir la mejor oportunidad de aprender algo útil y de contestar a la pregunta que motiva la investigación. El dar con el diseño “más limpio” que permita identificar claramente una respuesta a la pregunta de interés es algo que se puede aprender fijándose en diseños previos. De hecho, la mayoría de los economistas que hoy realizan experimentos han aprendido colaborando con sus mentores 11. Como en toda investigación científica, puede existir el peligro de que la creencia firme en una hipótesis lleve a un diseño experimental que favorezca la confirmación de dicha hipótesis particular. Paralelamente, el análisis posterior del experimento puede estar sesgado hacia una hipótesis. Sin embargo, estos peligros no son ajenos a cualquier 11
No obstante, comienzan a aparecer libros de texto que ofrecen consejos sobre cómo obtener el mejor diseño. Véanse, por ejemplo, Davis y Holt (1993), Friedman y Sunder (1994) o Hey (1991).
Economía experimental y teoría de juegos 143
trabajo empírico en el que se deba elegir qué variables obtener y cómo analizarlas; si bien, como ocurre con los datos econométricos, los experimentalistas deben tener especial cuidado en hacer públicos sus procedimientos y sus datos, ya que los obtienen de forma más privada. En la fase de diseño, todo experimentalista debe tomar decisiones sobre al menos los siguientes temas: 1. Número de observaciones: puesto que el análisis estadístico y econométrico debe ser planificado antes de tener los datos, éste es el momento de decidir el número de observaciones adecuado para que los resultados sean suficientemente concluyentes. Este número estará necesariamente restringido por el número de sujetos que se puedan reclutar y debido a ello, por el presupuesto disponible para pagarles. 2. Pagos: el experimentalista debe cumplir su restricción presupuestaria a la vez que satisfacer los criterios de contingencia, dominancia y monotonicidad previamente mencionados. Aunque es cierto que se han observado efectos al variar de forma brusca el tamaño de los pagos, un buen diseño debe ser robusto a estos efectos. Además, es importante que los sujetos se sientan satisfechos con el experimento, no importando lo que ganen, por lo que se suele añadir un pago por participar no dependiente de los resultados. Este pago ayuda también a solventar los posibles problemas derivados de que los sujetos puedan incurrir en pérdidas durante el experimento y facilita el que los sujetos vuelvan a experimentos posteriores en caso de ser convocados. 3. Instrucciones: el laboratorio puede resultar un contexto extraño en el que los sujetos se enfrentan a una situación por primera vez. Por eso resulta crucial que las instrucciones sean claras y precisas y, para ello, muchos experimentalistas prueban sus instrucciones antes de utilizarlas. Una decisión a considerar es si debe introducirse un contexto que resulte natural para los sujetos (por ejemplo, “imagina que eres una empresa que debe decidir un precio”) o si es preferible dejar la situación abstracta (por ejemplo, “debes elegir un número”). El añadir contexto es en ocasiones conveniente para facilitar la comprensión y simplificar las instrucciones, pero a su vez puede sesgar los resultados por la familiaridad o no que los sujetos tengan con el contexto propuesto. En el debate sobre si los experimentos han de ser libres de contexto o no, han surgido nuevas áreas de investigación como los experimentos de campo (field experiments). Aunque la frontera entre la economía experimental y los experimentos de campo es particularmente difícil de establecer, en general, los experimentos de campo pueden utilizar poblaciones de sujetos especiales (y, por tanto, la aleatoriedad en la selección de sujetos deja de ser un activo), tareas reales (en lugar de representar el esfuerzo mediante la elección de un número se pide a los sujetos que realicen un esfuerzo real, como por ejemplo meter cartas en un sobre) o incentivos especiales (promociones dentro de la organización de una empresa en función de cómo se comportan en el experimento, en lugar de pequeños pagos monetarios) 12. 4. Dado que la definición teórica de un juego exige que las reglas del mismo deben ser información pública (common knowledge) conviene leer las instrucciones en voz alta para reproducir las condiciones del juego teórico que se estudia y que ningún sujeto pueda creer que otros sujetos tengan distintas instrucciones. Por la misma razón, y 12
Véase una buena aproximación a los experimentos de campo en Harrison y List (2004).
144 Economía, sociedad y teoría de juegos
aunque existen diferentes criterios, el tratar con las posibles preguntas de los sujetos durante el experimento es una cuestión delicada. Un diseño suficientemente claro debería evitar que se produjeran preguntas. En todo caso, es mejor tratar las respuestas en público, siempre evitando que se revele información que no sean clarificaciones de instrucciones, que hacerlo en privado y quizá fomentar sospechas entre los sujetos. Es importante también que un sujeto no pueda deducir de las instrucciones, correctamente o no, lo que se espera de él. 5. Repeticiones: la interpretación más aceptada de los conceptos de equilibrio en juegos supone que son equilibrios estables a los que se llega tras un proceso de aprendizaje. Por tanto, tiene sentido estudiar en los experimentos cómo aprenden los individuos y para ello diseñar experimentos en que los sujetos tomen sus decisiones repetidamente. Sin embargo, en ocasiones interesa estudiar el comportamiento ante una situación no repetida y es más difícil justificar el que los sujetos repitan el juego. En estos casos, debido a la conveniencia de obtener el mayor número de observaciones de los sujetos disponibles, se intenta crear diseños en los que hasta cierto punto las observaciones repetidas de un mismo individuo puedan interpretarse como observaciones únicas de individuos independientes 13. 6. Informática: el uso de terminales informáticas interconectadas posibilita y agiliza la realización de experimentos complicados y la recogida de los datos. Sin embargo, puede también contribuir a que la situación no sea natural para los sujetos, especialmente si no están familiarizados con el uso de ordenadores, aparte de aumentar el coste de ciertos experimentos y la dependencia en la disponibilidad de instalaciones y conocimientos de programación 14. De forma natural, la utilización de ordenadores para realizar experimentos ha ayudado a la creación de experimentos con agentes computerizados y simulaciones, que reproducen las condiciones del laboratorio con modelos de individuos cibérnéticos que interactúan según motivaciones programadas en un contexto virtual y que permiten expandir las conclusiones del laboratorio a poblaciones exponencialmente más grandes que las que, por razones prácticas y de coste, se pueden obtener en el laboratorio.
2.3. Selección de sujetos experimentales La gran mayoría de los experimentos económicos se lleva a cabo con estudiantes de licenciatura. Las razones principales, aparte de la cercanía a los experimentalistas académicos, es su relativo bajo coste de oportunidad (que puede reducir los pagos necesarios) y que tienden a aprender con más rapidez que otras poblaciones, lo que permite observar el proceso de aprendizaje de los sujetos con menos observaciones. Sin embargo, estas razones no evitan que en determinadas ocasiones la validez externa se pueda ver amenazada y por 13
No obstante, no se debe abusar de las repeticiones del experimento y se deben aclarar los supuestos que se hacen para interpretar las observaciones como independientes. En casos extremos un número excesivo de repeticiones puede llevar a la situación del personaje interpretado por Bill Murray en Atrapado en el Tiempo, donde repite el mismo día hasta que consigue “hacer las cosas bien”.
14
En los últimos años han surgido distintos programas —entre ellos Z-tree, diseñado por Urs Fischbacher—, que hacen la programación mucho más cómoda, aunque quizá no son tan flexibles como el trabajar con una programación propia.
Economía experimental y teoría de juegos 145
ello, para determinados experimentos, se hayan utilizado muestras más representativas de la situación concreta que se estudia. Un problema adicional de las poblaciones de estudiantes suele ser que, debido a la cercanía del campus con el laboratorio, obliga a controlar con especial cuidado el anonimato de los sujetos o el que nuevos sujetos en sesiones del mismo experimento no acudan informados de las condiciones del experimento. Tanto el anonimato como el que todos los sujetos partan de las mismas condiciones informativas es esencial para la traslación de las condiciones teóricas de un juego a un laboratorio. Por todo ello, uno de los activos más preciados de todo laboratorio experimental es la base de datos de sujetos. Es crucial cuidar este activo y hacer un seguimiento cuidadoso no sólo de las características demográficas de los participantes (edad, sexo, estudios...) sino también de la serie de experimentos en los que han participado, especialmente si el laboratorio hace series de experimentos en los que la experiencia previa puede influenciar las decisiones. Un tema clave en el cuidado de las bases de datos de sujetos experimentales, no sólo de las propias sino de las de toda la comunidad de experimentalistas, es que el experimento transcurra tal y como se ha explicado a los sujetos y que, por tanto, no se sientan “engañados” (deception). Aunque en experimentos psicológicos se han obtenido resultados interesantes observando el comportamiento de los sujetos tras un engaño, y de hecho el que alguna parte de nuestras instrucciones fuera falsa (los pagos reales, el número de sujetos, el número de períodos en que se juega...) podría resultar muy conveniente en términos de flexibilidad y costes, este tipo de sorpresa tiene el grave problema de que la dominancia y la contingencia se perderían si los sujetos pudieran dudar de, por ejemplo, la relación entre sus acciones y sus pagos. Dado que la credibilidad de los experimentalistas es un bien público que se puede perder con facilidad, los economistas experimentales son particularmente tajantes con la prohibición de engañar a los sujetos 15.
2.4. La sesión experimental Una buena planificación del diseño experimental ayuda a que la sesión en la que se lleva a cabo el experimento sea tranquila y transcurra bajo las condiciones especificadas en las instrucciones. En todo caso, es posible que se produzcan algunos errores y el experimentalista debe ser lo suficientemente flexible para solucionarlos, pero también debe ser honesto e informar en su publicación de cualquier anomalía no prevista. Entre los problemas más comunes se encuentran: 1. Insuficiencia en el número de sujetos: normalmente son convocados más individuos que sujetos se necesitan para el experimento y, nuevamente para cuidar la base de datos de sujetos, se suele dar un pequeño pago a los individuos que se presentan y no participan. Pero puede ocurrir que aun así el número de individuos sea insuficiente. La decisión de cancelar o no la sesión depende de que se pueda realmente llevar a cabo con un número menor de sujetos o de que, si se reclutan nuevos sujetos en el último momento, se pueda garantizar que han sido seleccionados siguiendo los mismos criterios que el resto de sujetos. 15
La preocupación por este tema es tal que existe un acuerdo tácito por el que no se acepta la publicación de ningún artículo en el que se sospeche que ha habido “engaño”.
146 Economía, sociedad y teoría de juegos
2. Problemas informáticos o con el mecanismo de interacción entre los sujetos: dependiendo de la gravedad del caso, se suele cancelar la sesión experimental, aunque se debe pagar el tiempo empleado por los sujetos. 3. Problemas con el mecanismo de pagos: en ocasiones existen problemas con la generación de los pagos a partir de las decisiones de los sujetos o incluso las unidades de pago previstas son insuficientes o inadecuadas para los pagos finales que se han de hacer. Una vez más, una buena planificación debe minimizar la posibilidad de estos errores.
2.5. El análisis de los datos Previamente a la realización del experimento, el investigador debe haber planificado qué sistema va a utilizar para recoger los datos, que obviamente variará dependiendo de que el experimento sea o no computerizado. Es importante en este punto darse cuenta de que el registro de los datos no incluye sólo las variables que representan las decisiones de los sujetos, sino también las condiciones en que esas variables han sido recogidas: los distintos tratamientos que puedan existir, el orden en que se han tomado las decisiones (especialmente si el experimento consta de varias fases), los pagos, la fecha del experimento, o la composición demográfica de la población, además de cualquier anomalía que pueda surgir durante el experimento. Es sorprendente lo poco que se recuerda sobre los pequeños detalles de la sesión cuando meses después se pasa a analizar los datos. Igualmente, en un buen experimento el tipo de análisis que se va a hacer debe estar planificado de antemano. De la misma forma que el método científico exige que las hipótesis sobre lo que se quiere estudiar sean formuladas con anterioridad a la observación, el saber qué características de los datos permitirían avalar una u otra de dichas hipótesis evita la improvisación y los sesgos por elegir aquellos instrumentos de análisis que pueden resultar más convenientes para confirmar una hipótesis. El análisis cuantitativo de los datos no tiene por qué ser necesariamente complejo. De hecho, si el efecto a estudiar es lo suficientemente robusto un análisis estadístico básico debería permitirnos contestar cuál de nuestras diferentes hipótesis tiene un mayor efecto. No obstante, según va avanzando la investigación y la confianza en el método experimental en economía, las hipótesis y los diseños se van volviendo más ambiciosos y cada vez se encuentran experimentos con análisis econométricos más complejos. Idealmente, las capacidades técnicas del experimentalista no diferirán de las del económetra que trabaja con datos de campo, puesto que en el fondo ambos trabajan con datos similares y buscan igualmente poder hacer un análisis descriptivo de sus datos y contrastar las hipótesis que sean más plausibles en cada caso.
2.6. Publicación de los resultados y nuevas preguntas Una vez analizados los datos, la decisión más importante del experimentalista es seleccionar qué parte de ese análisis hacer público. Un estudio experimental no necesita incluir toda la evidencia que haya podido recabar el investigador, sino aquella que es más concluyente. La selección del análisis que se realiza con vistas a la publicación no implica que a la vez no sea necesario proveer de suficientes detalles para permitir la replica del experimento. En un primer paso, al enviar un artículo experimental para su publicación, se debe incluir todo aquel material que se ha utilizado para obtener el resultado (formularios de
Economía experimental y teoría de juegos 147
instrucciones, datos originales obtenidos, procedimientos de reclutamiento de sujetos, métodos de emparejamiento de los sujetos en experimentos de teoría de juegos...), de manera que el evaluador editorial pueda juzgar y reproducir a partir de los datos originales el trabajo presentado.16 A fin de cuentas, a diferencia de lo que ocurre con los trabajos econométricos de campo, los datos son generados por el propio investigador y la única manera de comprobar que el análisis es correcto es dejándolos disponibles a la comunidad científica. A su vez, el permitir la disponibilidad pública de los datos experimentales puede generar un conflicto entre el interés científico de que otros puedan a su vez trabajar con datos de experimentos ya realizados por uno y el interés privado de explotar el propio trabajo. Este conflicto se resuelve de forma distinta en cada caso, pero existe consenso en que pasado un plazo razonable los datos deben pasar a ser un bien público. Aunque los incentivos profesionales actuales no lo fomentan, en condiciones ideales deberían existir más trabajos que replicaran experimentos anteriores y que comprobaran la robustez de los fenómenos expuestos, tanto mediante el nuevo análisis de datos ya existentes como con nuevos experimentos. En este sentido, se considera que un fenómeno adquiere cierta robustez cuando al menos ha sido observado por tres grupos de investigación independientes procedentes de distintos centros de investigación. En la actualidad no existen barreras de entrada entre las revistas de investigación económica para la publicación de trabajos experimentales. Artículos con experimentos aparecen regularmente en las revistas generalistas más importantes, como American Economic Review, Econometrica o Economic Journal, y también en las más orientadas hacia la teoría de juegos como Games and Economic Behavior e International Journal of Game Theory. Igualmente, desde 1998 existe una revista específica para la publicación de articulos experimentales, Experimental Economics.
3. Áreas de investigación experimentales en teoría de juegos A continuación se comentan tres áreas de investigación experimentales particularmente activas y en las que la teoría de juegos desempeña un rol fundamental. Si bien la lista no es ni mucho menos completa, sí se incluyen algunas de las preguntas más relevantes en las que la metodología experimental es particularmente útil.17
3.1. ¿Cómo valoran los individuos el bienestar de otros individuos? Uno de los supuestos fundamentales de la teoría de juegos es que los individuos toman sus decisiones estratégicas con el fin de maximizar su bienestar, representada por una función de utilidad. Sin embargo, la teoría nada dice sobre qué es lo que otorga “utilidad” a los in16
Véase una copia de los requisitos de la revista Econometrica para el envío de artículos experimentales en Friedman y Sunder (1994).
17
Una lista más completa se puede encontrar en Camerer (2003), quien ofrece un compendio del estado actual de la investigación así como de los temas que quedan por explorar.
148 Economía, sociedad y teoría de juegos
dividuos. En particular, un tema recurrente es si el nivel de bienestar de otros individuos influye en nuestro propio nivel de bienestar. Como ya se ha comentado, los primeros experimentos en teoría de juegos consistieron en la réplica de juegos sencillos como el dilema del prisionero para contrastar la validez empírica de los nuevos conceptos de equilibrio que se estaban proponiendo. En estos juegos, los jugadores enfrentan su propio interés material al interés de un colectivo: al cooperar un individuo se arriesga a ganar menos en términos monetarios pero puede ganar más, si los demás también cooperan. Sin embargo, este juego no nos permite distinguir si el individuo coopera porque cree que otros van a cooperar, y por tanto le interesa hacerlo para maximizar sus ganancias monetarias, o si lo hace porque realmente le importan los pagos de otros. Esos motivos pueden ser separados con el diseño de nuevos juegos que se han probado extensamente en el laboratorio. En el “juego del dictador”, un único individuo debe decidir cómo repartir una cantidad entre él y otro individuo. Si bien esta situación no es estrictamente un “juego”, puesto que no existe interacción estratégica, el observar en un experimento cómo los sujetos resuelven este problema nos puede dar un pista sobre cuánto valoran los individuos los pagos de otros individuos mediante la observación de las cantidades repartidas: por ejemplo, un individuo cuyo bienestar dependiera únicamente de sus propios pagos monetarios se quedaría con toda la cantidad. Los resultados de múltiples experimentos con este juego muestran cómo una proporción no despreciable de sujetos otorga una cantidad significativa, en algunos casos cercanos a la media, a los otros individuos, aun en condiciones que controlan estrictamente el anonimato entre los sujetos y con respecto al experimentalista. El “juego del ultimátum” permite reproducir la situación anterior añadiendo una segunda etapa en la que el individuo receptor puede ahora decidir si acepta o no el reparto propuesto. En caso de rechazo, ninguno de los individuos recibe ningún pago. Aunque este juego amplía el número de posibles razones por las que el individuo que decide cómo repartir puede ofrecer cantidades positivas, puesto que ahora podría hacerlo tanto porque valora el bienestar del otro como porque sienta miedo a que su propuesta sea rechazada, la observación de las decisiones del receptor son también interesantes. En particular, las decisiones del receptor nos permiten estudiar si las preferencias individuales dependen no únicamente de las distribuciones de pagos, en cuyo caso debería aceptarse cualquier reparto que otorgue al receptor un pago positivo, sino de cómo se llega a dicha distribución. Por ejemplo, un receptor puede rechazar una cantidad positiva pequeña, renunciando él mismo a obtener ningún pago, como castigo a que el otro individuo haya pretendido llevarse una proporción mayor. La realización de experimentos con estos y otros juegos sencillos de negociación, como los “juegos de confianza” (trust games) o “juegos de bienes públicos”, han permitido concluir que algunos individuos toman decisiones compatibles con que tengan preferencias por distintas distribuciones de pagos entre los individuos o cómo se ha llegado a esa distribución. Estos resultados han llevado a la creación de diversos modelos teóricos en los que los pagos de los demás o las intenciones señaladas por las decisiones de otros son un argumento en la función de utilidad propia 18. A su vez, se han realizado 18
Entre ellos, Fehr y Schmidt (1999), Bolton y Ockenfels (2000), Andreoni y Miller (1998), Cox y Friedman (2002) y Charness y Rabin (2002).
Economía experimental y teoría de juegos 149
nuevos experimentos para comprobar cuál de estos modelos explica mejor un mayor número de experimentos. El debate sobre qué modelo teórico es el más adecuado para capturar las preferencias individuales por las distribuciones de pagos está lejos de cerrarse.19 Además los resultados muestran que la importancia de los motivos incluidos en estas preferencias difiere dependiendo de las instituciones, la cultura, el individuo..., por lo que los experimentos en esta área han contribuido a abrir el camino a áreas como la economía del comportamiento. Este nuevo área intenta explicar cuáles son las motivaciones de los individuos, más allá de la maximización del propio bienestar, y qué relevancia tienen estas preferencias más amplias en distintas situaciones económicas.
3.2. ¿Cómo razonan los individuos? Cuando los sujetos participan en un experimento normalmente se encuentran en una situación que les es ajena, en la que se les requiere tomar decisiones abstractas que no se han encontrado previamente. El estudio de cómo se toman decisiones en esas circunstancias es interesante no sólo debido a que muchas situaciones en el mundo real no son repetidas, sino porque nos ayuda a entender la carga de a prioris con la que los sujetos entran en el laboratorio y porque además es vital para entender el posible aprendizaje en situaciones posteriores. Los conceptos de equilibrio clásicos en juegos no tienen un gran poder de predicción sobre el comportamiento de los sujetos cuando juegan un equilibrio por primera vez, aunque esto varía dependiendo de las características del juego y del concepto de equilibrio que se estudie. Pero esto no nos debe hacer pensar que los sujetos son incapaces de comportarse de manera estratégica en un primer período. Entre los modelos de razonamiento estratégico que más éxito han tenido en explicar el comportamiento inicial en juegos se encuentran los modelos de “grados de razonamiento” que asumen que los individuos eligen su mejor respuesta asumiendo que los otros sujetos son un grado de racionalidad menor que ellos y definiendo el primer grado de racionalidad cómo tomar una decisión al azar 20. Igualmente, los “modelos de equilibrio de respuesta cuantal” (QRE) han tenido éxito en explicar el comportamiento inicial al resumir en un único parámetro el proceso por el que los sujetos toman sus decisiones y permitir que los individuos puedan cometer errores. La flexibilidad del laboratorio permite nuevos diseños experimentales que ayudan a estudiar qué procesos de razonamiento siguen los individuos, y en particular, permiten poner a prueba los modelos anteriores. Una manera de tener más información sobre cómo razonan los sujetos es intentar identificar qué información es importante para la toma de sus decisiones. Por ejemplo, en lugar de ofrecer incentivos a los sujetos únicamente por las acciones que toman, se les puede preguntar por sus creencias sobre cómo jugarán otros sujetos y darles incentivos a expresar sus verdaderas creencias mediante un pago mayor cuanto mejor predigan el comportamiento de los demás. Otras técnicas aún más sofisticadas permiten medir el tiempo en el que los individuos tardan en tomar una decisión, y 19
Y en particular existen críticas a cómo algunos de estos experimentos se han analizado. Véase, por ejemplo, Shaked (2005) y su réplica (Fehr y Schmidt, 2005).
20
Véase Stahl (1993).
150 Economía, sociedad y teoría de juegos
utilizarlo como aproximación a lo compleja que dicha decisión resulta para los sujetos u ocultar información que los sujetos puedan descubrir para saber qué información les es más útil a la hora de tomar decisiones. Por último, en los últimos años ha emergido un nuevo campo, la neuroeconomía, que al incorporar una dimensión neurológica, se combina con los experimentos para permitir estudiar las áreas del cerebro que se activan ante la toma de distintas decisiones y relacionarlas con las zonas en las que se cree que se localizan ciertos procesos mentales o emociones. Con todo ello, se está avanzando en identificar los procesos mentales que influyen en la toma de decisiones económicas.
3.3. ¿Cómo aprenden los individuos? Las teorías sobre aprendizaje asumen que los individuos reaccionan ante la nueva información y eso les puede hacer cambiar sus decisiones. Los experimentos con juegos repetidos permiten precisamente controlar qué nueva información les llega a los sujetos cuando juegan una vez más el mismo (o similar) juego y, con ello, se puede inferir cómo “aprenden” a tomar decisiones o a cambiar decisiones previas. Con respecto al aprendizaje en juegos, es particularmente interesante recordar que la interpretación de los conceptos de equilibrio está relacionada con la estabilidad; es decir, con lo que ocurre una vez los individuos han aprendido cómo jugar. Por ello, los experimentos permiten investigar cómo los sujetos pueden llegar a aprender a converger a dichos equilibrios, si es que la convergencia se produce. Los dos modelos teóricos más populares sobre cómo aprenden los individuos son los de “aprendizaje por creencias” (belief learning) y “aprendizaje por refuerzo” (reinforcement learning). El primero de ellos asume que los individuos actualizan sus creencias sobre las preferencias o las acciones de otros agentes a través de lo que observan, pero no reaccionan especialmente ante aquellas acciones que les dan un pago mayor. Los modelos de aprendizaje por refuerzo, por el contrario, suponen que todo lo que preocupa a los individuos es su pago, y por tanto ponen mayor énfasis en aquellas estrategias que en el pasado les han dado un pago mayor. En la actualidad, se está trabajando con nuevos modelos teóricos que utilizan ambas ideas para explicar un creciente número de datos experimentales.
4. Conclusión La realización de experimentos económicos es especialmente atractiva para los teóricos de juegos puesto que permite observar cómo interactúan los individuos en situaciones estratégicas ante incentivos reales. Como en toda nueva área de investigación, la metodología está evolucionando y los criterios sobre cómo realizar buena investigación experimental comienzan a asentarse. En este capítulo se han ofrecido algunas ideas sobre las cuestiones metodológicas más relevantes así como una visión especialmente centrada en la teoría de juegos de algunos de los temas que se están estudiando utilizando experimentos económicos. Los avances que se están produciendo en economía experimental permiten mostrarse moderadamente optimistas sobre el posible acercamiento entre las diversas ciencias sociales. Los economistas experimentales no sólo han tomado prestado parte
Economía experimental y teoría de juegos 151
de la metodología utilizada en experimentos psicológicos, sino que sus resultados están permitiendo que motivaciones psicológicas complejas sean incorporadas al análisis económico hasta ahora más clásico. Igualmente, las contribuciones metodológicas de la economía experimental, y en particular el uso de incentivos reales, están siendo incorporadas a experimentos en otros campos como la sociología o la antropología. En paralelo a la consolidación de la economía experimental han surgido nuevas áreas de estudio que se han beneficiado de las condiciones que permite el laboratorio. La neuroeconomía estudia qué áreas del cerebro son activadas cuando se toman decisiones económicas. Los modelos de agentes computerizados y las simulaciones permiten estudiar poblaciones grandes con motivaciones económicas simples. Finalmente, los experimentos de campo (field experiments) son un área particularmente prometedora pues combinan el control sobre las decisiones de los individuos de los experimentos con la naturalidad de los datos obtenidos en entornos menos abstractos. La interacción entre estos nuevos campos, la economía experimental y otras ciencias sociales, puede producir importantes avances en la integración del estudio de las motivaciones humanas en entornos estratégicos, campo que precisamente la teoría de juegos contribuyó a abrir.
Capítulo
8
Subastas asimétricas: modelos y experimentos Alexander Elbittar
1. Introducción Las subastas se estudian tradicionalmente como un juego no cooperativo con información incompleta (véase el Glosario), el cual a su vez puede ser transformado en un modelo probabilístico con información completa a partir de las contribuciones de Harsanyi (1967). El modelo tradicional de subastas de valoraciones privadas asume típicamente que los precios de reserva de los postores son generados a partir de una misma distribución de probabilidad (Vickrey, 1961; Myerson, 1982; Riley y Samuelson, 1981). En situaciones de la vida real, esta simetría es usualmente violada, debido a que los postores saben por lo general en qué se diferencian de sus competidores. Tal es el caso de las licitaciones, donde participantes en una subasta se enteran de quiénes son aquellos competidores con ventajas en costos debido a la acumulación de experiencia. Asimismo, existe una percepción general en las privatizaciones de que las empresas existentes en el mercado valen más que las empresas entrantes. Éste es el caso, por ejemplo, de la compra de Wellcome, una compañía farmacéutica, por parte de Glaxo. Ambas empresas tenían sinergias que hacían valer a Wellcome más para Glaxo que para cualquier otra compañía competidora (Klemperer, 2003). Otros casos se encuentran en las privatización reciente del espectro radioeléctrico en distintos países. En Estados Unidos, por ejemplo, era una percepción entre los postores que Pacific Telephone Company tenía una valoración mayor para la zona de Los Ángeles que cualquier otro competidor entrante. En Gran Bretaña, durante la subasta de las bandas de frecuencia para la tercera generación de teléfonos móviles, se pensaba que empresas ya existentes en el mercado tendrían mayores valoraciones sobre las nuevas licencias a ser subastadas que potenciales entrantes con similares características. En otro contexto, Fang y Morris (2003) citan situaciones donde postores en una subasta pueden obtener alguna información acerca de las estimaciones de sus oponentes a través del espionaje industrial. Maskin y Riley (2000) hablan de las subastas de arte, donde los postores usualmente revisan sus estrategias, basándose en la participación de un colector de arte con la reputación de poseer altas valoraciones. Finalmente, desde el punto de 153
154 Economía, sociedad y teoría de juegos
vista del vendedor, Kaplan y Zamir (2002) refieren situaciones donde un vendedor puede conocer el orden de las valoraciones entre los potenciales compradores, lo cual le provee información valiosa en el momento de obtener rentas adicionales. La relevancia de la información acerca la distribución de las valoraciones de los demás participantes y su impacto en el comportamiento de los postores es el denominador común en estos ejemplos, algunos de ellos referidos a distintos formatos de subastas. Existe así el interés por determinar la incidencia de este tipo de información en el comportamiento de los actores en las subastas, así como en los ingresos esperados del vendedor y en la eficiencia de las asignaciones. El objetivo del presente capítulo es revisar los modelos teóricos más recientes sobre la teoría de subastas con distribuciones asimétricas, contrastándola con las evaluaciones experimentales que se han realizado en torno a sus predicciones de estática comparativa 1. Como se mencionó al inicio, el modelo estándar de la teoría de subastas con valoraciones privadas considera la venta de una unidad indivisible bajo los supuestos de neutralidad al riesgo, simetría en las distribuciones de probabilidad que modelan sus creencias e independencia en la generación de las valoraciones (Krishna, 2002). Estos supuestos, conjuntamente con el requerimiento de que el precio de reserva del vendedor es igual a cero, nos asegura la equivalencia de ingresos para el vendedor y la eficiencia de diversos esquemas de subasta (Myerson, 1982; Riley y Samuelson, 1981). Gran parte del trabajo experimental en subastas se concentró en sus inicios en examinar la equivalencia entre los formatos de subasta de primer precio, segundo precio, subasta inglesa y subasta holandesa. Por ejemplo, Coppinger, Smith, y Titus (1980) y Cox, Robertson y Smith (1982) iniciaron estos estudios concentrándose en la equivalencia de estrategias y de ingresos entre los formatos de subasta de primer precio y subasta holandesa. Por su parte, Kagel, Harstad y Levin (1987) se concentraron en la equivalencia de estrategias y de ingresos entre la subasta de segundo precio y subasta inglesa. En términos generales, los resultados de esta investigación se pueden resumir de la siguiente manera: i) la subasta de primer precio genera un ingreso superior a una subasta holandesa; ii) la subasta de segundo precio genera un ingreso superior a una subasta inglesa; iii) para el caso de la subasta de primer precio, modelos de aversión al riesgo parecen explicar, al menos parcialmente, por qué se realizan pujas por encima del equilibrio de Nash con neutralidad al riesgo; iv) mientras que para el caso de la subasta de segundo precio, modelos de racionalidad limitada parecen explicar por qué se realizan pujas superiores a los precios de reserva de los agentes (Kagel, 1995). Los modelos que presentamos a continuación tienen en común distintas características. En primer lugar, todos violan el supuesto de simetría, manteniendo la neutralidad al riesgo de los postores. En segundo lugar, la solución de cada uno de los modelos no es trivial y trabajan con un sistema de ecuaciones diferenciales ordinarias no estándar. En tercer lugar, la mayor parte de los análisis establecen comparaciones entre las predicciones del modelo de subasta de primer precio con distribuciones asimétricas y los modelos de subastas de segundo precio y de primer precio estándar. 1
Para una revisión de los principales modelos teóricos de subasta véase Krishna (2002). Para una revisión de la literatura experimental véase Kagel (1995).
Subastas asimétricas: modelos y experimentos 155
Iniciamos nuestra presentación con el modelo propuesto por Plum (1992), seguimos con el modelo de Maskin y Riley (2000) —de aquí en adelante MR— y finalizamos con el modelo de Landsberger, Rubinstein, Wolfstetter y Zamir (2001) —de aquí en adelante LRWZ. La presentación de los modelos de subastas seleccionados se restringe a las secciones que fueron sometidas a pruebas experimentales. El capítulo se organiza de la siguiente manera. En cada una de las secciones a continuación se describen las características básicas de cada modelo, sus predicciones de estática comparativa y los resultados experimentales obtenidos.
2. El modelo de Plum (1992) En términos generales, Plum (1992) analiza el caso de dos postores para un número arbitrario de distribuciones continuas y prueba que la subasta de primer precio tiene una única estrategia pura de equilibrio creciente monótonamente. Asimismo, resuelve unos casos para un conjunto de funciones de distribución paramétricas.
2.1. Caracterización general del modelo Plum (1992) considera un modelo con dos postores neutrales al riesgo que compiten por la compra de un objeto indivisible. La valoración, v i, de cada postor es privada e independientemente generada a partir de una función de densidad, g i(v), dentro de un soporte [v, − v i]. Gi(v) es la función de distribución acumulada de gi(v). Tanto las distribuciones como sus respectivos soportes son de conocimiento común entre los postores. Plum (1992) introduce la asimetría entre los postores a partir de una alteración de las cotas suv 2 > v. Por lo tanto, las valoraciones periores de los soportes de cada distribución. Sea − v1> − para el postor 1 tienden a ser más favorable que para el postor 2, lo cual nos dice que la distribución G1(v) domina estocásticamente a la distribución G2(v). En el caso de una subasta de primer precio, el ganador de la subasta con valoración v debe pagar su puja, b, obteniendo un beneficio de v-b. Por lo tanto, la utilidad esperada del ganador estaría representada por su beneficio multiplicado por la probabilidad de obtener el objeto, la cual está determinada por la distribución de probabilidades de las valoraciones de los postores. Tal como se mencionó al inicio, la solución de este problema para dos postores no es trivial y envuelve la resolución de un sistema de ecuaciones diferenciales ordinarias no estándar. Plum (1992) probó que para este formato de subasta existe un equilibrio único en estrategias puras que es estrictamente creciente con respecto a las valoraciones.
2.2. Predicciones de estática comparativa Una predicción inmediata del modelo de Plum (1992) es que dada una misma valoración el postor con la distribución de mayor soporte realizará una puja menor que el postor con la distribución de menor soporte. Por lo tanto, la subasta de primer precio produciría asignaciones ineficientes. Asimismo, se desprende del modelo de Plum (1992) que el postor débil preferiría un formato de subasta de segundo precio, mientras que el postor fuerte preferiría un formato de subasta de primer precio.
156 Economía, sociedad y teoría de juegos
2.3. Evaluación experimental Güth, Ivanova-Stenzel y Wolfstetter (2006) reportan un experimento en el cual se evalúan, a partir del modelo de Plum (1992), tanto el comportamiento de los distintos tipos de postores como las preferencias de cada tipo de postor para cada uno de los formatos de subastas. Los resultado experimentales arrojan: i) que los precios son significativamente más altos en la subasta de primer precio comparada con la subasta de segundo precio; ii) que en la subasta de primer precio el postor más débil tiende a ser más agresivo que el postor más fuerte; iii) finalmente, que los postores fuertes realizan pujas más altas por el derecho a dictar la regla de subasta.
3. El modelo de MR (2000) Similar al modelo anterior, MR (2000) trabajan en el contexto de valoraciones independientes, pero con valoraciones generadas a partir de distribuciones con diferente soporte. Mientras que en Plum (1992) la cota superior de la distribución del postor débil es menor que la puja del postor fuerte, en MR (2000) el postor débil tiene una probabilidad positiva de no poder pujar.
3.1. Caracterización general del modelo MR (2000) consideran la situación de dos postores neutrales al riesgo compitiendo por la compra de un objeto indivisible. Cada postor tiene información privada respecto a su valoración, vi, la cual es independientemente generada a partir de una función de densidad, gi(v), dentro de un soporte [v , − v i ]. Gi(v) es la función de distribución acumulada de gi(v). Tanto las distribuciones como sus respectivos soportes son de conocimiento común entre los postores. MR (2000) introducen la asimetría entre los postores a partir de una alteración de las cotas inferiores de los soportes de cada distribución. Sean v1 = 0 y G1(v) E y Dd 1. En este caso, el jugador A digno de confianza siempre decidirá desarmarse, y el jugador A oportunista no se desarmará siempre que Dt E. El jugador B se desarmará siempre que crea enfrentarse a un A digno de confianza y no se desarmará si se enfrenta a un A oportunista. Las creencias posteriores de B son p(A es digno de confianza/A se desarma) = 1. Prueba: y , y dados (5) y (7), el jugador preferirá desarmarse Asumiendo siempre a desarmarse sólo cuando A es oportunista. Dados (6) y (8), el jugador B preferirá desarmarse sólo cuando A es digno de confianza. Dados (5) y (6), el jugador B preferirá desarmarse sólo cuando A es digno de confianza siempre que D d 1. Si D d 1, entonces p(BD)= 1 cuando A es digno de confianza y p(BD)= 0 cuando A es oportunista. En ese caso, dados (1) y (2) el jugador A digno de confianza decidirá desarmarse, y dados (3) y (4) el jugador A oportunista decidirá no desarmarse siempre que Dt E. Dadas las estrategias A y B, las creencias se siguen de la regla de Bayes.
Capítulo
11
Teoría de juegos, ventanas rotas y negocios rotos Nelson Lara
1. Introducción Las políticas públicas se despliegan en terrenos donde se confronta y se somete a prueba permanentemente la teoría con la práctica y la práctica con la teoría. Son terrenos de arenas movedizas, llenos de trampas y de minas escondidas por todos lados. Los intereses de los actores públicos compiten por lograr el éxito o el fracaso de las políticas implementadas, dependiendo de si están en el poder o en la búsqueda de él, aparte de los intereses privados jugando tras bastidores. Cada campo de batalla donde se libran estas luchas generalmente difiere del campo vecino y si se trata de distintas entidades federales, entonces se acentúa la diferencia y, por supuesto, es difícil comparar al tratarse de países diferentes. La premisa anterior, si es aceptada, sirve para abordar una discusión actualmente en pleno desarrollo en Estados Unidos, desde la perspectiva de aportes teóricos y empíricos de un campo específico de batalla: la ciudad de Caracas. Esta discusión, por ahora, presenta dos puntos de vista, primero la teoría de las ventanas rotas, su presentación y justificación, la cual será abordada a través de los trabajos Broken Windows (Wilson y Kelling, 1982), contentivo de la teoría de las ventanas rotas y Broken Windows, Broken Business (Levine, 2005), como propuesta de aplicar la teoría al campo de los negocios. Los dos autores abordan la importancia de atender los pequeños detalles, como un elemento vinculante del éxito o fracaso de las instituciones públicas, el primero, y de las firmas, el segundo. Luego tenemos el punto de vista de las críticas a la teoría de las ventanas rotas por parte de calificados académicos como el profesor Bernard E. Harcourt de la Universidad de Chicago con su libro Illusion of Order, the False Promise of Broken Windows Policing (2001) y el profesor Steven Levitt, también de la Universidad de Chicago, quien conjuntamente con el periodista Stephen Dubner escribieron el conocido libro Freakonomics (2005). Al introducir la experiencia de Caracas en el debate de estas dos perspectivas, saldrá a relucir la pertinencia de su relación con la teoría de juegos, para de esta forma avanzar, al menos parcialmente, hacia dos objetivos: potenciar la importancia y vigencia de la teoría de las ventanas rotas, como herramienta para la gerencia pública y privada y revelar los 189
190 Economía, sociedad y teoría de juegos
movimientos estratégicos que se esconden detrás de la aparente linealidad de la interacción de actores involucrados en el tema de las ventanas rotas.
2. Qué dicen los partidarios de la teorías de las ventanas rotas La teoría de las ventanas rotas, desarrollada por James Q. Wilson y George Kelling (1982), se basa en la premisa de que una parte importante del delito es el resultado inevitable del desorden. En sus hallazgos encontraron que el delito, en cualquier centro urbano, era mayor en las zonas donde prevalecía el descuido, la suciedad y el maltrato a los bienes públicos. Una ventana rota en un edificio, si no era reparada pronto1, pasaba a ser el preludio para que todas las demás fueran pronto dañadas. Dio lugar al principio de la tolerancia cero (Dennos, 1997), basada en perseguir los pequeños delitos para así disminuir los grandes. Visto desde la perspectiva de Barragán, se trata de una política contentiva de incentivos para minimizar las autoexcepciones. Esta relación ya había sido observada por otro investigador, Phillip G. Zimbardo (1969), quien condujo el siguiente experimento: dejó dos coches abandonados, sin placas, de igual marca, modelo y color, uno en Palo Alto, California, y el otro en el distrito del Bronx, ciudad de Nueva York. El primero permaneció una semana intacto, mientras que el segundo había perdido llantas, motor, radio y espejos en unas horas. Al día siguiente, la tapicería había sido destrozada a navajazos. Zimbardo entonces procedió a romper una de las ventanas del automóvil ubicado en Palo Alto, situación que provocó su desmantelamiento progresivo. La conclusión fue que un coche con una ventana rota que permanece sin atención, es un coche que a nadie le importa, y por lo tanto se le puede saquear. James Q. Wilson y George L. Kelling escriben en marzo 1982 “Broken Windows”, en Atlantic Monthly, y dicen que “si el vidrio de una ventana en un edificio está roto y nadie lo repara, pronto estarán rotos todos los demás”. El descuido da la impresión que a nadie le importa la propiedad y ésta comienza a ser dañada. Si una comunidad presenta signos de deterioro y aparenta no importarle a nadie, mostrará como consecuencia un aumento del delito. Las manifestaciones más comunes de este deterioro son las ventanas rotas de los edificios abandonados y el graffiti. De hecho, en el experimento de Zimbardo sirven como incentivos para ocasionar epidemias de transgresiones. Camerer en su libro Behavioral Game Theory (2003: 12-14), cuando se refiere a juegos de coordinación trabaja el experimento de Van Huyck y Cook (1997) para mostrar los dos equilibrios de Nash. En ese juego particular se ilustran procesos en sistemas naturales y sociales en los cuales pequeños accidentes tienen grandes efectos en el largo plazo, como el efecto Lorenz. Camerer al referirse a las ventanas rotas dice: ...anécdotas sugieren evidencias de que, cuando existe una ventana rota en una comunidad, los vecinos sienten menos obligación de mantener sus patios limpios, de reemplazar 1
En un entorno donde no existen ventanas rotas, un dueño de edificio incurre en la primera autoexcepción y deja la ventana rota sin reparar. En este caso, las normas no escritas de una determinada comunidad ordenada, son afectadas por la aparición de ventanas rotas. Las autoexcepciones y sus consecuencias institucionales son trabajadas por Barragán (2003).
Teoría de juegos, ventanas rotas y negocios rotos 191 sus propias ventanas rotas y de pintar sus casas. Dado que los delincuentes cometen delitos en comunidades donde los vecinos prestan poca atención a su entorno y donde los delincuentes acechan, una simple ventana rota puede conducir a un proceso de efecto espiral de rompimiento social. Quienes toman decisiones en materia de políticas públicas aprecian la teoría de las ventanas rotas porque representa una manera fácil de atender problemas de decaimiento urbano. La mejor decisión es reparar cada ventana rota antes de que su efecto se propague por la comunidad como un virus.
Y entonces: “sólo los criminales, o los temerarios tienen algún negocio en una avenida sin protección, y por lo tanto más y más ciudadanos abandonarán la calle a quienes la merodean”. Los individuos pueden actuar bayesianamente al juzgar el desorden como problema, combinando evidencias de incertidumbre con creencias a priori y estereotipos culturales 2. Durante los años ochenta, el Metro de la ciudad de Nueva York se convirtió en el arquetipo de la inseguridad neoyorkina. Los usuarios, hartos de sufrir asaltos violentos, intimidaciones, robos, o de viajar en vagones lentos, deteriorados y cubiertos de graffiti, empezaron a abandonarlo y, conforme lo hacían, aumentaba el deterioro y la inseguridad en las instalaciones. Kelling fue contratado como consultor por la autoridad de tránsito de la Ciudad de Nueva York, y llevó a la práctica, junto con el director del Metro David Gunn, la teoría de las ventanas rotas. Había una razón para esto, pues si se comete una trasgresión, por pequeña que sea, y se deja sin perseguir, siempre habrá imitadores. Si alguien entra sin pagar al Metro y las personas observan que se sale con la suya, pensarán “y por qué yo no”. Así de poderoso es el motor de la imitación alentada por la impunidad 3. En su artículo original Wilson y Kelling sostienen lo siguiente: “los crímenes callejeros serios florecen en áreas en las cuales el comportamiento desordenado se mantiene impune. El mendigo descontrolado es una ventana rota. Asaltantes y ladrones, tanto oportunistas como profesionales, creen reducir sus probabilidades de ser atrapados o identificados si operan en las calles donde las víctimas potenciales ya están intimidadas por las condiciones anteriores. Si el barrio no puede evitar que un mendigo moleste a los transeúntes, el ladrón puede razonar que es incluso menos posible llamar a la policía para identificar a un asaltante potencial o interferir si el asalto realmente está sucediendo”. Un porcentaje importante de quienes cometen pequeños delitos terminan involucrados en delitos mayores. En la experiencia neoyorquina, el arresto de personas que no habían pagado su entrada al Metro o hacían uso indebido de sus instalaciones, mostró que 1 de cada 7 personas tenía una orden de aprehensión por algún delito mayor, y 1 de cada 20 portaba ilegalmente un arma 4. 2
Para una revisión del razonamiento bayesiano, véase Sedlmeier y Gigerenzer (2001).
3
Bentham planteó en su inecuación de utilidad, U(T)>S(T)P(S), que el transgresor toma la decisión cuando la utilidad que produce la transgresión U(T), es mayor que la sanción por cometer la transgresión S(T), multiplicado por la probabilidad de que sea aplicada esa sanción P(S). Si nadie se preocupa por las transgresiones, la probabilidad de que el transgresor sea sancionado tiende a cero y en consecuencia se maximizan los incentivos para transgredir.
4
Los hallazgos soslayados con motivo de la aplicación de la teoría de las ventanas rotas no los hace vinculantes a ella. Si algunos de los que cometen pequeños delitos han cometido delitos mayores, no implica que todo el que comete un pequeño delito cometa entonces un delito mayor.
192 Economía, sociedad y teoría de juegos
La batalla implacable contra el graffiti también arrojó buenos resultados. Dado que el graffiti era el emblema de la decadencia del transporte colectivo subterráneo, su eliminación elevó la confianza de los usuarios. En 1994 se aplicaron estrategias similares pero más amplias, atacar las transgresiones menores como orinar o arrojar basura en la vía pública con todo el peso de la ley, permitían atacar delitos mayores. La consecuencia fue comunidades más limpias, más cuidadas, las cuales no estimulaban la comisión de delitos.
3. Nuevas respuestas a críticas a la teoría de las ventanas rotas 3.1. Las críticas de Harcourt Harcourt (2001) centra sus observaciones desde la perspectiva de su libro Illusion of Order. The False Promise of Broken Windows Policing (Ilusión de orden. La falsa promesa de la política ventanas rotas). Se ubica en Nueva York, en el año 1994, cuando Giuliani y Bratton eran Alcalde y Jefe de Policía respectivamente e implementaban la estrategia policial, basándose en la teoría de las ventanas rotas, de atacar pequeños delitos relacionados con la calidad de vida. Ya la teoría había sido experimentada dos años antes en Chicago. El número de encarcelados en Chicago alcanzó 42.000 personas durante el período 19931995, mientras que en Nueva York los arrestos anuales se elevaban entre 40.000 y 85.000 en el período 1994-1998. En este punto es importante hacer algunas precisiones: 1) Las ventanas rotas no se refieren a espacios infinitos, ya que el número de ventanas son finitas; 2) el desorden tampoco se produce en espacios infinitos, ya que de lo contrario estaríamos en presencia de que toda una ciudad es ininterrumpidamente un desorden, incluyendo las instalaciones de las instituciones policiales; 3) entonces la teoría de las ventanas rotas es aplicable solamente en espacios acotados físicamente, por lo que las estadísticas generales de una ciudad no necesariamente reflejan lo que ocurre en un espacio acotado. El desorden en una calle afecta a las calles vecinas, el de un barrio al barrio vecino y con esta lógica se podría generalizar geográficamente la teoría. La respuesta a este interrogante se encuentra en la dinámica de las probabilidades subjetivas de impunidad, condicionadas por el entorno, las cuales disminuyen en la medida en que se alejan del epicentro del desorden y tienden a cero cuando se acercan al orden. Los argumentos que a continuación voy a desarrollar se desprenden de mi experiencia de aplicar la teoría de las ventanas rotas como Vicealcalde de la ciudad de Caracas5 durante el período 1995-2000. La primera precisión metodológica que se hizo en Caracas consistió en introducir el concepto de “nicho de impunidad” (Barragán, 1997): es un espacio público acotado físicamente donde se ha identificado la proliferación de un tipo o de varios tipos de ventanas rotas, que permite caracterizarlo por el desorden, el peligro y la impunidad. La segunda precisión tiene que ver con las interacciones estratégicas. La teoría de las ventanas rotas nace al observar el efecto de una ventana rota dejada al abandono, hecho 5
Caracas poseía un crecimiento incontrolado del 70% y una población de tres millones de habitantes durante ese período.
Teoría de juegos, ventanas rotas y negocios rotos 193
que disminuye la probabilidad subjetiva de potenciales transgresores de ser capturados por la policía, si cometen algún delito. La ventana rota activa un juego de delincuentes y decisores públicos. Por una parte el jugador delincuente que decide en función del nivel de impunidad que le sugieren las probabilidades subjetivas percibidas por la observación del entorno de las ventanas rotas y por otra el jugador decisor público que despliega políticas públicas orientadas a neutralizar los efectos de las ventanas rotas (desorden e impunidad). Estas dos precisiones obligan a evaluar cada juego en su propio campo de juego; es decir, las estadísticas, entre otras herramientas, deben ser aplicadas al desarrollo del juego en un determinado nicho de impunidad. Estos nichos de impunidad pueden repetirse con las mismas características, y de hecho es así, pero en sitios diferentes y con jugadores diferentes, independientemente de que se repitan las mismas reglas. En descarga de Harcourt, esas estadísticas de Nueva York y de Chicago son parte del discurso político, electoral y de mercadeo destinado a fines distintos al que nos compete, como es profundizar en el tema de la teoría de las ventanas rotas. Harcourt, al principio de su libro señala que la teoría de las ventanas rotas constituye una de las principales teorías de justicia criminal. Se focaliza en estrechar la relación policía-ciudadano para atacar delitos menores, como una manera de crear y mantener el orden en las calles urbanas y disminuir delitos mayores. Esta proposición anancástica, de nuevo premisa equivocada, no concuerda con el carácter no lineal de las interacciones contenidas en la teoría de las ventanas rotas. Premisa equivocada que se ha reflejado en escuelas de leyes como un nuevo pensamiento en teoría de normas sociales. Harcourt da el ejemplo de la New Chicago School, la cual se focaliza en cómo interactúan las normas sociales y la ley y en cómo esa interacción regula el comportamiento humano. Sus proponentes argumentan que las técnicas de las políticas públicas tales como ordenanzas contra pandillas que merodean en vecindarios, toques de queda juveniles y mantenimiento del orden, son efectivos porque cambian el sentido social, tal como el ser miembro de una pandilla o la posesión juvenil de armas de fuego. Aquí se observa la relación lineal causa-efecto, interpretación distante de la realidad. Ellos sostienen que estas técnicas pueden reducir el comportamiento criminal y fortalecer el cumplimiento de la ley. Esta relación, construida sobre premisas falsas, en la que desorden implica delito y control del desorden implica control del delito, al ser difundida ampliamente por la prensa popular de los Estados Unidos, en publicaciones académicas especializadas, en círculos de políticas públicas y en la academia, colocó en posición altamente vulnerable a la teoría de las ventanas rotas, agravado por la proliferación de estrategias de distintas modalidades de políticas de mantenimiento del orden. Harcourt expresa que irónicamente la popularidad de estas políticas se debe, en gran parte, al aumento exponencial de los encarcelamientos, pasando de 200.000 en el año 1970 a 1.600.000 en el año 1996. Kahan y Meares (1998) dicen al respecto que se focalizan en castigos severos, lo cual es un defecto práctico y moral. Aquí se observa de nuevo que la evaluación de las políticas se hace de forma general. Estados Unidos es visto como una gran ventana rota; es el efecto de las premisas equivocadas. Harcourt sostiene que la política agresiva de mantenimiento del orden no es una alternativa, sino una adicción a penas severas por parte del sistema de justicia. La teoría
194 Economía, sociedad y teoría de juegos
de las ventanas rotas ha pasado de ser un sustituto a ser un suplemento que aumenta las detenciones, los arrestos y los antecedentes criminales. El resultado es un sistema de castigos severos para delitos mayores y trato severo para delitos menores, cometidos por el ciudadano ordinario y minorías especiales. En este punto, es pertinente separar el concepto de la teoría de las ventanas rotas, de las infinitas maneras de transformarlas en políticas públicas y de su implementación. En mi experiencia de implementación de la teoría de las ventanas rotas en Caracas, se estableció una marcada diferencia entre el componente de prevención del delito y el componente de represión del delito. Las políticas de implementación de la teoría fueron acompañadas por políticas complementarias de incentivos y de máxima participación ciudadana. Estuvieron diseñadas en primer lugar para atacar en forma preventiva la aparición de las ventanas rotas, luego en eliminar las ventanas rotas existentes y por último atacar los fallos de la propia política, es decir, realizar arrestos. En ningún momento se utilizó la política como una trampa para capturar delincuentes, sino para aumentar la calidad de vida de los ciudadanos relacionados con el nicho de impunidad respectivo, escenario de aplicación de la política, y con su entorno.
3.2. La falsa promesa de mantenimiento del orden Harcourt pasa a precisar sus críticas a la teoría de las ventanas rotas, concretamente al concepto de mantenimiento del orden, formulando tres preguntas. En la Parte I de su libro (Harcourt, 2001: 59-126), se pregunta si existe alguna evidencia que sustente la teoría de las ventanas rotas o si una política de mantenimiento del orden ya implementada ha disminuido los índices de criminalidad. Él revisa información de Chicago y Nueva York y no encuentra evidencias. Robert Sampsom y Raudenbush (1999) confirman en sus investigaciones que no se corresponden las expectativas teóricas con los resultados. En el caso Caracas sí existen evidencias, de hecho en absolutamente todos los nichos de impunidad donde se implementó la teoría de las ventanas rotas los resultados fueron exitosos. Por ejemplo, la reubicación de un gigantesco nicho de impunidad conformado por el terminal de autobuses más grande de Caracas en situación de desorden total y por un mercado adyacente conformado por más de 10.000 trabajadores informales, bajó en más del 90% los delitos menores y mayores sin un preso. El esfuerzo se centró en duras y difíciles negociaciones con los actores existentes. El nicho de impunidad registraba denuncias permanentes de tráfico y consumo de drogas, clínicas clandestinas de abortos, robos, hurtos, secuestros, tráfico internacional de niños, prácticas de hechicería, trata de blancas, contrabando y lavado de dinero. Aquí se demostró el poder de la eliminación de ventanas rotas (Lara, 2005: 234). Luego en la Parte II de su libro (Harcourt, 2001: 127-184), formula la pregunta: ¿hasta qué punto es teórica la política de mantenimiento del orden? Para ello le hizo seguimiento a la tarea investigadora de Edgard C. Banfield y su estudiante, quien más tarde sería su colega James Q. Wilson. Es una tradición que la búsqueda para enriquecer modelos clásicos de criminología se produzca complementándolos con concepciones más amplias, naturaleza humana, normas y significados sociales. Es tradición el énfasis en normas sociales de orden y su influencia en la criminalidad. Harcourt aun cuando es de la opinión que esto constituye un paso positivo en la justicia criminal, señala que conduce a una dicotomía entre las personas que alteran el orden y la tolerancia de la ley (en otras palabras, entre el
Teoría de juegos, ventanas rotas y negocios rotos 195
orden y el desorden) y concluye afirmando que el resultado es la naturaleza represiva de la política de las ventanas rotas, aparte de costos significativos, quejas contra la conducta policial y denuncias de parcialización racial. El caso del rescate del espacio público del Boulevard de Sabana Grande de la ciudad de Caracas, ilustra cómo un nicho de impunidad de alta peligrosidad se transformó en un boulevard amigable, agradable, seguro y semilla de capital social. De nuevo el costo se centró en duras negociaciones entre los distintos actores y sin detenidos; sencillamente el poder de los efectos de la eliminación de las ventanas rotas conduce a probabilidades subjetivas de captura muy elevadas en caso de existencia de delitos, elevando sus costos. Los delitos en este espacio público descendieron casi en su totalidad y pasó de tener una actividad formal de 14 horas, a ser un boulevard de 24 horas. En la Parte III del libro (Harcourt, 2001: 185-216), surge la pregunta de cómo esta aproximación de mantenimiento del orden, una aproximación sin base empírica que no soporta un escrutinio teórico, se ha hecho tan popular, particularmente cuando existen tantas alternativas para detener los cacheos, los arrestos y los encarcelamientos. Después de revisar distintas teorías que han avanzado en la explicación del aumento de las penalidades, Harcourt ofrece un análisis retórico complementario. La teoría de las ventanas rotas ha transformado conductas meramente ofensivas en conductas que producen daño y grandes delitos. Aquí Harcourt incurre en conclusiones partiendo de premisas falsas. La teoría de las ventanas rotas no recomienda per se un método de implementación. Existen sociedades que actualmente penalizan pequeños delitos con mutilaciones; sin embargo, no sería sostenible el afirmar que la aplicación de la teoría de las ventanas rotas en esas sociedades implicaría asignarle la responsabilidad a la teoría.
3.3. La ausencia de evidencias empíricas El punto de partida de Harcourt es el simple hecho de que décadas después del primer artículo en Atlantic Monthly, la famosa teoría de las ventanas rotas no ha sido verificada. A pesar de múltiples exigencias de pruebas de que la teoría funciona empíricamente, no existen evidencias de ello. De hecho, la información de ciencias sociales existente sugiere que la teoría es incorrecta. Los que respaldan la política de las ventanas rotas generalmente se apoyan en dos estudios científicos, el de Wesley Skogan (1990), Disorder and Decline, y el trabajo de Robert Sampson y Jacqueline Cohen (1988), así como en la caída de los índices de criminalidad en la ciudad de Nueva York. El problema es, dice Harcourt, que estos estudios cuantitativos, al igual que evidencias a través de anécdotas, no comprueban la teoría de las ventanas rotas. Los estudios de Skogan se basan en información débil, peor aun, sus resultados revelan que no existe una relación estadística significante entre desorden y delito en cuatro de las cinco variables trabajadas. La variable que comprueba la teoría de las ventanas rotas es la relación estadística entre desorden y víctimas de robos, manteniendo como constantes la pobreza, la raza y el grado de estabilidad urbana. Las cuatro variables que no conducen a la comprobación de la teoría son robos en casas, robos con agresiones personales, violaciones y delitos de carteristas. Los hallazgos del caso Caracas, sustentados con estadísticas por nicho de impunidad, antes, durante y después de la implementación de la política, son una contribución
196 Economía, sociedad y teoría de juegos
relevante en este punto del debate. Se podría añadir el ejemplo del rescate del centro de la ciudad de Caracas, el llamado Casco Histórico (Lara, 2005: 220-224), conformado por 20 manzanas, el cual arrojaba las siguientes estadísticas para los meses de noviembre y diciembre: TABLA 11.1 1994
1995
1996
1997
1998
281
314
273
0
0
Robo de relojes y cadenas
52
119
72
0
1
Robos a personas
16
38
25
2
0
5
7
10
0
0
73
89
114
0
0
194
241
202
0
0
Robo de carteras a mujeres
Robos de vehículos Robos de móviles Hurto de carteras (carteristas) Fuente: Prefectura de Caracas.
La recuperación de ese espacio público se inició en el año 1996, el objetivo trazado apuntó hacia la eliminación de todos los factores que producían desorden y sensación de caos. Se realizó una dura negociación de reubicación de trabajadores informales distribuidos en una densidad de más de 261 por cuadra. Se desarrolló el concepto de Unidad de Espacio Público6 para atomizar las negociaciones, en la búsqueda de su celeridad. Se establecieron regulaciones con el sector comercial formal en relación con el manejo de la basura y con el mantenimiento de las fachadas, lo que incluía la eliminación de graffiti. Con la ayuda de los medios de comunicación se relanzó el espacio público como un espacio libre de delincuentes. La política se terminó de implementar durante el primer semestre del año 1997. Los resultados mostrados en el cuadro anterior fueron contundentes. En relación con la disminución de los índices de criminalidad en la ciudad de Nueva York, Harcourt expresa que ese resultado dice muy poco sobre la teoría de las ventanas rotas. Muchas grandes ciudades de los Estados Unidos, que no han implementado la política de mantenimiento del orden y atención agresiva a los pequeños delitos, han experimentado una caída de los índices delictivos y en algunos casos caídas proporcionalmente mayores que la de Nueva York. Según citas de Harcourt, existen otros factores que contribuyeron al resultado de Nueva York, como por ejemplo, el incremento del número de policías de la ciudad, un cambio en el patrón de uso de drogas (de crack de cocaína a heroína) las condiciones económicas favorables de los años 90, el nuevo sistema computarizado de mapas para seguimiento de delitos, el arresto de pandillas de traficantes de drogas, así como también el cambio de comportamiento en adolescentes (Karmen 1996; Fagan, Zimring y Kim 1998; Butterfield 1998). 6
La Unidad de Espacio Público es un concepto del autor referido al tema de la economía informal. Es un espacio público acotado que posee un valor de explotación comercial diferente al de su entorno. Una entrada de metro, una parada de transporte público, una plaza, un parque, una acera o un cruce peatonal, son ejemplo de ello.
Teoría de juegos, ventanas rotas y negocios rotos 197
Harcourt continúa basándose en una premisa equivocada para evaluar la teoría de las ventanas rotas. Por ejemplo, aun refiriéndose a un determinado nicho de impunidad donde se esté aplicando con rigurosidad la política de las ventanas rotas, no se podría influir en asesinatos por motivos pasionales, genéticos, económicos o decididos por organizaciones criminales o delincuencia organizada. Las ventanas rotas, en sus contextos y en sus alcances, es uno de tantos factores a considerar en el combate del delito. Continúa Harcourt diciendo que, más importante aún, no existen razones para creer que la teoría de las ventanas rotas sea el mecanismo que explica cualquier contribución de que la iniciativa de la calidad de vida pueda haber influido en la disminución del delito. El hecho se explica por el aumento de los arrestos por delitos menores en la ciudad de Nueva York desde la implementación de la estrategia policial, aumentando en más del 50% en el primer año. Estos arrestos alcanzaron el número de 205.277 en 1996, de 133.446 en 1993 (Farrel, 1998). En contraste, el número de denuncias menores permaneció estable, con 421.116 en 1993, comparado con 424.169 en 19967. Ante estas estadísticas, Bratton manifestó estar en una bonanza policial, cada arresto era como abrir una caja de Cracker Jack, donde el juguete era un cuchillo, un arma de fuego o un solicitado. La euforia policial se contrastaba con la desmoralización de los delincuentes. Kelling expresó por entonces que reestablecer el orden reduce los delitos y añadió que el delito se reduce al menos en parte, ya que el restablecimiento del orden implica conectar la policía con personas armadas y con quienes cometen delitos mayores (Kelling y Coles, 1996: 137). Para Harcourt, el hecho es que si la política de calidad de vida contribuye en algún grado a disminuir el delito en la ciudad de Nueva York, el mecanismo primario no es la teoría de las ventanas rotas. El motor primario parecería ser el incremento importante del poder de vigilancia ofrecido por la policía, acompañado con el elevado número de detenciones. Pienso que Harcourt recurre acertadamente a otros factores que tienen relación con el delito. Más vigilancia y más detenciones de delincuentes contribuyen a bajar los índices delictivos, es verdad, al igual que, por ejemplo, a mayor iluminación de los espacios públicos menor delito, lo que refuerza las ventanas rotas como un factor. Más adelante veremos otros factores a los que se refieren Levitt y Dubney.
3.4. Una genealogía del mantenimiento del orden Finalmente Harcourt dice que la aproximación del mantenimiento del orden a la justicia criminal no le va mejor que en el nivel teórico. El hecho sorpresivo e irónico es que la política de las ventanas rotas comparte el mismo marco conceptual que su alternativa de encarcelación masiva y la teoría de la incapacitación. La teoría de las ventanas rotas tiene sus raíces en conceptos conservadores desarrollados durante la segunda mitad del siglo XX, primero por Edgard C. Banfield y luego por James Q. Wilson.
3.5. Las críticas de Levitt y Dubner El economista de la Universidad de Chicago Steven D. Levitt y el periodista Stephen J. Dubner, en su libro Freakoconomics, presentan una polémica teoría donde afirman que la legalización del aborto en 1970 fue el principal factor de la disminución de los índices 7
La fuente es la siguiente: New York State, Division of Criminal Justice Services 2000.
198 Economía, sociedad y teoría de juegos
delictivos en los 90. De acuerdo con esta hipótesis, la disminución de nacimientos de niños no deseados, frecuentemente en ámbitos de personas pobres y de madres solteras en los 70, condujo a la disminución de jóvenes delincuentes en los 80 y de delitos mayores en los 90. Concluyen diciendo que no existen evidencias que indiquen que la estrategia de Bratton es correcta. Harcourt y el profesor de políticas públicas de la Universidad de Georgetown, Jens Ludwing, estuvieron de acuerdo, por lo que añadieron el concepto denominado “Ley de Newton del Crimen”: todo lo que sube, baja.
4. Ventanas rotas, negocios rotos (broken windows, broken business) Después de haber estudiado el trabajo de James Q. Wilson y George L. Kelling, Broken Windows, nos referiremos al libro de Michael Levine (2005), Broken Windows, Broken Business, de cuyo contenido se desprenden avances en el plano de la teoría de la gerencia, con incidencia en la competencia. Al igual que las dos obras anteriores, Levin focaliza en los pequeños detalles de los problemas como hilo conductor de su investigación. Como vimos, psicólogos sociales y criminólogos están de acuerdo en que si se rompe una ventana de un edificio y se deja sin ser reparada, aumentará la probabilidad de que muy pronto el resto de las ventanas sean igualmente rotas. Levine intenta aplicar el mismo principio a los negocios. La atención constante de los detalles no sólo demuestra la capacidad de la empresa, sino que lanza la señal de que la gerencia se preocupa por los clientes. Por el contrario, ventanas rotas, pisos sucios, baños y paredes mal mantenidas, envían como señal la existencia de una gerencia despreocupada. Pero, ¿cuándo o a partir de qué momento un baño sucio es una “ventana rota”? Esta pregunta puede representar la diferencia entre el éxito y el fracaso en los negocios. Esta afirmación a priori pareciera no tener fortaleza, así como tampoco la tuvo el término “ventanas rotas”, cuando fue planteado en 1982 por Wilson y Kelling. El alcance de esta teoría va más allá de una interpretación, de allí que Levine la lleve al campo de los negocios. El corazón de la teoría de las ventanas rotas es la señal de que no existe responsable, nadie observa, el dueño es indiferente o se rindió y reina la anarquía 8, por lo tanto se puede hacer lo que se quiera. La palabra clave es percepción del cliente, lo que ve y las conclusiones que saca. Las personas en general temen el desorden, ya que puede ocasionar problemas graves. Volvemos a la pregunta, ¿qué tiene esto que ver con los negocios? Pareciera ser aplicable sólo al crimen, pero si un baño de una cadena de comida rápida se queda sin papel o está sucio, tiene como señal que la gerencia no está atendiendo las necesidades de sus clientes, situación que podría conducir a pensar que las hamburguesas no están siendo preparadas adecuadamente, que pueden existir riesgos de salud o que a la cadena completa de negocios no le importan sus clientes 9. La señal a un cliente de que los estándares 8
Puede que el dueño conscientemente se autoexcepcione y en consecuencia esté jugando asumiendo los costos que implica.
9
El cliente leal inicialmente se encuentra en un escenario de juego con información completa, él está convencido de poseer las reglas de transacción cliente-gerente. El baño sucio inicia un proceso de generación de dudas en el cliente relacionadas con la existencia de un cambio de reglas, impulsando el escenario hacia un juego de información incompleta. Harsanyi plantea que este juego puede remodelarse de nuevo como un juego de información completa.
Teoría de juegos, ventanas rotas y negocios rotos 199
de atención han bajado en relación con cómo él los percibía, o el caso de un empleado de una gasolinera usando una franela con un eslogan ofensivo, pueden ocasionar el cambio del cliente a otra cadena de servicios o de tiendas. Una ventana rota puede ser un cajero mal vestido, un menú de comida desordenado o un empleado con una mala actitud. Puede ser físico, como locales mal pintados o pelados. Pueden ser simbólicas, como políticas que requieren que los clientes paguen por servicio al cliente o cuando el mesonero de un restaurante chino se llama Juan García, éstas son ventanas rotas. Cuando una llamada telefónica es enviada a espera durante veinte minutos. Cuando un cliente intenta la devolución de una blusa y la respuesta que recibe de la empleada es “no se puede” y la explicación: “Porque ésa es la regla”. En teoría de juegos la empleada viene a ser un jugador denominado “títere estratégico” (véase Shubik, 1982), ya que en algún aspecto básico no es un jugador. Está tan limitada por las reglas que no tiene opción. Puede, sin embargo, tener interés en el resultado. El libro de Levine se refiere a las ventanas rotas en los negocios e investiga cómo y por qué se producen, por qué son ignoradas y las consecuencias de dejar que se produzcan sin ser atendidas oportunamente. El autor al referirse a la temporalidad afirma que el momento para reparar ventanas rotas es el momento en que se producen. Se examinan los orígenes de las ventanas rotas con dos propósitos. Primero, para observar el efecto de bola de nieve de las ventanas rotas que las convierte en grandes problemas y segundo, cómo reparar el daño una vez hecho. Igualmente se considera relevante estudiar cómo se producen las ventanas rotas, lo cual permitiría la introducción de correctivos preventivos. Veamos un ejemplo de los efectos de la percepción: supongamos que usted ha comprado en los últimos cinco años su café matutino en la misma cafetería. Algunas veces lo acompaña con un sándwich e incluso a veces almuerza en ese sitio. Un día, usted observa mientras hace la cola que el local lleva tiempo sin haber sido pintado, que la pared detrás de donde se hace el café se le está cayendo la pintura y entonces se pregunta si es posible que pedacitos de pintura caigan en el café o en el pan del sándwich. Usted antes no se había dado cuenta de esta situación, pero esta nueva percepción marca una diferencia. Pero quizás esta situación le haga pensar en el tiempo que ha estado esperando en la cola todas las mañanas y desencadene el análisis de otros aspectos de la planta física de la cafetería, concluyendo que usted no sabe por qué ha venido frecuentando ese sitio habiendo tantos otros. Una pequeña percepción puede ocasionar impactos de mucha importancia. A priori no existía razón alguna para hacer esos cuestionamientos 10.
5. Juegos dinámicos, ventanas rotas y negocios rotos Desde que von Neumann y Morgenstern presentaron su libro Theory of Games and Economic Behavior (2004), el debate sobre qué tipo de teoría es, no ha terminado. Científicos sociales piensan que se trata de una nueva interdisciplina, otros que es una 10
Una parte de las reglas de juego es el conjunto de opiniones a priori que posee el cliente y que actualiza en el curso del juego. Un jugador tiene opiniones previas con respecto a los tipos de los demás jugadores y a medida que ve tomar acciones actualiza sus opiniones con el supuesto de que están siguiendo la conducta de equilibrio. Se utiliza el término equilibrio bayesiano para hacer referencia a un equilibrio de Nash en que los jugadores actualizan sus opiniones de acuerdo con la regla de Bayes.
200 Economía, sociedad y teoría de juegos
acumulación de modelos de juegos teóricos, tales como teoría de la utilidad, competencia, cooperación o modelos de elección colectiva. La mayoría de ellos están de acuerdo en que los modelos de teoría de juegos se refieren a interacciones aisladas, individuales e independientes, entre quienes desean maximizar sus utilidades y minimizar sus pérdidas, cumpliendo con unas reglas definidas. Esta situación cambió abruptamente cuando teóricos de juego encontraron que la mayoría de los juegos dependen de juegos previos, de pasadas experiencias y de historias contentivas de una manera específica, no siempre racional de pensar (Friedman, 1986). No existen dudas acerca de las enseñanzas de éxitos y fracasos de los juegos iterativos, de reglas mejoradas y adaptadas y de eventos aleatorios. La similitud entre series causales de competencia interdependiente, juegos cooperativos, juegos en serie contra la naturaleza, y procesos evolutivos, es sorprendente. Lo mismo se aplica cuando aprendemos a adaptar pérdidas o ganancias a reglas cambiantes y a seleccionar eventos aleatorios en nuestra sociedad y en nuestro entorno. Durante los años 80, estas similitudes condujeron a la teoría de juegos evolutivos. En este marco se inscriben la mayoría de las interacciones que se producen en nuestro tema de estudio: ventanas rotas y negocios rotos. Hoy estamos en presencia de una teoría evolutiva unificada, que incorpora las ecuaciones evolutivas de la moderna teoría biológica de la evolución, la biología molecular y la genética. Esta nueva teoría intenta explicar todo tipo de proceso evolutivo. Los juegos evolutivos siguen numerosas reglas sociales establecidas, ellos son causales dependientes de juegos jugados previamente y de sus reglas, admitidas o “impuestas”. Series ganadoras se asemejan al tipo de medida “mejoría de salud”, pero no en el sentido darwiniano (Leinfellner, 1998). Anteriormente, cuando me referí al caso Caracas, concretamente a la reubicación de 10.000 trabajadores informales, como crítica a Harcourt al referirse a “la falsa promesa de mantenimiento del orden”, los argumentos centrales sostenidos, durante las duras negociaciones, por los trabajadores informales para no abandonar el espacio público se basaban en reglas, decisiones y distribuciones de ganancias y pérdidas de negociaciones realizadas con autoridades públicas anteriores. Juegos jugados en los últimos quince años. Cuando esta nueva teoría de juegos evolutivos dinámicos se aplicó a la evolución social, surgieron inconsistencias en la predominante teoría de la evolución darwiniana. El papel relevante de la competencia darwiniana fue reemplazado por la autoorganización de la cooperación social (Axelrod, 1984). La teoría alcanza un pico cuando modela y reformula exitosamente la selección y adaptación darwiniana (Kauffman, 1993). Hoy, un nuevo método matemático-estocástico explica la evolución socio-dinámica de las sociedades. Un componente es el método matricial de dinámica evolutiva, desarrollado a partir de la teoría de juegos evolutivos (Weibull, 1996), otro es el referido a ecuaciones diferenciales, llamadas “ecuaciones evolutivas” (Helbing, 1995). Ambos al ser aplicados a la evolución social y cultural, explican en un sentido estocástico-causal por qué las formas sociales cambian de generación en generación e inclusive por qué aparecen y desaparecen formas sociales bajo ciertas restricciones. En la aplicación de la teoría de las ventanas rotas en Caracas, se utilizó la teoría de juegos como una de las herramientas en la implementación de la política pública, lo cual se conecta con una pregunta que se hace Leinfellner (1998): Do we play games or we solve conflicts in our present democratic societies? (¿Jugamos o resolvemos conflictos en nuestras
Teoría de juegos, ventanas rotas y negocios rotos 201
actuales sociedades democráticas?) De acuerdo con Selten, la mayor parte de los juegos de la teoría de juegos son sólo abstractos, modelos matemáticos de cómo calcular los resultados. Como todos los conceptos abstractos, la aplicación de modelos teóricos de juego para explicar la evolución social atraviesa inmensas dificultades. La más seria es que todos los procesos evolutivos descansan en interacciones causales o estadístico-causales entre los individuos y entre los individuos y su ambiente. Hasta ahora, la teoría de juegos no ofrece una base empírica microscópica viable o interpretación de estas interacciones (Helbing 1996). Como respuesta a estas debilidades, Leinfellner propone una nueva interpretación empírica de juegos evolutivos, en la cual explica cómo los juegos pueden ser interpretados como interacciones sociales empíricas. La solución de juegos teóricos no cambia en nada la vida social, pero cuando se realizan soluciones a conflictos sociales, sí se está interactuando empíricamente con la sociedad. Los casos abordados en el presente trabajo referidos a Caracas son casos reales, con delincuentes de carne y hueso, donde los espacios públicos referidos son campos de batalla en los que se baten tensiones de actores estratégicos y con un actor especial, al cual se dedica todo este esfuerzo teórico: la opinión pública. Sólo nuestras realizaciones empíricas pueden introducir cambios en nuestra evolución sociocultural y en nuestro ambiente. Las realizaciones empíricas de nuestras soluciones teóricas de conflictos evolutivos son la causa real que impulsa la evolución sociocultural. En contraste con los conflictos privados, los conflictos sociales son siempre conflictos abiertos entre los intereses individuales egoístas y los intereses altruistas. Entendiendo egoísta como referido al interés propio y altruista al interés de los demás (Axelrod, 1984 y Lara, 2004). Conflictos sociales abiertos son resueltos teóricamente por soluciones óptimas, las cuales son sopesadas en equilibrios estables evolutivos entre soluciones extremas egoístas y altruistas. Esto se mantiene igual para todos los conflictos sociales donde se producen eventos aleatorios con efectos sobre una parte o la totalidad de los miembros de la sociedad. Leinfellner afirma que las realizaciones empíricas en sociedades democráticas tienen que aumentar el bien común o el bienestar colectivo, no en el largo plazo, pero sí en el “medio plazo” 11. En otras palabras, tienen que satisfacer el principio de Pareto (1896) de soluciones óptimas, aquéllas cuyas realizaciones aumentan o al menos no disminuyen el bienestar y la estabilidad de todos los individuos y la sociedad. Aumann y Maschler (1995) desarrollaron un modelo donde un jugador no se puede beneficiar de su información en el largo plazo. Los mejores marcos abstractos y sus soluciones matemáticas no ayudan a resolver nuestros conflictos y problemas sociales del día a día, si sus realizaciones violan los derechos humanos o las reglas democráticas. De allí que, muy frecuentemente, soluciones racionales, consistentes y teóricamente óptimas (en el sentido de Pareto) de conflictos sociales, propuestas por gobiernos o especialistas, son derrotadas electoralmente por la mayoría de los ciudadanos apegados a las reglas democráticas. En la práctica, realizaciones en serie de soluciones sociales, son procesos de aprendizaje temporales, complejos, bayesianos y 11
Diferentes duraciones de tiempo conducen a diferentes dinámicas, como lo señalan Hofbauer y Sigmund (1998): “En registros evolutivos se consideran dos tipos de escala. La evolución de corto plazo describe como las frecuencias de adaptación tratan de regularse una a otras por selección natural, mientras que la evolución de largo plazo describe cómo nuevos tipos pueden invadir a través de mutaciones”.
202 Economía, sociedad y teoría de juegos
evolutivos, de donde se desprenden nuevas evidencias empíricas. Sólo las democracias disponen de suficientes reglas socioéticas aceptadas para elegir los resultados más justos de entre diversos óptimos de Pareto, lo cual permite la aplicación de soluciones a conflictos sociales sin violar los derechos humanos y el aprendizaje bayesiano (Leifellner: 201). En el caso Caracas, referido en este trabajo, una de las premisas decididas a priori por el decisor público, para el rescate de esos espacios altamente sensibles desde el punto de vista social, fue la de evitar al máximo la represión, los heridos y las pérdidas humanas, de allí que el tema de los derechos humanos se colocara en perspectiva por encima de los derechos que tienen los caraqueños a transitar libremente por sus aceras, plazas y parques. Entonces se le asignó un alto peso a la variable “negociación” en el proceso de solución del conflicto social. Es conocido por todos que en cualquier parte del mundo al realizar una política pública para rescatar espacios públicos controlados por trabajadores informales, estallan escenarios de violencia con resultados frecuentes de heridos y fallecidos en medio de batallas campales entre trabajadores y policías. Durante la implementación de la política pública en Caracas, no hubo un herido y se reubicaron más de 20.000 trabajadores informales (Lara, 2005). Al despejar los espacios públicos a bajo coste y en consecuencia iniciar el desmantelamiento del sistema de ventanas rotas, se fue incidiendo dinámicamente en las probabilidades subjetivas de los delincuentes, transformando su percepción de existencia de nichos de impunidad en nichos de captura. En consecuencia, dado que la política pública se apoyó en la teoría de las ventanas rotas para mejorar la calida de vida y no para capturar potenciales delincuentes, no se consideró como parte de las realizaciones la detención de personas. La represión fue sustituida por políticas complementarias de prevención e incentivos, como por ejemplo, utilizar la vergüenza como sanción aplicada a los promotores de desorden. Scharpt (1997) dice que las pérdidas de bienestar que no pueden ser evitadas en el modo de acciones unilaterales, pueden en principio resolverse en juegos cooperativos; es decir, bajo condiciones institucionales que no sólo proveen protección legal y procedimental de los derechos de propiedad y otras posiciones de interés, sino que también fortalece el cumplimiento de los acuerdos negociados. En este caso, el teorema de Coase (Coase, 1960) nos asegura que independientemente de que los derechos de propiedad sean asignados a una parte o a otra, las negociaciones entre actores racionales conducirán a acuerdos voluntarios donde se distribuirán todas las ganancias de bienestar entre los participantes, haciendo posible pagos suplementarios, acuerdos en paquete y costos de transacción insignificantes.
6. Conclusión La aplicación de la teoría de las ventanas rotas en el campo de la gerencia privada y pública, representa un terreno fértil para los teóricos de juegos, especialmente en el campo de los juegos dinámicos, puesto que permite observar cómo interactúan en el tiempo los individuos en situaciones estratégicas ante incentivos reales. A diferencia de los modelos tradicionales de teoría de juegos, los cuales suponen que todos los jugadores son racionales y poseen conocimiento completo de los detalles del juego, los modelos evolutivos asumen que las personas escogen sus estrategias a través de un proceso de aprendizaje en el cual gradualmente van descubriendo que algunas estrategias funcionan mejor
Teoría de juegos, ventanas rotas y negocios rotos 203
que otras. En juegos repetidos, muchas veces, pagos bajos tienden a ser descartados y el equilibrio emerge. El concepto Negocio Roto, por ser una nueva área de investigación, reclama ser abordado por múltiples herramientas de análisis y con el presente trabajo se deja abierta la inquietud acerca del enriquecimiento relevante de esta discusión desde la perspectiva de la teoría de juegos. Samuelson (1997) concluye su libro sobre juegos evolutivos con la siguiente reflexión: “¿Qué queda por hacer? Dos áreas son particularmente importantes. Primero, trabajar en la estructura de modelos evolutivos y, en segundo lugar, es necesario desarrollar técnicas para analizar modelos de aprendizaje.” Dejamos este laboratorio de cosas rotas disponible a los investigadores.
Glosario Fernando Aguiar 1
(Este Glosario no es ni mucho menos exhaustivo; se han seleccionado una serie de términos básicos que ayuden a comprender mejor los textos del presente libro a quienes se acerquen por vez primera a la teoría de juegos. En algunos casos se ha incluido la acepción inglesa del término, bien porque se suele emplear en inglés, bien porque proponemos una traducción algo distinta de la habitual, bien porque ayuda a comprender su uso, y su origen, en castellano. Para ayudar al lector se han subrayado en cada entrada los términos que aparecen definidos en otros lugares del Glosario. Por último, el orden no es puramente alfabético: los conceptos se ordenan también de mayor a menor generalidad dentro de un mismo campo semántico (“estrategia”, “equilibrio”, “ juego”). Así, por ejemplo, “equilibrio bayesiano” tendría que ir alfabéticamente antes que “equilibrio de Nash”, pero este último es un témino primitivo que es preciso definir en primer lugar para entender el resto de definiciones de “equilibrio”).
ACCIÓN: Cada elección o decisión que puede tomar el jugador en cada conjunto de información. CONJUNTO DE INFORMACIÓN (information set): véase “información, conjunto de”. CONOCIMIENTO COMÚN (common knowledge): Un hecho es de conocimiento común cuando todo el mundo lo conoce y todo el mundo sabe que los demás lo conocen y todo el mundo sabe que todo el mundo sabe que todos conocen el hecho y así sucesivamente. Se supone que la estructura de un juego —los conjuntos de información, las estrategias, los pagos, el número de jugadores, etc.— es de conocimiento común. Por otro lado, la racionalidad de los jugadores es también de conocimiento común: todos saben que tratan de maximizar su utilidad y todos saben que todos lo saben y así sucesivamente. CREENCIAS: En los juegos en forma extendida la creencia del jugador es la probabilidad de que se encuentre en un nodo y no en otro de un conjunto de información que contiene varios nodos. DILEMA DEL PRISIONERO: El dilema del prisionero fue inventado por los matemáticos Melvin Dresher y Merrill Flood en 1950 para demostrarle a John Nash que su concepto de solución de un juego —el equilibrio de Nash— no predecía bien el comportamiento humano. De hecho llevaron a cabo experimentos en la RAND Corporation que confirmaron sus sospechas: los jugadores eran capaces de coordinarse y evitar las terribles consecuencias de las estrategias de equilibrio. Cuando Albert 1
Agradezco a Luis Miguel Miller y a Antonio Morales sus comentarios a una primera versión del Glosario.
205
206 Economía, sociedad y teoría de juegos
Tucker, matemático también, vio en una pizarra de la RAND Corporation la matriz de pagos de dicho juego, inventó la historia de los presos que con variaciones diversas todo el mundo utiliza. Dos presos que no pueden comunicarse entre sí deben decidir si confiesan o no su delito. Si ambos confiesan la pena queda reducida a un año para ambos por colaborar con la justicia; pero si uno confiesa y el otro no, éste se libra de la cárcel y el peso de la ley cae sobre quien confiesa, que va tres años a la cárcel al asumir toda la culpa. Ahora bien, existen pruebas suficientes para condenar un par de años a los dos presos si ninguno de ellos canta. La matriz del juego es la siguiente: CONFESAR
NO CONFESAR
CONFESAR
1 año, 1 año
3 años, 0 años
NO CONFESAR
0 años, 3 años
2 años, 2 años
Salta a la vista que lo que más interesa a los presos es quedar libres, por lo que optarán por no confesar. Esa es la decisión más racional desde el punto de vista individual, pues se trata de una estrategia dominante: haga lo que haga el oponente, no confesar es la mejor respuesta de cada jugador. Sin embargo, al elegir ambos “no confesar” salen peor parados que si hubieran elegido “confesar”. Lo cual demuestra que el equilibrio de Nash puede tener consecuencias estratégicas perversas; en este caso la racionalidad individual conduce a un resultado colectivo irracional (el equilibrio, además, no es un óptimo paretiano). La forma general del juego es la siguiente: CONFESAR
NO CONFESAR
CONFESAR
A, a
B, c
NO CONFESAR
C, b
D,d
Orden de preferencias del Jugador de fila: C > A > D > B. Orden de preferencias del Jugador de columna : c > a > d > b. El éxito del juego ha sido tal que se ha aplicado a los campos más diversos, desde la biología, la economía y la sociología hasta la ciencia política y la psicología. En el terreno de las ciencias sociales el dilema del prisionero se ha identificado con el denominado problema de la acción colectiva o problema del gorrón (free rider). DOMINANCIA ITERADA (iterated dominance): Método para solucionar juegos en forma normal que parte de la idea de que los jugadores descartarán las estrategias dominadas y adoptarán las estrategias dominantes. Ahora bien, al aplicar esta solución el jugador no se limita a adoptar sus estrategias dominantes, sino que predice que el contrario hará lo mismo en cada momento del juego. En otras palabras, el jugador cree que el otro jugador cree que rechazará las estrategias dominadas. La dominancia iterada supone, pues, que los jugadores son racionales —tratan de maximizar su beneficio rechazando las estrategias dominadas—, e implica, además, que esa racionalidad es de conocimiento común: el jugador cree que el otro jugador es racional y cree que el otro jugador cree que él es racional y así sucesivamente.
Glosario 207
La siguiente matriz sirve para ilustrar cómo funciona este proceso:
R1 R2 R3 R4
C1
C2
C3
C4
5, 10
0, 11
1, 20
10, 10
4, 0
1, 1
2, 0
20, 0
3, 2
0, 4
4, 3
50, 1
2, 93
0, 92
0, 91
100, 90
1º. El jugador C elimina C4: el resto de estrategias le proporciona mejores resultados. C4 es una estrategia estrictamente dominada. 2º. El jugador R elimina R4 por la misma razón. 3º. C elimina C1 (C1 es una buena respuesta si R elige R4, pero R ha eliminado esa estrategia). 4º. R elimina R1 (R1 es una buena respuesta a C1, que está eliminada). 5º. C elimina C3 (por ser una buena respuesta a R1, que ya no está). 6º. A C sólo le queda la estrategia C2; R elige R2 por ser la mejor respuesta a C2. La solución del juego, el equilibrio, lo proporcionan las estrategias (R2, C2) 2. EQUILIBRIO: El equilibrio de un juego es una combinación de las mejores estrategias de cada uno de los jugadores. Las estrategias de equilibrio son aquellas que seleccionan los jugadores para maximizar sus pagos individuales. EQUILIBRIO DE NASH: Una combinación de estrategias, una para cada jugador, es un equilibrio de Nash cuando ningún jugador tiene motivos para desviarse unilateralmente de su estrategia, pues si lo hace sale perjudicado. EQUILIBRIO PERFECTO EN SUBJUEGOS (subgame perfect equilibrium): Un equilibrio perfecto en subjuegos se produce cuando la estrategia de cada jugador conduce a un equilibrio de Nash en cada subjuego del juego original, así como en el juego completo. EQUILIBRIO BAYESIANO: El equilibrio bayesiano es un equilibrio de Nash en el que los jugadores forman sus creencias acerca del movimiento de Naturaleza a partir de la regla de Bayes. EQUILIBRIO BAYESIANO PERFECTO (DÉBIL): El equilibrio bayesiano perfecto débil es la extensión del equilibrio bayesiano a juegos en forma extendida en la que los jugadores actualizan sus creencias mediante la regla de Bayes en los conjuntos de información que pertenecen a la senda de equilibrio. EQUILIBRIO SECUENCIAL: Un equilibrio secuencial se produce siempre que las creencias de los jugadores sean consistentes con las estrategias de equilibrio y la regla de Bayes y siempre que las estrategias de los jugadores sean secuencialmente racionales; es decir, que cuando le toque jugar a un jugador, la acción que prescribe el equilibrio sea racional —maximizadora de su utilidad esperada— dadas sus creencias y las estrategias de los rivales. 2
El ejemplo está tomado de S. Hargreaves y Y. Varoufakis, Game Theory: A Critical Introduction, Londres, Routledge, 1995, 35.
208 Economía, sociedad y teoría de juegos
EQUILIBRIO COMBINADO (pooling equilibrium): Se trata de una solución en la que jugadores de distinto tipo adoptan la misma estrategia, lo que impide que el jugador que carece de información pueda deducir ante qué tipo de jugador se encuentra partiendo de las acciones de ese jugador. EQUILIBRIO SEPARADO (separating equilibrium): Se trata de una solución en la que jugadores de distinto tipo adoptan estretagias diferentes, lo cual permite que un jugador no informado pueda deducir ante qué tipo de jugador se encuentra gracias a las acciones de ese jugador. EQUILIBRIO PERFECTO DE LA MANO TEMBLOROSA (trembling-hand perfect equilibrium): Este equilibrio parte del supuesto de que los jugadores pueden equivocarse a la hora de elegir sus acciones. Es decir, con una pequeña probabilidad cometen un error (les tiembla la mano) y no eligen la acción que prescribe el equilibrio de Nash, sino cualquier otra acción disponible. La idea, introducida por Reinhard Selten, consiste en comprobar si los equilibrios de los juegos perturbados con estas probabilidades de error convergen al equilibrio del juego sin errores cuando la probabilidad de error tiende a cero. Si es así, entonces el equilibrio se denomina “perfecto de la mano temblorosa”. Este concepto tiene dos desventajas: (i) ataca indirectamente el problema de las creencias de los jugadores, puesto que éstas surgen implícitamente a partir de las probabilidades de error y (ii) en términos prácticos, es bastante difícil verificar si un equilibrio es perfecto de la mano temblorosa. ESTRATEGIA: Es una regla que prescribe al jugador qué acción elegir en cada momento del juego y en cada situación posible. En los juegos en forma normal es una de las posibles acciones del jugador, en los juegos en forma extendida es un plan completo de acción para cada conjunto de información en que el jugador tenga que jugar. ESTRATEGIA PURA: Es una estrategia que no incluye movimientos o acciones probabilísticos. Si el jugador tiene a su disposición las estrategias A y B, o bien elige A o bien elige B. Cuando las estrategias puras conducen a un equilibrio se denomina equilibrio de estrategias puras. ESTRATEGIA MIXTA: Se trata de estrategias que incluyen movimientos o acciones probabilísticos. Si el jugador puede seguir la estrategia A o la estrategia B, la estrategia mixta le dirá que elija A con una probabilidad p y B con una probabilidad 1 – p. Cuando las estrategias mixtas conducen a un equilibrio se denomina equilibrio de estrategias mixtas. Las estrategias mixtas de una matriz de 2x2 se calculan con facilidad. Considérese la siguiente matriz: Y (q)
Z (1 – q)
W(p)
a, A
b, B
X (1 – p)
c, C
d, D
Glosario 209
Para hallar la probabilidad p con que el jugador de fila jugará su estrategia W tendremos la siguiente igualdad: p = D – C/(A – B) + (D – C) Para hallar la probabilidad q con la que el jugador de columna adoptará su estrategia Y se aplicará, a su vez, la siguiente igualdad: q = d – b/(a – c) + (d – b) Cómo se puede observar, el jugador de fila y el de columna calculan la estrategia mixta teniendo en cuenta los pagos del otro jugador. Esto es así porque, como señala Morrow, “las estrategias mixtas se calculan para neutralizar la elección de estrategia del otro jugador, no para maximizar el pago del jugador que elige la estrategia mixta” 3. Las estrategias mixtas han generado gran polémica porque muchos las consideran irreales. Se han dado dos interpretaciones: a) Argumentos de purificación: John Harsanyi considera que las estrategias mixtas reflejan la incertidumbre que se tiene siempre con respecto a la conducta de las otras personas. Puesto que no podemos asegurar que otras personas siempre actuarán racionalmente, en muchas ocasiones es preferible no seguir estrategias puras que no sean estrictamente dominantes. b) Argumentos poblacionales: cuando se trata de grupos de personas, la estrategia mixta reflejaría porcentajes de población: por ejemplo, un porcentaje p de la población opta por cooperar y otro 1 – p opta por no cooperar. (véase teoría de juegos evolutiva). ESTRATEGIA DE COMPORTAMIENTO (behavioral strategy): Las estrategias mixtas implican la elección aleatoria entre algunas o todas las estrategias puras desde una perspectiva ex ante. Es decir, antes de jugar el juego se elige según la estrategia mixta una estrategia pura que es la que se utilizará en el transcurso del juego. Las estrategias de comportamiento implican la elección aleatoria entre las acciones disponibles en cada conjunto de información conforme se va jugando el juego. ESTRATEGIA DOMINANTE: Una estrategia es dominante si es estrictamente la mejor respuesta a cualquier estrategia que otros jugadores puedan elegir. La estrategia dominante es la mejor respuesta para un jugador, hagan lo que hagan los otros. ESTRATEGIA DÉBILMENTE DOMINANTE: Una estrategia es débilmente dominante cuando es algunas veces estrictamente mejor y nunca peor ante cualquier estrategia que otros jugadores puedan elegir. ESTRATEGIA CONTRA LA PROVOCACIÓN (trigger strategy): Se trata de un tipo de estrategias empleadas en el dilema del prisionero y en otros juegos repetidos. El jugador que emplea esta estrategia inicia el juego cooperando, pero responde de imediato ante cualquier provocación, de forma que si su oponente no coopera él tampoco lo hará. El tipo de respuesta que se dé a quienes no cooperan dependerá de la estrategia contra la provocación que se emplee. Una de las más conocidas, toma y daca (tit-for-tat), empieza cooperando y deja de cooperar en cuanto el oponente defrauda. Sin embargo, toma y daca contempla la posibilidad de volver a cooperar si el oponente coopera de nuevo. En cambio, la estrategia dura contra la provocación 3
J. Morrow, Game Theory for Political Scientist, Princeton, Princeton University Press, 1994, 87.
210 Economía, sociedad y teoría de juegos
(grim trigger strategy) no perdona, pues ya no vuelve a cooperar nunca con quien defraudó una sola vez 4. ESTRATEGIA EVOLUTIVAMENTE ESTABLE (evolutionarily stable strategy): Una estrategia es evolutivamente estable cuando al ser adoptada por una población no puede ser invadida —dominada— por una estrategia mutante y, por lo tanto, es la estrategia que proporciona los mejores resultados adaptativos. Las estrategias evolutivamente estables son la base de la teoría de juegos evolutiva. GORRÓN (free-rider): El gorrón o free rider —literalmente, quien consigue un viaje gratis, por ejemplo en un autobús público — es un jugador que obtiene los beneficios de la cooperación de otros jugadores sin sufrir sus costes. El ejemplo económico por antonomasia de gorrón se produce cuando no se coopera para producir un bien público. INDUCCIÓN INVERSA (backward induction): Es una técnica para resolver juegos en forma extendida. Primero se determina la mejor respuesta para el jugador que hace el último movimiento y a partir de ahí se asciende por el árbol del juego, determinando las mejores respuestas de cada jugador en todo momento, hasta llegar al principio del juego. Esta técnica se utiliza para calcular el equilibrio perfecto en subjuegos en juegos finitos. INFORMACIÓN, CONJUNTO DE (information set): En los juegos en forma extendida un jugador tiene que decidir a veces sin saber cuál ha sido el desarrollo exacto de juego, qué camino ha seguido su oponente, dónde se encuentra en el momento en que le toca decidir a él. El jugador conoce al menos los nodos en que puede estar, pero no sabe en cuál de ellos se encuentra. Esos nodos que el jugador no puede distinguir son su conjunto de información. Cuando el conjunto de información tiene un solo elemento, un solo nodo, el jugador conoce perfectamente cuál ha sido la trayectoria del juego y sabe dónde se encuentra. Los conjuntos de información se pueden representar de la siguiente manera:
4
A menudo se traduce esta estrategia como “estrategia del gatillo”, pues trigger significa, en efecto, gatillo. Sin embargo, esta traducción no parece correcta porque su significado no es claro ni directo en castellano. La idea a la que remite “trigger strategy” es la de alguien dispuesto a “disparar” a la mínima provocación, alguien con el dedo en el gatillo que no pasa una. Pero como el verbo trigger significa también “provocar” y “provocar una respuesta o reacción”, “estrategia contra la provocación” nos proporciona una traducción más clara y con un significado más directo que “estrategia del gatillo”, que no se entiende bien: si alguien nos provoca al no cooperar, habiendo cooperado nosotros, trendremos preparada una estrategia contra esa provocación. La estrategia, la respuesta, puede ser dura (grim) o condescendiente.
Glosario 211
El jugador 1 puede elegir el camino A o el B. El jugador 2, sin embargo, no sabe qué ha hecho 1, y habrá de elegir “a” o “b” sin saber en qué lado del juego se encuentra. El conjunto de información de 2 tiene, pues, dos nodos, que están unidos por una línea de puntos para representar el conjunto de información de dicho jugador. INFORMACIÓN PERFECTA, CIERTA, SIMÉTRICA Y COMPLETA5: Se dice que un juego es de información perfecta cuando los conjuntos de información de cada jugador tienen un único elemento. En caso contrario, cuando al menos un conjunto de información tiene más de un elemento, la información es imperfecta. Por otro lado, en un juego hay certidumbre si Naturaleza no mueve después que los jugadores en ningún momento del juego. En caso contrario existe incertidumbre. La información de los jugadores será simétrica si ninguno de ellos tiene una información diferente de los demás al mover o en los nodos finales. Si no es así la información será asimétrica. Por último, la información es completa si Naturaleza no mueve primero o su movimiento es observado por todos los jugadores. La diferente información con que cuentan los jugadores se representa de la siguinte manera: A. Juego con información perfecta, cierta, simétrica y completa
• En este juego no existen movimientos de Naturaleza, ni después de que los jugadores hayan movido (información cierta) ni antes (información completa), y todos los conjuntos de información tienen un único elemento (información perfecta). Se trata, por lo tanto, de un juego de información simétrica: ningún jugador posee información privada que pueda emplear en su provecho. B. Juego con información imperfecta, incompleta y asimétrica sin incertidumbre
5
El uso de los conceptos de información no está del todo estandarizado en teoría de juegos. Seguimos aquí las definiciones de E. Rasmussen, Games and Information, Oxford, Blackwell, 1989, 50 y ss., pues es el primero que hace el esfuerzo de dotar de coherencia a este conjunto de conceptos a partir de sus usos más frecuentes en la literatura especializada.
212 Economía, sociedad y teoría de juegos
• En este juego el jugador 1 tiene que decidir si confía (C) o no confía (NC) en el jugador 2. Si el jugador 1 confía en 2, éste puede defraudarlo (D) o confiar a su vez (C). • Esa decisión se da en un contexto de información incompleta, pues está determinada por un movimiento inicial azaroso de naturaleza (N), que quiere decir aquí lo siguiente: el jugador 1 se halla en un terreno en el que desconoce si se va a encontrar con una persona digna de confianza o no. Si decide confiar no sabe si se encuentra en el lado izquierdo o en el derecho del árbol. Si está en el lado izquierdo jugará con una persona que honrará la confianza y si se encuentra en el lado derecho jugará con una persona que prefiere aprovecharse de su confianza (lo cual queda claramente reflejado en los pagos del juego). • El jugador 1 atribuye una probabilidad p al hecho de encontrarse con un jugador que honrará la confianza y una probabilidad de 1 – p a lo contrario. Su problema se reduce, entonces, a buscar en qué situaciones le merece la pena confiar. Esto es, su problema se reduce aquí a buscar a qué equivale p y elegir una combinación de estrategias que dada p (esto es, su creencia sobre qué tipo de jugador es 2) le permitan maximizar su utilidad. C. Juego con información perfecta, completa, simétrica con incertidumbre
• Éste es un juego de información perfecta, pues todos los conjuntos de información tienen un único elemento; es también un juego de información completa, pues Naturaleza no mueve antes que los jugadores; sin embargo, Natureleza mueve después, por lo que hay incertidumbre. JUEGOS COOPERATIVOS Y NO COOPERATIVOS: Un juego cooperativo es aquel en que los jugadores pueden comprometerse o llegar a acuerdos obligatorios, mientras que en los juegos no cooperativos estos compromisos no son posibles. JUEGO DE SUMA CERO: En un juego de suma cero todo lo que gana un jugador lo pierde el otro, de forma que la suma de los pagos de los jugadores da como resultado cero. Estos juegos no tienen equilibrio de estrategias puras, el equilibrio se produce sólo al emplear estrategias mixtas. JUEGO SIMÉTRICO: Se trata de juegos en que la solución depende sólo de las estrategias que se elijan y no de quién las elija. Si se puede intercambiar la identidad de los jugadores sin que cambien los pagos estaremos ante un juego simétrico (lo que no se
Glosario 213
debe confundir con un juego de información simétrica). El dilema del prisionero, por ejemplo, es un juego simétrico. JUEGO EN FORMA NORMAL: Se denomina forma normal a la representación matricial los juegos. Tal apelativo se debe a que John von Newmann y Oskar Morgenstern consideraron que era la forma normal de representar un juego de estrategia. Sin embargo, pronto se comprobó que la forma normal sólo es adecuada para representar juegos simultáneos, es decir, aquellos en que los jugadores deciden a la vez sin tener información de lo que hace el otro. JUEGO EN FORMA EXTENDIDA: Se denomina forma extendida a la representación de los juegos en forma de árbol o grafo abierto. Esta representación permite abordar el análisis de juegos que no sean simultáneos, esto es, en los que un jugador decide primero y otro después. Se denominan también juegos dinámicos. JUEGO REPETIDO: Juego que se desarrolla en múltiples etapas un número definido o indefinido de veces. A diferencia de los juegos que se juegan una sola vez los juegos repetidos permiten que se tengan en cuenta los movimientos pasados. Del mismo modo, el hecho de que los jugadores conozcan o desconozcan cuándo acaba el juego afecta a la elección de estrategias. JUEGOS DE COORDINACIÓN: Se denomina juego de coordinación al que tiene varios equilibrios de Nash de estrategias puras que se logran cuando los jugadores eligen la misma estrategia, esto es, se coordinan. Estos juegos tienen, además, un equilibrio en estrategias mixtas. La forma general del juego es la siguiente: E1
E2
E1
A, a
C, b
E2
B, c
D,d
El orden de preferencias del jugador de fila es A > B, D > C, y el del jugador de columna a > b, d > c. El juego tienes dos equilibrios de Nash de estrategias puras ,{E1, E1} y {E2, E2}. La cuestión reside, entonces, en saber qué puede mover a los jugadores a elegir un equilibrio u otro, si no adoptan una estrategia mixta. En algunos juegos se tratará de maximizar los pagos (domina la recompensa) y en otros de minimizar el riesgo de ser el único en querer coordinarse (domina el riesgo). JUEGO DEL GALLINA (chicken game): Como se dijo en la Presentación, en 1959, cuando la amenaza de un enfrentamiento nuclear entre los EEUU y la Unión Soviética era bien real, Bertrand Russell6 trataba de entender la actitud de los dirigentes de ambas potencias, aparentemente irracional, comparándola con la de los jóvenes que participaban en un arriesgado juego de moda: se trataba en ese juego de trazar una larga línea blanca en una carretera, de forma que dos coches se precipitaran uno contra otro sin dejar de pisar la línea; el jugador que se asustase primero, el gallina, 6
Russel, B., Common Sense and Nuclear Warfare, Londres, George Allen & Unwin, 1959, 30.
214 Economía, sociedad y teoría de juegos
se separaría de la línea blanca y perdería la apuesta. Sin embargo, en este juego puede resultar fatal que ambos jugadores sean muy arriesgados, pues si ninguno se desvía de su trayectoria pueden morir los dos al chocar los coches de frente. Unos años antes, en 1956, James Dean había hecho famoso un juego parecido (los coches se lanzan en la película de Nicholas Ray hacia un acantilado) en Rebelde sin causa. Junto con el dilema del prisionero, el juego del gallina ganó pronto reputación por su capacidad para modelar conflictos de interés, especialmente en casos de cooperación y acción colectiva. Un ejemplo de juego del gallina sería el siguiente: COOPERAR
NO COOPERAR
COOPERAR
2, 2
1, 3
NO COOPERAR
3, 1
0, 0
A los jugadores les beneficia que el contrario cargue con los costes de la cooperación, por lo que tratarán de mantenerse firmes (no acobardarse) en su resolución de no cooperar hasta conseguir que el otro se muestre cooperativo de forma unilateral. Sin embargo, si ambos son muy duros el resultado colectivo será desastroso. A diferencia del dilema del prisionero, en el juego del gallina no hay estrategias dominantes: hay dos equilibrios de Nash de estrategias puras, (3, 1) y (1, 3), y un equilibrio de estrategias mixtas (jugar las mitad de las veces cooperar y la otra mitad no cooperar). La forma general de juego se representa en la siguiente matriz: COOPERAR
NO COOPERAR
COOPERAR
A, w
B, x
NO COOPERAR
C, y
D, z
Orden de preferencias del jugador de fila: C < A < B < D. Orden de preferencias del jugador de columna: x < w < y < z. JUEGO DEL HALCÓN Y LA PALOMA: Una variante del juego del gallina es el juego del halcón y la paloma (o “juego halcón-paloma”), que se ha utilizado en teoría de juegos evolutiva para ilustrar los equilibrios evolutivamente estables. En este juego la estrategia agresiva (halcón) tiene todas las de ganar si se enfrenta a una estrategia más suave (paloma). De esta forma, en una población de “palomas”, la estrategia mutante “halcón” tendrá mayor eficacia reproductiva. Sin embargo, si el “halcón” se encuentra con otros “halcones” se destruirán mutuamente. Así, en una población de “halcones” y “palomas” la única estrategia evolutivamente estable, la única estrategia que no sería invadida por otra, es una estrategia mixta. Se dice, pues, que la estrategia I es evolutivamente estable cuando se cumplen las dos siguientes condiciones: a) b)
UE (I, I) t UE (J, I) para toda estrategia J. UE (I, I) > UE(J, I) o UE (I, J) > UE (J, J) para toda J.
Glosario 215
La primera condición indica que la estrategia I es al menos tan buena como cualquier otra (la utilidad esperada de I frente a sí misma —UE (I, I)— es mayor o igual que la utilidad esperada de I frente a J), porque si no la población cambiaría de estrategia reproductiva. La segunda condición supone que para que una estrategia no sea invadida tiene que ser estrictamente mejor que cualquier otra. JUEGO DEL PRINCIPAL Y DEL AGENTE: Un juego de información asimétrica que ha cobrado gran relevancia en la última década por su utilidad para construir modelos de interacción en sociología y ciencia política es el conocido como juego principal-agente. El juego entre un principal y un agente trata de abordar formalmente la relación entre aquella persona o institución —el principal— que ha de encargar a alguien —el agente— un servicio que no puede realizar por sí mismo. Este juego se ha empleado en economía para analizar la eficiencia de los contratos: el que contrata un servicio cualquiera necesita saber si el contratado realiza su labor de manera eficiente, pero no siempre puede supervisar esa labor. De ahí surge el problema estratégico que el juego plantea, así como el problema de los incentivos o la falta de incentivos del principal para contratar o del agente para ser contratado. En ciencia política se ha hecho uso de los juegos entre un principal y un agente para modelar la relación entre los ciudadanos (que actúan en este caso como principal, la persona que encarga un servicio) y el Estado (que actúa como agente). JUEGO DE LA SEGURIDAD (assurance game)7: Es un juego de coordinación en el que el jugador coopera si tiene la seguridad de que el otro lo hará. Junto con el dilema del prisionero y el juego del gallina ha sido uno de los más utilizados para el análisis de la acción colectiva y los problemas de la cooperación social. Un ejemplo clásico de juego de la seguridad es el que se conoce como “La caza del ciervo”. En el Discurso sobre el origen de la desigualdad entre los hombres Rousseau describe una situación en la que dos cazadores tienen que cooperar para abatir un ciervo o bien pueden optar por cazar cada uno de ellos una liebre sin necesidad de contar con la ayuda del otro. El ciervo proporciona una recompensa mayor que resuelve las necesidades de comida durante muchos días; el conejo sólo da para un día y para una sola persona, pero es más fácil de cazar. La matriz del juego es la siguiente: CIERVO (COOPERAR)
LIEBRE (NO COOPERAR)
CIERVO (COOPERAR)
4, 4
0, 3
LIEBRE (NO COOPERAR)
3, 0
3, 3
Como se ve, el cazador que se empeñe en cazar el ciervo por sí solo no tendrá nada. Por eso, para tratar de conseguir un ciervo los cazadores tienen que cooperar, y tienen que tener la seguridad, la confianza, de que el compañero no los defraudará 7
Se traduce a menudo este juego también como “juego del seguro”, pero es una traducción errónea. Aunque assurance es “seguro” —en el sentido de insurance—, la mayoría de sus acepciones tienen que ver con “estar seguro de algo”, “tener la seguridad”, “tener la garantía” de que alguien hará algo. Al traducir como “juego de la seguridad” se remite al hecho de que el jugador cooperará si tiene la seguridad de que el otro cooperará también.
216 Economía, sociedad y teoría de juegos
y abandonará a medias la caza para perseguir la primera liebre que pase. El juego tiene dos equilibrios de estrategias puras, (4, 4) y (3, 3), y un equilibrio de estrategias mixtas cuando se juega en repetidas ocasiones. La forma general del juego se recoge en la siguiente matriz. COOPERAR
NO COOPERAR
COOPERAR
a, a
c, b
NO COOPERAR
b, c
d, d
Orden de preferencias del jugador de fila: a > b = d > c. Orden de preferencias del jugador de columna: a > b = d > c. JUEGO DE SEÑALES: Son juegos dinámicos en los que un jugador envía o proporciona una señal a otro jugador. El tipo de quien manda la señal lo elige Naturaleza; la señal puede permitir al jugador que la recibe deducir ante qué tipo de jugador se halla en un juego de información asimétrica. Por tal motivo, quien envía las señales contará con un conjunto M de mensajes más o menos informativos que proporcionarán más o menos información al otro jugador. Los pagos de los jugadores dependerán del tipo de quien envía las señales. Estas señales, por lo demás, carecen de valor informativo si no entrañan coste alguno para quien las envía (cheap talk) . JUEGO DEL ULTIMÁTUM: Se trata de un juego experimental en el que un jugador recibe una cantidad de dinero y tiene que ofrecerle una parte al otro jugador. Si la cantidad fuera, por ejemplo, 100 monedas de un euro, el que mueve primero hará una oferta y el que mueve después tendrá que aceptarla o rechazarla. Si la rechaza ambos jugadores se quedan si nada. El equilibrio perfecto en subjuegos se da cuando el jugador que mueve primero ofrece la menor cantidad posible (un euro en nuestro ejemplo), cantidad que el otro jugador debe aceptar para no quedarse sin nada. La evidencia experimental demuestra que los jugadores castigan las ofertas que consideran injustas, y reclaman divisiones que se alejan mucho de lo que recomienda la teoría de juegos. Así, cuando el juego es repetido el resultado se aproxima a la división equitativa de la cantidad de dinero en cuestión. JUEGO DEL DICTADOR: Es una variante del juego del ultimátum en la que al jugador que recibe la oferta se le quita la posibilidad de aceptarla o rechazarla. El jugador que dona le dará al que recibe lo que quiera y éste no podrá hacer nada. Es, pues, un falso juego diseñado en su origen para ver hasta qué punto los resultados equitativos del juego del ultimátum eran producto de un verdadero sentido de la justicia o del interés estratégico de quien dona para que quien recibe no rechace la oferta. JUGADOR: Todo individuo que actúa de forma estratégica se representa en teoría de juegos como un jugador que ha de elegir entre diversas estrategias de un juego. JUGADOR, TIPO DE: El tipo de jugador hace referencia al conjunto de estrategias, al conjunto de información y a la función de pagos que elige Naturaleza al comienzo de un juego de información incompleta.
Glosario 217
MEJOR RESPUESTA (best replay): La mejor respuesta de un jugador a las estrategias de otros es aquella que le proporciona el mejor pago. NATURALEZA: En los juegos en forma extendida se denomina Naturaleza a un movimiento azaroso, no estratégico, que establece la probabilidad de que un jugador sea de un tipo o de otro o, cuando Naturaleza mueve después de los jugadores, el riesgo que asumen los jugadores al tomar una decisión. NODO: Es el punto en el que un jugador toma su decisión en un juego en forma extendida, o bien el lugar en que el juego acaba. Cada nodo es, pues, un nodo de decisión, ya que el jugador debe decidir en ese lugar qué línea de acción seguirá. El nodo final establece los pagos que recibe cada jugador. ÓPTIMO DE PARETO: La estrategia S1 es un óptimo de Pareto si y sólo si no existe una estrategia alternativa S2 tal que al menos un jugador prefiera S2 a S1 y nadie prefiera S1 a S2. PAGO (payoff): Es la utilidad que recibe el jugador una vez que todos los jugadores han elegido sus estrategias y ha finalizado el juego. PUNTO FOCAL (focal point): En los juegos con múltiples equilibrios de Nash en los que no hay razón para elegir un equilibrio en vez de otro, los puntos focales son equilibrios que se terminan seleccionando porque resultan atractivos por razones de carácter social, moral o psicológico independientes de la naturaleza del equilibrio mismo. SENDA DE EQUILIBRIO (equilibrium path): La senda de equilibrio es el conjunto de decisiones que han de tomar los jugadores en un juego en forma extendida para llegar a la solución o equilibrio del juego. SUBJUEGO: Nodo o conjunto de nodos de un juego en forma extendida que se puede analizar de forma aislada. Para que sea un subjuego ese conjunto de nodos tienen que cumplir una serie de propiedades: 1) debe partir de un nodo de decisión que sea un conjunto de información por sí solo (un conjunto de información de un solo miembro); 2) debe incluir todos los nodos de decisión del nodo inicial y sus nodos finales; 3) debe incluir los pagos de los nodos finales. Así, por ejemplo, el siguiente juego tiene un solo subjuego 8:
8
El ejemplo está tomado de K. Binmore, Teoría de juegos, McGraw-Hill, 1993, 23.
218 Economía, sociedad y teoría de juegos
TEORÍA DE JUEGOS: La teoría de juegos es la rama de la teoría de la decisión que estudia las decisiones estratégicas de los individuos, es decir, aquellas en las que las decisiones de cada cual afectan y se ven afectadas por las decisiones de los demás. TEORÍA DE JUEGOS EVOLUTIVA: Originalmente la teoría de juegos evolutiva surgió como la rama de esta teoría que se ocupaba del análisis estratégico de la adaptación biológica. Al emplearse el simil de la adaptación y la evolución a las ciencias sociales, en la actualidad la teoría de juegos evolutiva y su concepto capital —el de estrategia evolutivamente estable— se aplican también a todo tipo de problemas, no sólo biológicos, en los que el desarrollo a lo largo del tiempo de pautas de conducta guiadas estratégicamente —pautas referidas en especial a poblaciones más que a individuos— determina el resultado emergente.
Sobre los autores
FERNANDO AGUIAR es Doctor en Filosofía y Científico Titular del IESA-CSIC. En la actualidad su trabajo se centra en cuestiones de teoría sociológica (elección racional), ética y filosofía política. En el terreno de la sociología se ocupa de la relación entre identidad social, racionalidad e intencionalidad. Sobre estos temas ha publicado “Rationality and identity: A critique of Alessandro Pizzorno”, European Journal of Sociology, 43, 2002, “Identidad, normas e intereses”, Revista Española de Investigaciones Sociológicas, 104, 2003 y “Siete tesis sobre racionalidad, identidad y acción colectiva”, Revista Internacional de Sociología, 46, 2007 (todos ellos junto con Andrés de Francisco). En el ámbito de la filosofía trabaja sobre la influencia del republicanismo en Adam Smith ([email protected]). JULIA BARRAGÁN es actualmente Presidenta de la Venezuelan Law and Economics Association (VELEA) y Directora Académica del Programa Permanente de Estudios Posdoctorales de la Universidad Central de Venezuela. Ha colaborado, entre otras publicaciones de prestigio internacional, con Rechtstheorie (Berlín), Anales de la Cátedra Francisco Suárez (Universidad de Granada), Theoría (Universidad del País Vasco), Isegoria (CSIC, España), Isonomia (ITAM, México), Ragion Practica y Materiali per una Storia della Cultura Giuridica (Universidad de Génova), Papel Político (Universidad Javeriana, Bogotá), Telos (SIEU), Laissez-Faire (Universidad Francisco Marroquín, Guatemala). Alterna su actividad académica con labores de consultoría en el área de resolución de conflictos y toma de decisiones interactivas. Ha publicado numerosos libros en su especialidad, y ha sido profesora invitada por importantes universidades americanas y europeas ([email protected]). HENAR CRIADO es Profesora Ayudante de ciencia política en la Universidad Complutense de Madrid. Sus líneas de investigación son el comportamiento político, la confianza y el estudio de procesos de violencia política. Sus publicaciones incluyen “The Effects of Party Mobilization Strategies on the Vote. PSOE and PP in the 1996 Spanish Election”, European Journal of Political Research, 47 (2), 2008; “Political Support: Taking Into Account the Institutional Context”, Comparative Political Studies, 41 (12), 2007; y otros artículos en Political Studies, International Political Science Review, Canadian Journal of Political Science y European Political Science ([email protected]). ALEXANDER ELBITTAR es Doctor en Economía por la Universidad de Pittsburgh (EEUU) e investigador del Centro de Investigación y Docencia Económicas (CIDE, México). Le interesa sobre todo la economía (teoría de juegos aplicada, economía experimental y economía computacional) y la filosofía (racionalidad, teoría de la decisión y 219
220 Economía, sociedad y teoría de juegos
ética). Además le apasiona la lectura en general y la música antigua, la música barroca y la de cámara. Ha publicado “On Determination of Optimal Reserve Price in Auctions with Common Knowledge about Ranking of Valuations”, (con Utku Unver), en Advances in Economic Design, M. Sertel y S. Koray (eds.), 2003, Springer, Berlín, e “Inconsistencias en la Teoría de la Decisión Intertemporal: Un enfoque económico”, (con Gabriela Calderón y Carlos Lever), en Teoría Conductual de la Elección: Decisiones que se revierten, Carlos Santoyo y Fernando Vázquez (comps.), 2004, Facultad de Psicología, Universidad Autónoma de México ([email protected]). FRANCISCO HERREROS es investigador en el Consejo Superior de Investigaciones Científicas (CSIC) en Madrid. Sus líneas de investigación son capital social, confianza, el análisis de la violencia política y la teoría democrática. Sus publicaciones incluyen The Problem of Forming Social Capital. Why Trust? (Nueva York: Palgrave, 2004), “The Full Weight of the State. The Logic of Random State-sanctioned violence”, Journal of Peace Research, 43 (6), 2006 y otros artículos en Rationality and Society, International Political Science Review, Comparative Political Studies, European Journal of Political Theory, European Political Science y Canadian Journal of Political Science (herreros@ iesam.csic.es). NELSON LARA es profesor de la Facultad de Ciencias Económicas y Sociales de la Universidad Central de Venezuela. Posee estudios de postgrado en Harvard University y títulos de Ingeniero Electricista en The University of Vermont, Maestría en Ciencias Políticas en la Universidad Simón Bolívar y Doctorado en Ciencias Políticas en la Universidad Central de Venezuela. Ganador del Premio Único Knut Wicksell, edición 1997. Miembro de The Engineering Honor Society (Tau Beta Pi). Autor de trabajos sobre utilitarismo, elección racional, negociación, análisis económico del derecho, capital social y partidos políticos ([email protected]). FRANCISCO LINARES MARTÍNEZ es Licenciado en Ciencias Políticas y Sociología (Universidad de Granada, 1996) y Doctor en Sociología (Universidad de Murcia, 2000). Actualmente ejerce como profesor contratado doctor en la Universidad de La Laguna. Es autor de varios artículos sobre acción colectiva, elección racional y normas sociales, entre los que destacan: “Hawks, Zealots and Hypocrites but not Free Riders” publicado en Rationality and Society (vol. 16) y “El problema de la emergencia de las normas sociales en la acción colectiva: Una aproximación analítica” en Revista Internacional de Sociología, 46, 2007. Otras líneas de investigación de su interés son el análisis de las consecuencias inintencionadas de la acción y la teoría sociológica contemporánea ([email protected]). LUIS MIGUEL MILLER es Doctor en sociología por la Universidad Complutense de Madrid. En la actualidad es investigador posdoctoral en el Max Planck Institute of Economics (Jena, Alemania), doctor vinculado al IESA-CSIC (Córdoba, España) e investigador externo del Grupo de Investigación “Sociología Analítica y Diseño Institucional” de la Universidad Autónoma de Barcelona. Ha sido investigador visitante en el ISER de la Universidad de Essex (Reino Unido), en el Max Plank Institute of Economics (Jena, Alemania), así como en el Workshop of Political Theory and Policy Analysis de la
Sobre los autores 221
Universidad de Indiana (EEUU). Es autor de más de una docena de trabajos académicos, tanto teóricos (acción colectiva y normas sociales), como empíricos (convenciones sociales y diferencias de género) y metodológicos (metodología experimental) (lmmiller@ iesaa.csic.es). ANTONIO J. MORALES aprendió economía en la Universidad de Málaga (UMA) con Ana Lozano, conoció la teoría de juegos en el Centro de Estudios Monetarios y Financieros (CEMFI) gracias a Jorge Padilla y se enamoró de ella en el University College de Londres (UCL) de la mano de Tilman Börgers. Actualmente disfruta de una plaza de profesor titular en la Universidad de Málaga, donde reside con su mujer y sus tres hijos. Es Investigador Asociado del Laboratorio de Investigación en Economía Experimental (LINEEX), puesto que su interés se centra en la teoría de juegos, tanto desde una perspectiva teórica como experimental. Ha publicado en Econometrica, International Journal of Game Theory y Annals of Operation Research, entre otras revistas ([email protected]). FÉLIX OVEJERO LUCAS es Doctor en Economía y Profesor Titular de la Universidad de Barcelona. Ha sido Visiting Scholar de las universidades de Chicago y Wisconsin y Profesor Visitante de la Universidad Pompeu Fabra de Barcelona. Su trabajo se ha centrado en cuestiones de ética y economía, metodología de las ciencias sociales y filosofía política. Es autor de una decena de libros entre los que cabe destacar Intereses de todos, acciones de cada uno (Madrid, Siglo XXI, 1989), Mercado, ética y economía (Barcelona, Icaria, 1994), La libertad inhóspita (Barcelona, Paidós, 2002) y El compromiso del método (Montesinos, Barcelona, 2004) ([email protected]). PEDRO REY BIEL es Profesor Lector del Departamento de Economía e Historia Económica de la Universidad Autónoma de Barcelona. Tras licenciarse en Economía por la Universidad Complutense de Madrid, realiza el Máster del Centro de Estudios Monetarios y Financieros (CEMFI) y se doctora en Economía en el University College de Londres (UCL). Sus áreas de investigación incluyen la Economía Experimental y del Comportamiento, la Economía Industrial y la Economía de la Salud. Ha publicado recientemente “Endogenous Leadership in Teams” (con Steffen Huck). Journal of Institutional and Theoretical Economics, vol. 162, 1-9, junio, 2006 y “Why is there no AIDS Vaccine? A New Economic Explanation”, World Economics, vol. 2, 4 octubre-diciembre, 2001 ([email protected]).
Bibliografía AKERLOF, G. (1970), “The Market for Lemons”, Quarterly Journal of Economics, 84, 488-500. ALDRICH, J. H. (1995), Why Parties?, Chicago, The University of Chicago Press. ALEXANDER J. C., B. GIESEN, R. MÜNCH y N. J. SMELSER (eds.) 1987), The MicroMacro Link, Berkeley, University of California Press. ÁLVAREZ, M. (1997), Information and Elections, Ann Arbor, The University of Michigan Press. ANDREONI, J. y J. MILLER (1998), “Analyzing Choice with Revealed Preference: Is Altruism Rational?”, Working papers 14, Wisconsin Madison - Social Systems. ARANSON, P. H., M. J. HINICH, y P. C. ORDESHOOK (1973), “Campaign Strategies for Alternative Election Systems: Candidate Objectives as an Intervening Variable”, en H. R. Alker, K. W. Deutch y A. H. Stoetzler (eds.), Mathematical Approaches to Politics, Nueva York, Elsevier. ARANSON, P. H., M. J. HINICH, y P. C. ORDESHOOK (1974), “Election Goals and Strategies: Equivalent and Non-equivalent Candidate Objectives”, The American Political Science Review, 68, 135-152. ARROW, K. (1963), Social Choice and Individual Values, New Haven, Yale Universiy Press [Elección social y valores individuales, Madrid, Instituto de Estudios Fiscales, 1974]. ARROW, K. y G. DEBREU (1954), “Existence of an Equilibrium for a Competitive Economy”, Econometrica, 22, 265-290. AUMANN, R. J. (1964), “Markets with a Continuum of Traders”, Econometrica, 32, 39-50. AUMANN, R. J. (1976), “Agreeing to Disagree”, Annals of Statistics, 4, 1.236-1.239. AUMANN, R. J. (1985), “What is Game Theory Trying to Accomplish?”, en K. Arrow y S. Honkaphoja (eds.), Frontiers of Economics, Oxford, Blackwell. AUMANN, R. J. (1990), “Foreword”, en A. E. Roth y M. A. Oliveira Sotomayor (eds.), Two-sided Matching: A Study in Game Theoretic Modelling and Analysis, Cambridge, Cambridge University Press. AUMANN, R. J. y M. B. MASCHLER (1995), Repeated Games with Incomplete Information, Cambridge, The MIT Press. AXELROD, R. (1984), The Evolution of Cooperation, Nueva York, Basic Books [La evolución de la cooperación, Madrid, Alianza Editorial, 1986]. AXELROD, R. (1997), The Complexity of Cooperation, Princeton, Princeton University. BACHARACH, M. y D. GAMBETTA (2001), “Trust in Signs”, en K. S. Cook (ed.), Trust in Society, Nueva York, Russell Sage Foundation. BARRAGÁN, J. (1997), “Políticas Públicas y Violencia”, en Amenazas para la Libertad y Seguridad Pública, Caracas, Cedice. 223
224 Economía, sociedad y teoría de juegos
BARRAGÁN, J. (2003a), “Decisiones judiciales y desempeño institucional”, en J. Malem, J. Orozco y R. Vázquez (eds.), La función judicial: ética y democracia, Barcelona, Gedisa. BARRAGÁN, J. (2003b), “The Perverse Normative Power of Self-Exceptions”, Theoria, 18, 209-225. BASU, K. (1990), “On the Non-Existence of a Rationality Definition for Extensive Games”, International Journal of Game Theory, 19, 33-44. BATIFOULIER, P. (2001), Théorie des conventions, París, Economica. BEARD, T. R. y R. BEIL (1994) “Do People Rely on the Self-interested Maximization of Others? An Experimental Test”, Management Science, 40: 252-62. BECHARA, A. y A. DAMASIO (2005), “The Somatic Marker Hypothesis: A Neural Theory of Economic Decision”, Games and Economic Behavior, 52, 336-372. BECKER, L. C. (1996), “Trust as Noncognitive Security about Motives”, Ethics, 107 (1), 43-61. BELL, D., H. RAIFFA, y A. TVERSKY (1986), Decision Making, Cambridge, Cambridge University Press. BEN-SHAHAR, O. (2004), “Agreeing to Disagree: Filling Gaps in Deliberately Incomplete Contracts”, Michigan Law and Economics Research Papers, No. 04-002. BIGGART, N. W. y T. D. BEAMISH (2003), “The Economic Sociology of Conventions: Habit, Custom, Practice, and Routine in Market Order”, Annual Review of Sociology, 29, 443-464. BINMORE, K. (1994), Teoría de juegos, Madrid, McGraw-Hill. BINMORE, K. (1998), Game Theory and the Social Contract. Vol. 2: Just Playing, Cambridge, Mass. MIT Press. BINMORE, K. (2003), “Foreword”, en M. Steuer, The Scientific Study of Society, Dordrecht, Kluwer. BINMORE, K. (2005), Natural Justice, Oxford, Oxford University Press. BINMORE, K. y P. KLEMPERER (2002), “The Biggest Auction Ever: The Sale of the British 3G Telecom Licenses”, CEPR Discussion Papers No. 3214. BLACK, D. (1958), Theory of Committees and Elections, Cambridge, Cambridge University Press. BLACKBURN, S. (1998), “Trust, Cooperation and Human Psychology”, en V. Braithwaite y M. Levi (eds.), Trust and Governance, Nueva York, Russell Sage Foundation. BOIX, C. y C. RIBA (2000), “Las bases electorales y políticas de la abstención en las elecciones generales españolas: recursos individuales, movilización estratégica e instituciones electorales”, Revista Española de Investigaciones Sociológicas, 90, 95-128. BOLTON, G. y A. OCKENFELS (2000), “ERC: A Theory of Equity, Reciprocity and Competition”, American Economic Review, 90, 166-193. BOUDON, R. (1981), La Lógica de lo Social, Madrid, Ediciones Rialp. BOURGEOIS, W. (1987), “On Rejecting Foss’ Image of Van Frassen”, Philosophy of Science, 54, 303-308. BRAITHWAITE, R. B. (1955), Theory of Games as a Tool for the Moral Philosopher, Cambridge, Cambridge University Press.
Bibliografía 225
BRAITHWAITE, V. y M. LEVY (eds.) (1998), Trust and Governance, Nueva York, Russell Sage Foundation. BRAMS, S. J. y M. D. DAVIS (1974), “The 3/2’s Rule in Presidential Campaigning”, American Political Science Review, 68, 113-134. BRATTON, W. (1998), Turnaround, Toronto, Random House. BROOME, J. (1991), “Utility”, Economics and Philosophy, 7, 1-12. BUTTERFIELD, F. (1998), “Reason for Dramatic Drop in Crime Puzzles the Experts”, New York Times, 29 de Marzo: A14. CALDWELL, B. (1984), Appraisal and Criticism in Economics, Boston, Allen & Unwin, Cambridge University Press. CAMERER, C. (2003), Behavioral Game Theory. Experiments in Strategic Interaction, Princeton, NJ, Princeton University Press. CAMERER, C., L. BABCOCK, G. LOEWENSTEIN y R. THALER (1997), “Labor Supply of New York City Cabdrivers: One Day at a Time,” The Quarterly Journal of Economics, 112, 407-41. CAMERER, C. y T. H. HO (1999), “Experience-weighted Attraction Learning in Normal form Games”, Econometrica, 67, 827-874. CAMERER, C., G. LOEWENSTEIN y D. PRELECT (2004), “Neuroeconomics: Why Economics Needs Brains”, Scandinavian Journal of Economics, 106, 555-579. CAMERER, C., G. LOEWENSTEIN y M. RABIN (2004), Advances in Behavioral Economics, Princeton, Princeton University Press. CARTWRIGHT, N. (2002), “The Limits of Causal Order, from Economics to Physics”, en U. Mäki (ed.), Fact and Fiction in Economics, Cambridge, Cambridge University Press. CHURCHLAND, P. (1989), Neurocomputational Perspective, Cambridge, Mass., MIT Press. CHURCHLAND, P. (1991), “Folk Psychology and the Explanation of Human Behavior”, en J. Greenwood (ed.), The Future of Folk Psychology, Cambridge, Cambridge University Press. CHWE, M. S. Y. (2001), Rational Rituals: Culture, Coordination, and Common Knowledge, Princeton, Princeton University Press. CIOFFI-REVILLA, C. (1998), Politics and Uncertainty. Theory, Models and Applications, Cambridge, Cambridge University Press. CLARKE, E. (1971), “Multipart Pricing of Public Goods”, Public Choice, 8, 19-33. COASE, R. H. (1960), “The Problem of Social Cost”, Journal of Law and Economics 3, 1-44. COHEN, A., y G. HARCOURT (2003), “Whatever Happened to the Cambridge Capital Controversies?”, Journal of Economic Perspectives, 17, 199-214. COHEN, B. (1980), The Newtonian Revolution, Cambridge, Cambridge University Press. COHEN, G. (1978), Karl Marx’s Theory of History, Oxford, Oxford University Press. COLEMAN, J. S. (1990), Foundations of Social Theory, Cambridge, Mass., Harvard University Press. COOPER, W. (2001), The Evolution of Reason, Cambridge, Cambridge University Press.
226 Economía, sociedad y teoría de juegos
COPPINGER, V. M., V. L. SMITH y J. A. TITUS (1980), “Incentives and Behavior in English, Dutch and Sealed-bid Auctions,” Economic Inquiry, 43, 1-22. COX, G. W. y M. C. MUNGER (1989), “Closeness, Expenditures, and Turnout in the 1982 U.S. House Elections”, American Political Science Review, 83, 217-230. COX, G. W., F. M. ROSENBLUTH y M. F. THIES (1998), “Mobilization, Social Networks, and Turnout. Evidence from Japan”, World Politics, 50, 447-474. COX, J. C., B. ROBERTSON y V. L. SMITH (1982), “Theory and Behavior of Single Object Auctions”, Research in Experimental Economics, JAI Press. Reprinted in Papers in Experimental Economics, V. L. Smith, Cambridge University Press, 1991, 580-594. COX, J. C., V. L. SMITH y J. M. WALKER (1988), “Theory and Individual Behavior in First-Price Auctions”, Journal of Risk and Uncertainty, 1, 61-69. COX, J. C. y D. FRIEDMAN (2002), “A Tractable Model of Reciprocity and Fairness”, University of Arizona Working Paper. CRIADO, H. (2008), “The Effects of Parties’ Mobilization Atrategies on Vote. PSOE and PP in the 1996 Spanish Election”, European Journal of Political Research, 47. CUBITT, R. P. y. R. SUGDEN (2003), “Common Knowledge, Salience and Convention: A Reconstruction of David Lewis’ Game Theory”, Economics and Philosophy, 19, 175-210. DANIELSON, P. (1992), Artificial Morality, Londres, Routledge. DAVIDSON, D. (1980), Essays on Actions and Events, Oxford, Oxford University Press. DAVIS, D. y C. HOLT (1993), Experimental Economics, Princeton, NJ, Princeton University Press. DEMEULENAERE, P. (1996), Homo economicus. Enquête sur la constitution d´un paradigme, París, PUF. DENNET, D. (1996), Darwin’s Dangerous Idea, Nueva York, Simon & Schuster.[La peligrosa idea de Darwin, Madrid, Círculo de Lectores, 2000]. DENNIS, N. (1997), Zero Tolerance, Londres, IEA. DONZELLI, F. (1986), Il concetto di equilibrio nella teoria economica neoclassica, Roma, NIS. DOWDING, K. (2004), “Social Choice and the Grammar of Rights and Liberties”, Political Studies, Vol. 52, 144-161. DOWNS, A. (1957), An Economic Theory of Democracy, Nueva York, Harper & Row. DUPRÉ, J. (ed.) (1987), The Latest on the Best, Cambridge, Mass., The MIT Press. EARL, P. (1990), “Economics and Psychology: A Survey”, The Economic Journal, 100, 718755. EDGWORTH, F. Y. (1881), Mathematical Psychics, Londres, Kegan Paul. ELBITTAR, A. (2006), “Impact of Valuation Ranking Information on Bidding in FirstPrice Auctions: A Laboratory Study”, Mimeo, CIDE. ELSTER, J. (1979), Ulysses and the Sirens, Cambridge, Cambridge University Press. ELSTER, J. (1983), Sour grapes, Cambridge, Cambridge University Press [Uvas amargas, Barcelona, Edicions 62, 1988]. ELSTER, J. (1985), Making Sense of Marx, Cambridge, Cambridge University Press. ELSTER, J. (1987), The Multiple Self, Cambridge, Cambridge University Press.
Bibliografía 227
ELSTER, J. (1989), The Cement of Society, Cambridge, Cambridge University Press [El cemento de la sociedad, Barcelona, Gedisa]. ELSTER, J. (1990), Psychologie Politique, París, Les Editions de Minuit [Psicología Política, Barcelona, Gedisa, 1995]. ELSTER, J. (1997), Egonomics, Barcelona, Gedisa. ERIKSON, R. S. y Th. S. PALFREY (2000), “Equilibria in Campaign Spending Games: Theory and Data”, American Political Science Review, 94 , 595-609. FAGAN, J., F. ZIMRING y J. KIM, (1998), “Declining Homicide in New York City: A Tale of two Trends”, Journal of Criminal Law and Criminology, 88, 1.277-1.323. FARREL, M. (1998), “Carta a Jenna Karabdil”, 13 de Abril. FAVEREAU, O. y E. LAZEGA (2002), Conventions and Structures in Economic Organization, Cheltenham, Edward Elgar. FEHR, E. y K. M. Schmidt (1999). “A Theory of Fairness, Competition, Cooperation.” Quarterly Journal of Economics, 114, 817-868. FEHR, E. y K. SCHMIDT (2005), “The Rhetoric of Inequity Aversion: A Reply”, en http:// www.vwl.uni-muenchen.de/ls_schmidt/pamphlet. FEHR, E. y S. GÄCHTER. (2000), “Cooperation and Punishment in Public Good Experiment”, American Economic Review, 90, 980-994. FISHBURN, P. (1988), “Expected Utility: An Anniversary and a New Era”, Journal of Risk and Uncertainly, 1, 267-283. FLACHE, A. y M. MACY (1996), “The Weakness of Strong Ties: Collective Action Failure in a Highly Cohesive Group”, Journal of Mathematical Sociology, 21, 3-28. FLOOD, M. M. (1952), “Some Experimental Games”, Research Memorandum RM-789, RAND Coorporation, junio. FRANK, R. (1991), Microeconomics and Behavior, Nueva York, McGraw-Hill. FRIEDMAN M. (1953), Essays in Positive Economics, Chicago, University of Chicago Press. FRIEDMAN, D. y S. SUNDER (1994), Experimental Methods. A Primer for Economists, Cambridge, Cambridge University Press. FRIEDMAN, J. W. (1986), Game Theory with Applications to Economics, Nueva York, Oxford University Press. [Teoría de juegos con aplicaciones a la economía, Madrid, Alianza Editorial, 1991]. FUDENBERG, D. y J. TIROLE (1991), Game Theory, Cambridge, Mass., MIT Press. GAMBETTA, D. y H. HAMILL (2005), Streetwise. How Taxi Drivers Establish Their Customers’ Trustworthiness, Nueva York, Russell Sage. GAMUT, L. T. F. (1991), Logic, Language and Meaning, Chicago, Chicago University Press. GÄRDENFORS, P. (1981), “Rights, Games and Social Choice”, Noûs, 15, 341-356. GAUTHIER, D. (1969), The Logic of Leviathan: The Moral and Political Theory of Thomas Hobbes, Oxford, Clarendon Press. GAUTHIER, D. (1986), Morals by Agreement, Oxford, Clarendon Press [La moral por acuerdo, Barcelona, Gedisa, 1994]. GIBBARD, A. (1974), “A Pareto Consistent Libertarian Claim”, Journal of Economic Theory, 7, 388-410.
228 Economía, sociedad y teoría de juegos
GILBERT, M. (1989), On Social Facts, Londres, Routledge. GILLIES, D. (1953), “Some Theorems on n-person Games”. [PhD thesis] Princeton University, Dept. of Mathematics. GINTIS, H. (2000), Game Theory Evolving, Princeton, Princeton University Press. GLIMCHER, P. (2003), Decisions, Uncertainty, and the Brain. The Science of Neuroeconomics, Cambridge, Mass., The MIT Press. GNEEZY, U. y A. RUSTICHINI (2000), “A Fine is a Price”, Journal of Legal Studies, 29, 1-18. GREEN, D. P. e I. SHAPIRO (1994), Pathologies of Rational Choice Theory, New Haven y Londres, Yale University Press. GRIER, K. B. (1989), “Campaign Spending and Senate Elections, 1978-84”, Public Choice, 63, 201-219. GRIFFIN, D. (1992), Animal Minds, Chicago, Chicago University Press. GROVES, T. (1973), “Incentives in Teams”, Econometrica, 41, 617-631. GUERRIEN, B. (1996), Diccionnaire d´annalyse economique, París, La Decouverte. GUERRIEN, B. (1999), La théorie économique néoclassique.1. Microéconomie, París, La Deocuverte. GUERRIEN, B. (2005), La théorie des jeux, París, Economica. GÜTH, W., R. IVANOVA-STENZEL y E. WOLFSTETTER (2006), “Bidding Behavior in Asymmetric Auctions: An Experimental Study”, European Economic Review, 49, 1.891-1.913. HANDEL, W. (2003), “Pragmatic Conventions: A Frame for a Theory of Action and Interaction”, The Sociological Quarterly, 44, 133-157. HARCOURT, B. E. (2001), Illusion of Order. The False Promise of Broken Windows Policing, Cambridge, Mass., Harvard University Press. HARCOURT, G. (1972), Some Cambridge Controversies in the Theory of Capital, Cambridge, Cambridge University Press. HARDIN, G. (1968), “The Tragedy of the Commons”, Science, 162. HARDIN, R. (1971), “Collective Action as an Agreeable n-Prisoners’ Dilemma”, Behavioral Science, 16, 472-481. HARDIN, R. (1995), One for All. The Logic of Group Conflict, Princeton, Princeton University Press. HARDIN, R. (2002), Trust and Trustworthiness, Nueva York, Russell Sage. HARRISON, G. y J. LIST (2004), “Field Experiments”, Journal of Economic Literature. 42, 1.009-1.055. HARSANYI, J. (1963), “A Simplified Bargaining Model for n-persons Cooperative Game” International Economic Review, 4, 194-220. HARSANYI, J. C. (1967), “Games with Incomplete Information Played by Bayesian Players. Parts I, II y III”, Management Science, 14, 159-182, 320-334 y 486-502. HARSANYI, J. (1969), “Rational-Choice Models of Political Behavior vs. Functionalist and Conformist Theories”, World Politics, 21, 513-518. HARSANYI, J. (1976a), “Advances in Understanding Rational Behavior” en J. Harsanyi Essays on ethics, social behavior and scientific explanation, Dordrecht, D. Reidel.
Bibliografía 229
HARSANYI, J. (1976b), Essays on Ethics, Social Behavior and Scientific Explanation, Dordrecht, Riedel. HARSANYI, J. (1977), Rational Behavior and Bargaining in Games and Social Situations, Cambridge, Cambridge University Press. HARSANYI, J. (1992), “Game and Decision Theoretic Models in Ethics”, en R. J. Aumann y S. Hart, Handbook of Game Theory. Vol. 1, Londres, Elsevier, 671-707. HARSANYI, J. C. y. R. SELTEN (1988), A General Theory of Equilibrium Selection in Games, Cambridge, The MIT Press. HART, O. y J. MOORE (2004), “Agreeing Now to Agree Later”, National Bureau of Economic Research, Working Paper 10.397. HART, O. y J. MOORE (1992), “Foundations of Incomplete Contracts”, Review of Economics Studies, 66, 115-138. HAUSMAN, D. (1981), “Are General Equilibrium Theories Explanatory”, en D. Hausman (ed.), The Methodology of Economics, Cambridge, Cambridge University Press. HAYEK, F. von (1949), Individualism and Economic Order, Londres, Routledge. HECHTER, M. (1984), “When Actors Comply: Monitoring Costs and the Production of Social Order”, Acta Sociologica, 27, 161-183. HECKATHORN, D. (1989), “Collective Action and the Second Order Free-rider Problem”, Rationality and Society, 1, 78-100. HECKATHORN, D. (1996), “The Dynamics and Dilemmas of Collective Action”, American Sociological Review, 61, 250-277. HEDSTRÖM, P. y R. SWEDBERG, (1998), (eds.) Social Mechanisms: An Analytical Approach to Social Theory, Cambridge, Cambridge University Press. HEINER, R. (1983), “The Origin of Predictable Behavior”, The American Economic Review, 73, 571-575. HELBING, D. (1995), Quantitative Sociodynamics. Stochastic Methods and Model of Social Interaction Processes, Boston, Kluwer Academic. HELBING, D. (1996), “A Stochastic Behavioral Model and a “microscopic” Foundation of Evolutionary Game Theory”, Theory and Decision, 40, 149-179. HERREROS, F. (2004), Why Trust? The Problem of Forming Social Capital, Nueva York, Palgrave. HEY, J. (1991), Experiments in Economics, Oxford, Blackwell. HINICH, M. J. y M. C. MUNGER (1997), Analytical Politics, Cambridge, Cambridge University Press [Teorías analíticas de la política, Barcelona, Gedisa, 2003]. HIRSH, P., S. MICHAELS y R. FRIEDMAN (1987), “‘Dirty Hands’ versus ‘Clean Models’. Is Sociology in Danger of Being Seduced by Economics?”, Theory and Society, 16, 317-336. HOBBES, Th. (1985 [1651]), Leviathan, Londres, Penguin [Leviatán, Madrid, Editora Nacional, 1983]. HOERSTER, N. (1975), Problemas de Ética Normativa, Buenos Aires, Alfa. HOFBAUER, J. y K. SIGMUND (1998), Evolutionary Games and Population Dynamics, Cambridge, Cambridge University Press. HOLLIS, M. (1998), Trust within Reason, Cambridge, Cambridge University Press.
230 Economía, sociedad y teoría de juegos
HOMANS, G. C. (1974), Social Behavior. Its elementary forms, Nueva York, Harcourt Brace Jovanovich, Inc. HOOGHE, M. (2003), “Voluntary Associations and Democratic Attitudes: Value Congruence as a Causal Mechanism”, en M. Hooghe y D. Stolle (eds.), Generating Social Capital, Nueva York, Palgrave. HORNE, C. y A. CUTLIP (2002), “Sanctioning Costs and Norm Enforcement”, Rationality and Society, 14, 285-307. HORNE. C. (2001), “Sociological perspectives on the emergence of social norms”, en M. Hechter y K. D. Opp (eds.), Social Norms, Nueva York, Russell Sage Foundation. HOWARD, N. (1971), Paradoxes of Rationality: Theories of Metagames and Political Behaviour, Cambridge, MIT Press. INGRAO, B. y G. ISRAEL (1987), The Invisible Hand, Cambridge, Mass., The MIT Press. ISAAC, R. M. y D. JAMES (2000), “Just Who Are You Calling Risk Averse?,” Journal of Risk and Uncertainty, 20, 177-187. JACQUEMIN, A. (1989), La nueva organización industrial, Barcelona, Vicens-Vives. JEFFREY, R. (1983), The Logic of Decision, Chicago, Chicago University Press. JONES, K. (1996), “Trust as an Affective Attitude”, Ethics, 107, 4-25. KAGEL, J. H. y D. LEVIN (1986), “The Winner’s Curse and Public Information in Common Value Auctions,” American Economic Review, 76, 894-920. KAGEL, J. H., R. M. HARSTAD y D. LEVIN (1987), “Information Impact and Allocation Rules in Auctions with Affiliated Private Values: A Laboratory Study,” Econometrica, 55, 1.275-1.304. KAGEL, J. H. (1995), “Auctions: A Survey of Experimental Research”, en J. Kagel y A. Roth (eds.), The Handbook of Experimental Economics, Princeton, Princeton University Press. KAHAN, D. M. y T. L. MEARES (1998), “Foreword: The Coming Crisis of Criminal Procedure”, Georgetown Law Journal, 86, 1153-84. KAHNEMAN, D. y A. TVERSKY (1979), “Prospect theory: An analysis of decisions under risk”, Econometrica, 47, 313-327. KAPLAN, T. R. y S. ZAMIR (2000), “The Strategic Use of Seller Information in PrivateValues Auctions”, Hebrew University of Jerusalem Discussion Paper. KARKLINS R. y R. PETERSEN (1993), “Decision Calculus of Protest and Regimes: Eastern Europe 1989”, The Journal of Politics, 55, 588-614. KARMEN, A. (1996), “What’s Driving New York’s Crime Rate Down?”, Law Enforcement News, 30 de Noviembre. http://www.lib.jjay.cuny.edu/len/96/30nov/html/feature.html. KAUFFMAN, S.A. (1993), The Origins of Order, Nueva York, Oxford University Press. KELLING, G. y C. M. COLES (1996), Fixing Broken Windows: Restoring Order and Reducing Crime in our Communities, Nueva York, Free Press. KENNY, C. y M. MCBURNETT (1994), “An Individual-Level Multiequation Model of Expenditure Effects in Contested House Elections”, American Political Science Review, 88, 699-707. KIM, J-Y. (2006), “Hyperbolic Discounting and the Repeated Self-control Problem”, Journal of Economic Psychology, 27, 321-462.
Bibliografía 231
KIRCHGÄSSNER, G. y J. SCHIMMELPFENNIG (1992), “Closeness Counts if it Matters for Electoral Results for the United Kingdom and the Federal Republic of Germany”, Public Choice, 73, 283-299. KLEMPERER, P. (1999), “Auction Theory: A Guide to Literature”, Journal of Economic Surveys, 13, 227-286. KLEMPERER, P. (2003), Auctions: Theory and Practice, Princeton, Princeton University Press. KLINE, M. (1972), Mathematical Thought, vols.1 y 2, Oxford, Oxford University Press. KOLLOCK, P. (1998), “Social Dilemmas: The Anatomy of Cooperation”, Annual Review of Sociology, 24, 183-213. KOMORITA, S. S. (1994), “Introduction”, en S. S. Komorita (ed.), Social Dilemmas. Madison, Brown and Benchmark. KORNBLITH, H. (1993), Inductive Inference and its Natural Ground, Cambridge, Mass, The MIT Press. KRAMNICK, I. (ed., 1987 [1787]), The Federalist Papers, Londres, Penguin. KREPS, D. (1990a), “Corporate Culture and Economic Theory”, en J. Alt y K. Shepsle (eds.), Perspectives on Positive Political Economy, Cambridge, Cambridge University Press. KREPS, D. (1990b), A Course in Microeconomic Theory, Nueva York, Harverster [Curso de teoría microeconómica, Madrid, McGraw-Hill, 1994]. KRISHNA, V. (2002), Auction Theory, San Diego, Academic Press. KRISTOF, N. D. y. S. WUDUNN (1994), China Wakes. The Struggle for the Soul of a Rising Power, Nueva York, Times Books. KUHN, H. W. (1953), “Extensive Games and the Problem of Information”, en H. W. Kuhn y A. W. Tucker, eds., Contributions to the Theory of Games, Volume II (Annals of Mathematics Studies, 28) Princeton, Princeton University Press, 193-216. KYDD, A. (2000), “Overcoming Distrust”, Rationality and Society, 12, 397-424. KYMLICKA, W. (2001), Politics in the Vernacular: Nationalism, Multiculturalism and Citizenship, Nueva York, Oxford University Press [La política vernácula. Nacionalismo, multiculturalismo y ciudadanía, Barcelona, Paidós, 2003]. LAHNO, B. (1995), “Trust and Strategic Rationality”, Rationality and Society, 7, 442-464. LAIBSON, D. (1997), “Golden Eggs and Hyperbolic Discounting”, Quarterly Journal of Economics, 112, 443-477. LAITIN, D. D. (1999), “Civil Wars, Insecurity and Intervention”, en B. F. Walter y J. Snyder (eds.), Civil Wars, Insecurity and Intervention, Nueva York, Columbia University Press. LANDSBERGER, M., J. RUBINSTEIN, E. WOLFSTETTER y S. ZAMIR (2001), “FirstPrice Auctions when the Ranking of Valuations is Common Knowledge”, Review of Economic Design, 6, 461-480. LARA, N. (2004), “El Deseo de ser Altruista”, Telos, 13, 87-104. LARA, N. (2005), “Ética y Negociación. Caso: la recuperación de un espacio público”, Cuadernos de Postgrado, 23, 215-238. LEA, S., R. TARPY y P. WEBLEY, (1987), The Individual and the Economy, Cambridge, Cambridge University Press.
232 Economía, sociedad y teoría de juegos
LEINFELLNER, W. (1998), “Game Theory, Sociodynamics, and Cultural Evolution”, en Game Theory, Experience, Rationality, Dordrecht, Kluwer Academic Publishers. LEINFELLNER, W. y E. KÖHLER (eds.) (1998), Game Theory, Experience, Rationality, Dordrecht, Kluwer. LEVINE, M. (2005), Broken Windows, Broken Business, Boston, Warner Business Books. LEVITT, S. D. y S. J. DUBNER (2005), Freakonomics, Nueva York, William Morrow. LEWIS, D. (1969), Conventions. A Philosophical Study, Oxford, Basil Blackwell. LICHBACH, M. (2003), Is Rational Choice Theory All of Social Science?, Ann Arbor, The University of Michigan Press. LINARES MARTÍNEZ, F. (2004), “Hawks, Zealots and Hypocrites but not Free Riders: The Logics of Cooperation in Llano del Beal”, Rationality and Society, 16, 437-476. LINARES MARTÍNEZ, F. (2007), “El problema de la emergencia de las normas sociales en la acción colectiva: Una aproximación analítica”, Revista Internacional de Sociología, 46, 131-160. LLOYD, W. F. (1833), Two Lectures on the Checks to Population, Oxford, Oxford University Press. LOEWENSTEIN, G. (1999), “Experimental Economics from the Vantage-point of Behavioural Economics”, The Economic Journal, 109, 25-34. LONG, J. S. (1997), Regression Models for Categorical and Limited Dependent Variables, Londres, Sage. LUCE, R. D. y. H. RAIFFA (1957), Games and Decisions, Nueva York, Wiley. LYCAN W. (ed.) (1990), Mind and Cognition. A Reader, Oxford, Blacwell. MACKIE, J. (1977), Ethics. Inventing Right and Wrong, Londres, Penguin [Ética, Barcelona, Gedisa, 2000]. MACY, M. (1993), “Backward Looking Social Control”, American Sociological Review, 68, 819-836. MACY, M. (1997), “Identity, Interest and Emergent Rationality”, Rationality and Society, 9, 427-448. MANDLER, M. (1999), Dilemmas in Economic Theory, Oxford, Oxford University Press. MANSBRIDGE, J. (1999), “Altruistic Trust”, en M. Warren (ed.), Democracy and Trust, Cambridge, Cambridge University Press. MARSHALL, R. C., J. MEURER, R. JEAN-FRANCOIS y S. WALTER (1994), “Numerical Analysis of Asymmetric First Price Auctions,” Games and Economic Behavior, 7, 193220. MARWELL, G., y P. OLIVER (1993), The Critical Mass in Collective Action. A micro-social theory, Nueva York, Cambridge University Press. MAS-COLLEL, A. (1987), “Transformation in General Equilibrium Theory and Methods: An Interview”, en G. Feiwell (ed.), Arrow and the Ascent of Modern Economic Theory, Londres, Macmillan Press. MASKIN, E. y J. RILEY (2000), “Asymmetric Auctions”, Review of Economic Studies, 67, 413-438. MASKIN, E. y J. TIROLE, J. (1999), “Unforeseen Contingencies and Incomplete Contracts”, Review of Economics Studies, 66, 39-56.
Bibliografía 233
MATSUSAKA, J. G. (1993), “Election Closeness and Voter Turnout: Evidence form California Ballot Proposition”, Public Choice, 76, 313-334. MATSUSAKA, J. G. y F. PALDA (1993), “The Downsian Voter Meets the Ecological Fallacy”, Public Choice, 77, 855-878. MAYER, N. (2003), “Democracy in France: Do Associations Matter?”, en M. Hooghe y D. Stolle (eds.), Generating Social Capital, Nueva York, Palgrave. MAYNARD-SMITH, J. (1978), “La evolución del comportamiento”, Investigación y Ciencia, 26, 116-127. MAYNARD SMITH, J. (1982), Evolution and the Theory of Games, Cambridge, Cambridge University Press. MCCLOSKEY, M. (1983), “Intuitive Physics”, Scientific American, 248. MCKELVEY, R. D. y Th. R. PALFREY (1995), “Quantal Response Equilibria for Normal Form Games”. Games and Economic Behavior, 10, 6-38. MELE, A. (1988), Irrationality, Oxford, Oxford University Press. MÉNDEZ LAGO, M. (1998), Organizing for Victory and Defeat, [Tesis doctoral] Florencia, Instituto Universitario Europeo. MERTON, R. K. (1972), Teoría y Estructura Sociales, México, Fondo de Cultura Económica. MESSICK, D. M. y R. M. KRAMER (2001), “Trust as a Form of Sallow Morality”, en K. S. Cook (ed.), Trust in Society, Nueva York, Russell Sage Foundation. MILGROM, P. (1981), “An Axiomatic Characterization of Common Knowledge”, Econometrica, 49, 219-222. MILGROM, P. R. y R. J. WEBER (1982), “A Theory of Auctions and Competitive Bidding”, Econometrica, 50, 1.089-1.122. MILLER, L. M. (2004): “Escenarios para la acción colectiva”, Revista Internacional de Sociología 39, 167-197. MILLER, L. M. (2007), “Coordinación y acción colectiva”, Revista Internacional de Sociología, 46, 161-183. MINFORD, P. (1992), Rational Expectations Macroeconomics, Oxford, Blackwell. MIRRLESS, J. (1971), “An Exploration in the Theory of Optimum Income Taxation”, Review of Economic Studies, 38, 175-208. MOHYELDIN SAID, K. A., W. NEWTON-SMITH, R. VIALE y K. WILKES (1990), Modelling the Mind, Oxford, Oxford University Press. MOLENAERS, N. (2003), “Associations or Informal Networks? Social Capital and Local Development Practices”, en M. Hooghe y D. Stolle (eds.), Generating Social Capital, Nueva York, Palgrave. MORISHIMA, M. (1973), Marx’s Economics, Cambridge, Cambridge University Press. MORROW, J. D. (1994), Game Theory for Political Scientists, Princeton, Princeton University Press. MORTON, R. B. (1999), Methods and Models. A Guide to the Empirical Analysis of Formal Models in Political Science, Cambridge, Cambridge University Press. MYERSON, R. B. (1981), “Optimal Auction Design”, Mathematics of Operation Research, 6, 58-73.
234 Economía, sociedad y teoría de juegos
NAGEL, R. (1995), “Unraveling in Guessing Games: An Experimental Study.” American Economic Review, 85, 1.313-1.326. NAGLER, J. y J. LEIGHLEY (1992), “Presidential Campaign Expenditures: Evidence on Allocations and Effects”, Public Choice, 73, 319-333. NASAR, S. (1998), A Beautiful Mind. A Biography of John Forbes Nash Jr., Nueva York, Simon & Schuster. NASH, J. (1950), “Equilibrium Points in N-person Games”, Proceedings of the National Academy of Sciences, 36, 48-49. NASH, J. (1951), “Non-cooperative Games”, Annals of Mathematics, 54, 286-295. NASH, J. (1953), “Two-person cooperative games”, Econometrica, 21, 128-140. NOZICK, R. (1969), “Newscomb’s Problem and Two Principles of Choice”, Nicholas Rescher (ed.), Essays in honor of Carl G. Hempel, Dordrecht, Riedel. OBERSCHALL, A. (1994), “Rational Choice in Collective Protest”, Rationality and Society, 6, 79-100. OFFE C. (1999), “How Can We Trust Our Fellow Citizens?”, en M. E. Warren (ed.) Democracy and Trust, Cambridge, Cambridge University Press. OLIVER, P. (1980), “Rewards and Punishments as Selective Incentives for Collective Action: Theoretical Investigations”, American Journal of Sociology, 85, 1.356-1.375. OLIVER, P., G. MARWELL y R. TEIXEIRA (1985), “A theory of critical mass I. Group heterogeneity, interdependence and the production of collective goods”, American Journal of Sociology, 91, 522-556. OLSON, M. (1992 [1965]), The Logic of Collective Action, Cambridge, Mass., Harvard University Press. O’NEILL, B. (2000), Honor, Symbols and War, Ann Arbor, University of Michigan Press. ORBELL, J. y. R. DAWES (1981), “Social Dilemmas”, en G. M. Stephenson y J. M. Davis (eds.), Progress in Applied Social Psychology, Nueva York, Wiley. ORDESHOOK, P. C. (1986), Game Theory and Political Theory, Nueva York, Cambridge University Press. ORDESHOOK, P. C. (1992), A Political Theory Primer, Londres, Routledge. ORLEAN, A. (2004), Analyse économique des conventions, París, Quadrige/Presses Universitaires de France. OSTROM, E. (1990a), Governing the Commons: The evolution of institutions for collective action, Nueva York, Cambridge University Press. OSTROM, E. (1990b), Understanding Institutional Diversity, Nueva York, Princeton, Princeton University Press. OVEJERO, F. (1985), De la naturaleza a la sociedad, Barcelona, Península. OVEJERO, F. (1988), “La racionalidad en las teorías económicas”, Arbor, 511, 45-80. OVEJERO, F. (1989), “Diez años de marxismo analítico”, Arbor, 526, 97-124. OVEJERO, F. (1992), La quimera fértil, Barcelona, Icaria. OVEJERO, F. (2003a), El compromiso del método, Barcelona, Montesinos. OVEJERO, F. (2003b), “Las matemáticas de las economías”, Claves de razón práctica, 136, 46-53.
Bibliografía 235
OVEJERO, F. (2004), “Economía y psicología”, Revista Internacional de Sociología, 38, 9-34. OVEJERO, F. (2005), “¿La mente de la economía o la economía de la mente?”, Revista de Libros, 108. OVERBYE, E. (1995), “Making a Case for the Rational, Self-regarding ‘Ethical’ Voter, and solving ‘The Paradox of not Voting’ in the Process”, European Journal of Political Research, 27, 369-396. PARETO, V. (1896), Cours d`Economie Politique, Universidad de Lausanne. PARKER, S. y M. MCKINNEY (1999), Origins of Intelligence, Baltimore, The Johns Hopkins University Press. PARSONS, T. y E. SHILS (1951), Toward a General Theory of Action, Cambridge Mass., Harvard University Press. PELEG, B. (1998), “Effectivity Functions, Game Forms, Games, and Rights”, Social Choice and Welfare, 15, 67-80. PETTIT, Ph. (1991), “Decision Theory and Folk Psychology”, en M. Bacharach y S. Hurley (eds.), Foundations of Decision Theory, Londres, Basil Blackwell. PEZANIS-CHRISTOU, P. (2002), “On the Impact of Low-Balling: Experimental Results in Asymmetric Auctions”, International Journal of Game Theory, 31, 69-89. PLUM, M. (1992), “Characterization and Computation of Nash-Equilibria for Auctions with Incomplete Information”, International Journal of Game Theory, 20, 393-418. POVINELLI, D. (2003), Folk Physics for Apes: The Chimpanzee’s Theory of How the World Works, Oxford, Oxford University Press. PUTNAM, R. D. (1993), Making Democracy Work. Civic Traditions in Modern Italy, Princeton, Princeton University Press. PUTNAM, R. D. (2000), Bowling Alone. The Collapse and Revival of the American Community, Nueva York, Simon and Schuster. QUINE, W. (1990), Pursuit of Truth, Harvard, Harvard University Press. RABIN, M. (1993), “Incorporating Fairness into Game Theory and Economics”, American Economic Review, 83, 1.281-1.302. RADFORD, R. (1945), “The Economic Organization of a P.O.W. Camp”, Economica, II, 48. RAWLS, J. (1999) [1958], “Justice as Fairness”, en S. Freeman (ed.), John Rawls.Collected Papers, Cambridge, Mass., Harvard University Press, 47-72. RIKER, W. (1993), “Rethorical Interaction in the Ratification Campaigns”, en W. Riker (ed.), Agenda Formation, Ann Arbor, Michigan University Press. RIKER, W. y P. C. ORDESHOOK (1968), “A Theory of the Calculus of Voting”, American Political Science Review, 62, 25-42. RIKER, W. y P. C. ORDESHOOK (1973), Introduction to positive political theory, Englewood Cliffs, Prentice Hall. RILEY, J. G. y W. F. SAMUELSON (1981), “Optimal Auctions”, American Economic Review, 71, 381-392. RIMA, I. (ed.) (1995), Measurement, Quantification and Economic Analysis, Londres, Roudtlege.
236 Economía, sociedad y teoría de juegos
ROBERTS, F. (1979), Measurement Theory, Reading, Mass., Addison-Wesley. ROBLES, J. M. (2004), “Racionalidad acotada: heurísticos y acción individual”, Teoría, 14, 37-46. ROEMER, J. (1982), A General Theory of Exploitation and Class, Cambridge, Mass., Harvard University Press. ROSENBERG, A. (1994), “What is the Cognitive Status of Economic Theory”, en R. Backhouse (ed.), New Directions in Economic Methodology, Londres, Roudledge. ROSENSTONE, S. J. y M. J. HANSEN (1993), Mobilization, Participation and in America, Nueva York, Macmillan. ROSS, S. A. (2004), Neoclassical Finance, Princeton University Press. ROTH, A. E. (1995), “Introduction to Experimental Economics”, en J. H. Kagel y A. E. Roth (eds.), Handbook of Experimental Economics, Princeton, NJ, Princeton University Press. ROTHSCHILD, M. y J. STIGLITZ (1976), “Equilibrium in Competitive Insurance Markets: An Essay on the Economics of Imperfect Information”, Quarterly Journal of Economics, 90, 629-649. ROUSSEAU, J.-J. (1998) [1762], Emilio, Madrid, Alianza Editorial. RUBINSTEIN, A. (2005), “Discussion on Advances on Behavioral Economics”, en Advances in Economics and Econometrics, Cambridge, Cambridge University Press. SACCONI, L. y. S. MORETTI (2002), “Fuzzy Norms, Default Reasoning and Equilibrium Selection in Games under Unforeseen Contingencies and Incomplete Knowledge. Seconda edizione”, LIUC Papers: pubblicazione periodica dell’Università “Carlo Cattaneo”, 104. SAMPSON, R. J. y J. COHEN (1998), “Deterrent effect of the Police on Crime: A Replication and Theoretical Extension”, Law and Society Review, 22, 163-189. SAMPSON, R. J. y S. W. RAUDENBUSH (1999), “Systematical Social Observation of Public Spaces: A New Look at Disorder in Urban Neighborhoods”, American Journal of Sociology, 105, 603-651. SAMUELSON, L. (1997), Evolutionary Games and Equilibrium Selection, Cambridge, The MIT Press. SAMUELSON, P. (1947), Foundations of Economic Analysis, Cambrigde, Mass., Harvard University Press. SAMUELSON, P. (1962), “Parable and Realism in Capital Theory: The Surrogate Production Function”, Review of Economic Studies, 29, 193-206. SANDLER, T. (1992), Collective Action: Theory and Applications, Ann Arbor, University of Michigan Press. SCHARPF, F. (1990), “Games Real Actors Could Play”, Rationality and Society, 2, 471-494. SCHARPF, F. W. (1997), Games Real Actors Play, Boulder, Westview Press. SCHELLING T. (1960), The Strategy of Conflict, Cambridge, Mass., Harvard University Press [La estrategia del conflicto, Madrid, Tecnos, 1964]. SCHELLING, Th. (1978), Micromotives and macrobehavior, Nueva York, E. W. Norton. [Micromotivos y macroconducta, México, FCE, 1989]. SCHELLING, Th. (1984), Choice and Consequence, Harvard, Harvard University Press.
Bibliografía 237
SCHICK, F. (1991), Understanding Action, Cambridge, Cambridge University Press. SCHOTTER, A. (1981), The Economic Theory of Social Institutions, Cambridge, Cambridge University Press. SCHOTTER, A., K. WEIGELT y C. WILSON (1994), “A Laboratory Investigation of Multiperson Rationality and Presentation Effects,” Games and Economic Behavior, 6, 445-68. SCOTT, R. (2003), “A Theory of Self-enforcement Indefinite Agreements”, Columbia Law Review, 103, 1.641-1.699. SEDLMEIER, P. y G. GIGERENZER, (2001), “Teaching Bayesian Reasoning in Less Than Two Hours”, Journal of Experimental Psychology, 130, 389-400. SELTEN, R. (1965), “Spieltheoretische Behandlung eines Oligopolmodells mit Nachfragetragheit”, Zeitschrift fur die gesamte Staatswissenschaft, 121, 301-324 y 667-689. SELTEN, R. (1985), “Comment”, en K. Arrow y S. Honkapohja (eds.), Frontiers of Economics, Oxford, Blackwell. SEN, A. (1970), “The impossibility of a Paretian liberal”, Journal of Political Economy, 78, 152-157. SEN, A. (1976), Elección colectiva y bienestar social, Madrid, Alianza Editorial. SEN, A. (1982), “Liberty, Unanimity and Rights”, en A. Sen, Choice, Welfare and Measurement, Oxford, Basil Blackwell, 1982, 291-326. SEN, A. (1986), “Foundations of social choice theory: an epilogue”, en J. Elster y A. Hylland (eds.), Foundations of social choice theory, Cambridge, Cambridge University Press. SEN, A. (1991), “Utility: Ideas and Terminology”, Economics and Philosophy, vol. 7, 227-283. SEN, A. (1995), “Minimal liberty”, en A. Sen, Nueva economía del bienestar, Valencia, Universidad de Valencia, 193-215. SHACHAR, R. y B. NALEBUFF (1999), “Follow the Leader: Theory and Evidence on Political Participation”, The American Economic Review, 89, 525-547. SHAKED, A. (2005), “The Rhetoric of Inequity Aversion”, en http://www.wiwi.uni-bonn. de/shaked/rhetoric. SHAPLEY, Ll. S. (1953), “A value for n-person games” en H. Kuhn y A. Tucker (eds.), Contributions to the Theory of Games, vol. 2 of Annals of Mathematics Studies, 28, 307-317 Princeton University Press. SHEFFRIN, S. (1983), Expectativas racionales, Madrid, Alianza Editorial. SHUBIK, M. (1959), “Edgeworth Market Games,” en Contributions to the Theory of Games, A. W. Tucker y R. D. Luce (eds.), Princeton, Vol. IV, 267-278. SHUBIK, M. (1982), Game Theory in the Social Sciences. Concepts and Solutions, Cambridge, The MIT Press. SIMON, A. F. (2002), The Winning Message. Candidate Behavior, Campaign Discourse and Democracy, Cambridge, Cambridge University Press. SIMON, H. (1986), “Rationality in Psychology and Economics”, en R. Hogarth y M. Reder (eds.) Rational Choice, Chicago, University of Chicago Press. SIMON, H. A. (1955), “A Behavioral Model of Rational Choice,” Quarterly Journal of Economics, 69, 99-118.
238 Economía, sociedad y teoría de juegos
SKOGAN, W. G. (1990), Disorder and Decline: Crime in the Spiral of Decay in American Neighborhoods, Nueva York, Oxford University Press. SKYRMS, B. (1996), Evolution of the Social Contract, Cambridge, Cambridge University Press. SMELSER, N. (1962), Collective Behavior, Nueva York, The Free Press. SMITH, A. (1976 [1776]), An Inquiry into the Nature and Causes of the Wealth of Nations, Oxford, Clarendon Press. SMITH, A. (1991 [1790, sexta ed.]), The Theory of Moral Sentiments, Oxford, Clarendon Press. SNYDER, J. M. (1989), “Election Goals and the Allocation of Campaign Resources”, Econometrica, 57, 637-660. SNYDER, J. y R. JERVIS (1999), “Civil War and the Security Dilemma”, en B. F. Walter y J. Snyder (eds.), Civil Wars, Insecurity and Intervention, Nueva York, Columbia University Press. SOBER, E. (ed.) (1986), Conceptual Issues in Evolutionary Theory, Cambridge, Mass, The MIT Press. SPENCE, M. (1973), “Job Market Signaling”, Quarterly Journal of Economics, 87, 355-374. SPERBER, D. (1996), “Modularité mentale et diversité culturelle”, en Le contagion des idées, París, Editions Olide Jacob. STAHL, D. (1993), “Evolution of Smart-n Players”, Games and Economic Behavior, 5, 604-617. STEIN, E. (1996), Without Good Reason, Oxford, Clarendon Press. STICH, S. (1985), From Folk Psychology to Cognitive Science, Cambridge, Mass., MIT Press. STICH, S. (1994), The Fragmentation of Reason, Cambridge, Mass., The MIT Press. STOLLE, D. (2003), “The Sources of Social Capital”, en M. Hooghe y D. Stolle (eds.), Generating Social Capital, Nueva York, Palgrave. STOLLE, D. y Th. ROCHON (1998), “Are All Associations Alike? Members Diversity, Associational Type and the Creation of Social Capital”, American Behavioral Scientists, 42, 47-65. SUGDEN, R. (1986), The Economics of Welfare, Rights and Co-operation, Oxford, Basil Blackwell. SUGDEN, R. (1989), “Spontaneous Order”, Journal of Economic Perspectives, 3, 85-97. TAYLOR, Ch. (1985), Philosophy and the Human Sciences. Philosophical Papers, II, Cambridge, Cambridge University Press. TAYLOR, M. (1987), The Possibility of Cooperation, Cambridge, Cambridge University Press. THACKRAY, A. (1981), Atomi e forze, Bologna, il Mulino. THALER, R. (1980), “Toward a Positive Theory of Consumer Choice”, Journal of Economic Behavior and Organizatrion, 1, 39-60. TIROLE, J. (1988), The Theory of Industrial Organisation, Cambridge, Mass., The MIT Press. TÖNNIES, F. (1909), Die Sitte, Frankfurt am Main, Rütten & Loening.
Bibliografía 239
TVERSKY, A. y D. KAHNEMAN (1986), “Rational Choice and the Framing of Decisions”, Journal of Business, 59, 251-278. ULLMANN-MARGALIT, E. (1977), The Emergence of Norms, Oxford, Clarendon Press. USLANER, E. (2002), The Moral Foundations of Trust, Cambridge, Cambridge University Press. VALLENTYNE, P. (ed.) (1991), Contractarianism and Rational Choice, Cambridge, Cambridge University Press. VAN FRAASEN, B. (1980), The Scientific Image, Oxford, Clarendon Press. VAN HEES, M. (2000), “Negative Freedom and the Liberal Paradox”, Rationality and Society, 12, 335-352. VAN HUYCK, J. B., R. C. BATTALIO y J. COOK (1997), “Adaptative Behavior and Coordination Failure”, Journal of Economic Behavior and Organization, 32, 483-503. VAN PARIJS, P. (1981), Evolutionary Explanation in the Social Sciences, Totowa, Rowman and Littlefield. VERBEEK, B. y Ch. MORRIS (2004), “Game Theory and Ethics”, The Stanford Encyclopedia of Philosophy (Winter 2004 Edition), Edward N. Zalta (ed.), en http://plato.stanford. edu/archives/win2004/entries/game-ethics. VICKREY, W. (1945), “Measuring Marginal Utility by Reactions to Risk”, Econometrica, 13, 319-333. VICKREY, W. (1961), “Counterspeculations, Auctions, and Competitive sealed Tender”, Journal of Finance, 16, 8-37. VON NEUMANN, J. y O. MORGENSTERN (1944), Theory of Games and Economic Behaviour, Princeton, Princeton University Press. VON WRIGHT, G. H. (1970), Norma y Acción. Una investigación lógica, Madrid, Editorial Tecnos. VV. AA. (2004), Biology and philosophy, número 19 dedicado a “Perspectives on the Animal Mind”. WALTER, B. F. (1999), “Designing Transitions from Civil War”, en B. F. Walter y J. Snyder (eds.), Civil Wars, Insecurity and Intervention, Nueva York, Columbia University Press. WEBER, M. (1964 [1922]), Economía y sociedad, Madrid, Fondo de Cultura Económica. WEIBULL, J. W. (1995), Evolutionary Game Theory, Cambridge, Mass., The MIT Press. WHITELEY, P. F. (1999), “The Origins of Social Capital”, en J. W. Van Deth, M. Maraffi, K. Newton y P. F. Whiteley (eds.), Social Capital and European Democracy, Londres, Routledge. WILSON, J. Q. y G. L. KELLING (1982), “Broken Windows”, Atlantic Monthly, 249, 29-38. WILSON, R. K. y. C. M. RHODES (1997), “Leadership and Credibility in N-Person Coordination Games”, The Journal of Conflict Resolution, 41, 767-791. WOLF, R. (1990), “Methodological Individualism and Marx: Some Remarks on Jon Elster, Game Theory and Other Things”, Canadian Journal of Philosophy, 4. WOLFSTETTER, E. (1999), Topics in Microeconomics, Cambridge, Cambridge University Press.
240 Economía, sociedad y teoría de juegos
WOLLEBAK, D. y P. SELLE (2003), “The Importance of Passive Membership for Social Capital Formation”, en M. Hooghe y D. Stolle (eds.), Generating Social Capital, Nueva York, Palgrave. YAMAGISHI, T. (2001), “Trust as a Form of Social Intelligence”, en K. Cook (eds.) Trust in Society, Nueva York, Russell Sage. YOUNG, H. P. (1996), “The Economics of Convention”, Journal of Economic Perspectives, 10, 105-122. ZIMBARDO, P. G. (1969), Why Americans are Growing More Violent, Sacramento, Bee.
Índice analítico y de autores
A acción colectiva; 45, 46, 48-58, 60, 62, 64, 65, 67, 68, 115, 128, 132-134, 206, 214, 215, 219-221. Akerlof, R.; 15. Arrow, K. J.; 3, 31-34, 44, 90, 96. teorema de imposibilidad de; 32, 34, 44, 90. assurance game (véase juego de la seguridad). Aumann, R. J.; 6, 15, 41, 44, 73, 125, 139, 201. Axelrod R.; 40, 53, 103, 107, 177, 178, 200, 201.
B Bayes, regla de; 163, 170, 187, 199, 207. Binmore, K.; 77, 78, 105, 107, 122, 130, 141, 217. bien público; 11, 13, 49, 62, 96-98, 145, 147, 210. Bratton, W.; 192, 197, 198.
C Camerer, C. F.; 19, 22, 25, 117, 121, 122, 125, 130, 147, 159, 190. Chwe, M.; 73, 79. Coase, R. H.; 35, 202. Coleman, J.; 49, 57, 58, 60-62, 64, 66, 68, 69, 77, 87, 177. common knowledge (conocimiento común); 41-44, 71-76, 143, 155-157, 178, 205. compatibilidad de incentivos (véase incentivos). competencia electoral; 164. competitividad esperada; 169. conformismo; 85. contingencia; 138, 143, 145.
contrato social; 102, 103. convención social; 55, 69, 74, 76, 77, 80, 84, 87, 88. coordinación, problema de; 22, 29, 30, 39, 71-87. creencias; 2, 9, 21, 23, 34, 73, 111-113, 115-119, 124-130, 149, 150, 154, 163, 167, 169-171, 176, 180, 181, 187, 191, 205.
D delitos mayores; 191-194, 197, 198. derechos; 29, 30, 90, 92-95, 94, 95, 129, 133, 201, 202. dilema del altruista; 100-102. dilema del prisionero; 6, 7, 20, 28, 37, 38, 51, 53, 56-64, 67, 87, 89, 95, 97, 99, 101, 103, 127, 128, 134, 140, 148, 176-178, 205. diseño de mecanismos; 13. dominancia; 138-140, 143, 145, 156, 159. Dubner, S. J.; 189.
E Economía del comportamiento; 16. experimental; 17, 19-22, 24, 137 y ss. neoclásica; 7, 16-18, 23, 24, 49, 111, 112. elección racional; 45, 46, 50, 63, 65-67, 69, 70, 74, 101, 102, 114, 161, 162, 172, 175, 177, 185. Elster, J.; 126, 127. engaño (deception); 145. equilibrio bayesiano; 9, 12, 199, 207. de Nash; xi, xii, 2, 4-9, 12, 20-23, 24, 73, 80, 81, 95, 100-104, 107, 140, 154, 207. 241
242 Economía, sociedad y teoría de juegos en estrategias mixtas; 22, 72, 80, 140. perfecto en subjuegos; 8, 12, 207. secuencial; 17, 207. estabilidad; 81, 84, 87. estrategia; 4, 75, 81, 82, 93, 208. de equilibrio; 8,20-21, 205. dominante; 6, 38, 54, 68, 95, 179, 206. evolutivamente estable; 70, 80, 81, 83, 104, 106. mixta; 22, 84, 100, 101, 133, 140, 206, 208, 209. pura; 80, 83, 95, 97, 99, 100, 104, 155, 156, 157, 208. expectativas mutuas concordantes; 72.
F folk psychology; 116, 118, 120, 122. folk theorem (véase teorema folk). forma extendida; 7, 97, 105, 213. forma normal; 7, 93, 206, 208, 213. free rider; 49, 57-59, 206, 210. de segundo orden; 58, 59, 66. función de producción; 48, 51-54, 58, 59, 6265, 68.
G Gauthier, D.; 101. gorrón (véase free rider). grados de razonamiento; 149.
H Harsanyi, J.; xiii, xiv, 8, 9, 12, 14, 15, 31-35, 3840, 44, 76, 90, 118, 123, 153, 198, 209. Heckathorn, D.; 51, 54, 58. Helbing, D.; 200. Hofbauer, J.; 201.
I incentivos compatibilidad de; 12, 14. diseño de; 37. incertidumbre; 15, 17, 34, 35, 105, 106, 113, 116, 163, 168-172, 177, 178, 181, 182, 191, 209, 211, 212. indeterminación; 3, 87.
individualismo metodológico; 114, 115, 121, 129. información asimétrica; 10, 11, 13-15. completa; 7, 103, 153, 177, 182, 198, 211, 212. imperfecta; 9, 14, 16, 177, 181. incompleta; 8, 9, 105, 153, 177, 179. perfecta; 9, 16, 177, 211, 212. simétrica; 9, 10, 211, 212.
J juego de bienes públicos; 148. juego de confianza (trust games); 148. juego de señales; 176, 181, 184, 185, 216. juego de suma cero; xi, 212. juego del dictador; 148, 216. juego del gallina; xi, 52-54, 57, 58, 64, 65, 213. juego de la seguridad (assurance game); 13, 64-67, 128, 182, 215. juego del ultimátum; 20, 148, 216. juegos repetidos; 15, 140, 150, 203. justicia distributiva; 102, 104, 138.
K Kahan, D. M.; 193. Kahneman; 15, 16, 139. Kauffman, S. A.; 200. Kelling, G.; 190. Kim, J.; 99, 196.
L laboratorio; 15, 17, 108, 137, 139, 140 y ss. Leinfellner, W.; 200. Levine, M.; 198. Levitt, S. D.; 189. Lewis, D.; 69-75, 77, 78, 84. ley; 96-99. libertad; 29-31, 90-93, 95-99. liberalismo; 90, 91, 95, 96.
M mano invisible; 3, 6, 7, 16. mantenimiento del orden; 194. masa crítica; 57, 58, 60-64, 68, 133.
Índice analítico 243 Maschler, M. B.; 201. Meares, T. L.; 193. mercado competitivo; 6, 9. moda; 45, 46, 48, 59, 65, 66. modelos de agentes computerizados; 144, 151. modelo de MR; 156. de PLUM; 155. LRWZ; 157. monotonicidad; 138, 139, 143. Morgenstern, O.; xii, xiii, 89. Myerson, R.; 13-15. movimiento social reformista; 64. revolucionario; 45, 46, 59, 62-65.
N Nash, J.; xi, xii, xiii, 4, 5, 15, 31, 33, 34, 139, 140. negociación; 5, 6, 20, 31-36, 39-41, 80, 90, 99106, 133, 148. neuroeconomía; 125, 150, 151. nicho de captura; 202. nicho de impunidad; 192-195, 197, 202. norma de coordinación; 85. moral; 90, 104-107. prescriptiva; 57, 64. proscriptiva; 57, 64. social; 55, 56, 59-62, 65, 67, 85-87, 89, 104, 193, 194. núcleo; 4-6.
O Olson, M.; 50, 51, 56, 65. óptimo de Pareto; 17, 31, 53, 91-93, 102, 182, 201, 217. Ostrom, E.; 56.
P pánico; 45, 46, 48, 59 y ss. paradoja de Gibbard; 95. Pareto, V.; 17. Parsons, T.; 46, 47, 67. pequeños delitos; 190-192, 195, 196.
perfección en subjuegos; 8, 9, 12, 14, 20, 24, 207. políticas públicas; 189, 191, 193, 194, 198. prominencia (salience); 75, 83. punto focal; 75, 83, 217.
R racionalidad individual; 4, 30, 89, 101. colectiva; 4. limitada o acotada; 16, 17, 23, 24, 68, 87, 154. perfecta; 16, 23. Raudenbush, S. W.; 194. Rawls, J.; 103. regla heurística; 87. regularidad social; 70, 74, 87. riesgo; 117, 123, 130, 154-158, 198. Rousseau, J. J.; 96, 99.
S Sampson, R. J.; 195. Samuelson, L.; 203. Samuelson, P.; 11, 13, 17, 121. Schelling, Th.; xii-xv, 15, 70, 110, 127, 130-33, 139, 140. Schotter, A.; 70. Sedlmeier, P.; 191. selección adversa; 10. Selten, R.; 8, 12, 15, 23, 76, 118, 130, 139, 201. Sen, A.; 90, 91-96, 115, 134. condición L de; 91. señalización; 10, 11, 140. Shubik, M.; xiii, 6, 199. Sigmund, K.; 201. simulaciones; 144, 151. Skogan W. G.; 195. Smith, A.; 3, 6, 7, 16. Smith, V.; 15, 139, 140. subasta de primer precio; 13, 154. de segundo precio; 154.
T teorema de imposibilidad de Arrow (véase Arrow).
244 Economía, sociedad y teoría de juegos de imposibilidad de un liberal paretiano; 91. de imposibilidad de Gibbard (véase paradoja de Gibbard). minimax; xi. folk; 7. teoría de juegos cooperativa; xii, 3-6, 200, 212. evolutiva; 21,22, 50, 68, 79, 80, 81, 83, 89, 218. no cooperativa; 3, 4, 14, 15, 212. teoría de las ventanas rotas; 189. teoría social; 46.
U Ullmann-Margalit, E.; 85-87. utilidad esperada; 17, 80, 113, 116, 134, 155, 167, 173. maximización de; 16, 116. utilitarismo; 102.
V validez externa; 142, 144. validez interna; 142. valor de Shapley; 5. Van Huyck, J. B.; 190. Von Neumann, J.; xi-xiv, 5, 7, 17, 28, 42, 76, 89, 112, 139, 199.
W Weber, M.; 69. Weibull, J. W.; 200. Wilson, J. Q.; 190, 191, 194, 197, 198.
Y Young, H. P.; 70.
Z Zimbardo, P. G.; 190. Zimring, F.; 196.
Economía,Sociedad y Teoría de Juegos La teoría de juegos se ha convertido en apenas tres décadas en una herramienta imprescindible en los más diversos ámbitos de las ciencias sociales. Desde la economía a la sociología, pasando por la ciencia política y la criminología, la teoría de juegos ha aportado en poco tiempo nuevas soluciones a problemas centrales de la vida social (el funcionamiento del mercado, el surgimiento de normas y convenciones sociales, la confianza, las estrategias de los partidos) y ha abierto a su vez nuevas líneas de investigación. La filosofía, por su parte, no ha sido ajena a estos desarrollos y ha empleado toda clase de juegos para entender mejor el papel de la ética y la justicia en las sociedades complejas. El creciente interés por la teoría de juegos trasciende incluso el ámbito especializado, pues en los periódicos y en las tertulias radiofónicas o televisivas se recurre cada vez más a términos como “juegos de suma cero” o “dilema del prisionero” para comprender mejor las cuestiones candentes del mundo actual. Pensando, pues, tanto en el público en general como en el lector especializado, Economía, sociedad y teoría de juegos reúne a once expertos españoles y latinoamericanos que, con un lenguaje riguroso pero comprensible sin necesidad de conocimiento previo alguno, presentan un amplio panorama de la naturaleza y usos de una teoría que debe formar parte del bagaje intelectual de la persona culta del siglo XXI, por un lado, y del especialista en filosofía y ciencias sociales, por otro.