Posts etiquetados ‘Racionalidad’

La teoría de la decisión racional

Uno de los enfoques sobre la racionalidad más desarrollados es el que se conoce como Teoría de la Decisión Racional, o «Teoría de la Decisión». Esta teoría tiene la ventaja de que puede ser formulada matemáticamente, lo que permite, por un lado, discutir con precisión su estructura, sus presupuestos y sus implicaciones, y por otro lado, aplicarla a múltiples casos. El carácter matemático de la teoría la ha hecho especialmente adaptada a la ciencia económica, que es la rama de las ciencias sociales donde la Teoría de la Decisión Racional se ha aplicado más intensamente y donde ha encontrado menos oposición por parte de otros enfoques. De todas formas, como veremos, la teoría tiene algunos aspectos que pueden ser razonablemente criticados. Sin  ir muy lejos ya vemos que su aplicación en la teoría económica hace aguas por momentos, porque al parecer, no son tan racionales las decisiones que tomamos los seres humanos. Ahí están los mercados y la crisis del sistema económico para confirmarlo.

El núcleo básico de la Teoría de la Decisión es, en primer lugar, la descripción de las situaciones a las que se enfrentan los individuos, así como de sus preferencias y sus creencias, de la forma más clara posible, y en segundo lugar, la suposición de que estas creencias y preferencias son internamente coherentes, y coherentes con las acciones elegidas por los sujetos.

Con respecto a la situación, la representaremos indicando las diferentes opciones o alternativas que tiene el individuo (se trata, por supuesto, de las opciones que el individuo cree que tiene, aunque en general se asume que conoce todas las alternativas posibles); estas opciones serán incompatibles entre sí (es decir, el sujeto no podrá elegir más de una), y deben estar representadas todas las opciones posibles (es decir, el sujeto tendrá que elegir necesariamente alguna).

Las preferencias de los individuos no están definidas directamente sobre las opciones, sino sobre los resultados que se obtienen con cada posible elección. En el caso más sencillo, cada una de estas opciones conducirá a un resultado conocido de antemano por el sujeto (por ejemplo, ducharse con agua caliente, con agua fría, o no ducharse), y entonces podremos identificar «opción» con «resultado» en las preferencias de los individuos. Debemos tener en cuenta que el gusto o la molestia que le pueda causar al agente inmediatamente la propia realización de la acción, lo hemos de contar ya entre los «resultados» de la decisión.

De todas formas, lo normal será que el sujeto no sepa con total certeza qué resultado es el que va a ocurrir con cada una de sus posibles decisiones. Esto quiere decir que cada decisión tendrá generalmente más de un resultado posible. Además, en muchos casos el resultado de una decisión será una nueva situación en la que el individuo se vea obligado nuevamente a elegir entre varias alternativas (no necesariamente las mismas que antes). A la descripción de estas cadenas de opciones, decisiones y resultados, se le llama «árbol de decisión», aunque también suele representarse en forma de tabla, indicando en las filas cada una de las alternativas entre las que el sujeto debe elegir (si sólo tiene que hacerlo una vez, o cada posible combinación de alternativas, si tiene que hacerlo varias veces), e indicando en las columnas cada una de las posibles combinaciones de factores independientes de la propia decisión y que pueden afectar a los resultados (a cada una de estas combinaciones posibles de «otros factores» se le llama convencionalmente «estado de la naturaleza», aunque puede incluir acciones realizadas por otros individuos).

Ser racional es maximizar satisfacción, pero debemos ser coherentes

La Teoría de la Decisión Racional es, como toda teoría, no sólo un marco que nos permite describir la realidad, sino un conjunto de hipótesis sobre cómo están relacionadas las cosas entre sí. Pues bien, el principal supuesto de la teoría es el de que los individuos elegirán en cada caso aquella alternativa que sea más coherente con la máxima satisfacción posible de sus preferencias.

Dicho de otra manera, una vez tomada una decisión, los individuos no podrán encontrar después razones para pensar que (dada la información que poseían en aquel momento) habría sido mejor para ellos elegir una opción diferente. Por supuesto, es posible que después encuentren nueva información, que les revele que otra de las alternativas era mejor para ellos, pero lo importante es que, en cada caso, se tome la decisión que es la mejor según la información disponible.

Ahora bien, ¿qué significa exactamente que una opción sea «la mejor»? Para que este concepto tenga un sentido claro es necesario que las preferencias de los individuos cumplan al menos dos requisitos:

  • Deben ser completas: para cualquier par de resultados, a y b
    • o bien el individuo prefiere a o bien prefiere b
    • o bien es indiferente entre los dos (es decir, no puede suceder que el sujeto no sepa si prefiere a o b,
    • o si ambas cosas le dan igual)
  • Las preferencias deben ser transitivas: si un individuo prefiere x a y, y prefiere y a z, entonces preferirá necesariamente x a z.

Para entender por qué son razonables estos dos supuestos, imaginemos lo que sucedería si no se cumplieran.

Respecto al primero, será incluso difícil pensar cómo podría tomarse racionalmente una decisión entre varias opciones si no están definidas las relaciones de preferencia entre ellas (nótese que, si no se cumple la condición 1, ni siquiera estaría determinado si las dos opciones son igual de valoradas).

Respecto a lo segundo, consideremos este ejemplo: una persona está jugando en un concurso, cuyos posibles premios son un viaje, una moto, o un equipo de TV, y que el sujeto prefiere el viaje a la moto (es decir, si tuviera que elegir entre ambas cosas, elegiría la moto), prefiere la moto al equipo de TV, pero prefiere el equipo de TV al viaje. Además de que esta persona no tendría un argumento claro para elegir un premio entre los tres (aunque, para cualesquiera dos premios, sí tiene claro cuál elegir), puede mostrarse que sus preferencias le harían caer fácilmente en el siguiente timo: supongamos que ha ganado el equipo de TV; como prefiere la moto al equipo, seguramente habrá alguna pequeña cantidad de dinero (pongamos, un euro) tal que, si le ofrecemos cambiar el equipo por la moto si nos da un euro por el cambio, aceptará el trato, y se quedará con la moto; como prefiere el viaje a la moto, seguramente ahora también estará dispuesto a pagar un euro a cambio de que le dejemos cambiar la moto por el viaje; pero como prefiere el equipo al viaje, también estará dispuesto a pagar un euro por cambiar el viaje por el equipo. Así que, al final, volverá a estar como al principio (con el equipo de TV), pero con tres euros menos. Si sus preferencias no han cambiado en el proceso, podemos seguir repitiéndolo indefinidamente, sacándole más y más dinero sin ningún coste para nosotros. Un sujeto con preferencias intransitivas sería, por lo tanto, algo así como una «bomba de dinero» (entendiendo bomba en el sentido de «bombear»).

Por argumentos parecidos, aunque más complejos matemáticamente, puede mostrarse que las creencias de los individuos racionales sobre cómo de probables son los posibles resultados de las acciones, esas creencias, decíamos, deben satisfacer los axiomas de la teoría de la probabilidad. Esto significa que dichas creencias deben poder expresarse de forma numérica (para cada posible resultado de elegir una alternativa, la probabilidad de dicho resultado debe ser un número comprendido entre 0 y 1), la probabilidad de que se den dos resultados a la vez debe ser 0 (pues los resultados son incompatibles entre sí), la probabilidad de que se dé alguno de un conjunto de resultados es igual a la suma de las probabilidades de cada uno, y la probabilidad de que se dé algún resultado será iguala 1.

Además, la probabilidad con la que un individuo cree que sucederá cierto resultado si toma cierta decisión, no puede ser una probabilidad cualquiera, sino que debe ser consistente con toda la información de la que el sujeto dispone. Si para un individuo no se cumplieran estas condiciones, también podríamos «bombear» dinero de él, como en el caso anterior, pero esta vez haciéndole apostar.

Consecuencias de ser racionales

Se debe al matemático J. Savage la demostración del teorema fundamental de la Teoría de la Decisión, que afirma que, si la conducta de un individuo es «racional» (en el sentido de que sus decisiones no pueden llevarle a situaciones en las que necesariamente saldría perdiendo, como en los ejemplos que hemos visto), entonces se cumplirán las siguientes consecuencias:

  1. Las preferencias del sujeto se podrán representar mediante una función numérica,u, tal que, si a y b son dos resultados posibles, el sujeto preferirá a a b si y sólo sí u(a) > u(b), y será indiferente entre los dos resultados si y sólo si u(a) = u(b); a esta función la llamaremos «función de utilidad»;

  2. Las creencias del sujeto se podrán representar mediante una función de probabilidad, p, (la expresión «p(a/x)» significa la probabilidad de que se obtenga a, supuesto que se ha hecho x);

  3. En cada situación, el sujeto elegirá aquella opción x para la que sea máximo el valor de la utilidad esperada, definido como sigue: si a, a2, …, an son los posibles resultados de x, la utilidad esperada de x será igual a

u(a1)p(a1/x) + u(a2)p(a2 /x) + … + u(an )p(an /x).

Es decir, la utilidad esperada de x es la media ponderada de las utilidades de todos los resultados a los que puede conducir x, siendo la ponderación de cada resultado igual a su probabilidad.

Si interpretamos estas probabilidades como frecuencias (o, más bien, como hipótesis que hacen los sujetos sobre la frecuencia con la que ocurriría cada resultado si la decisión pudiera ser tomada en las mismas circunstancias innumerables veces), entonces el concepto de utilidad esperada significa que, si se toma la decisión x, se obtendrá la utilidad u(a1) con una frecuencia igual a p(a1 /x), la utilidad u(a2) con una frecuencia p(a2 /x), etc.

 

Anuncios