Teorema de Bayes: un resultado sencillo y un fundamento para hacer Estadística

En 1763 se publicó el artículo An essay towards solving a problem in the doctrine of chances, (Un ensayo hacia la solución de problemas en la disciplina del azar. T. del Ed.) escrito por el reverendo Thomas Bayes (1701-1761). En dicho artículo, Bayes presentó una sencilla demostración de la teoría de la probabilidad cuyas consecuencias difícilmente podía prever. Con esa demostración, Bayes estableció los principios de la estadística bayesiana, la cual después cayó en el olvido y fue marginada por muchos años, hasta su resurgimiento y utilización para resolver todo tipo de problemas, desde la interpretación de mensajes en la Segunda Guerra Mundial hasta la actual decodificación del material genético.

Bayes ya había muerto cuando su famoso artículo fue enviado por su amigo Richard Price a la revista Philosophical Transactions. Algunos estudiosos todavía debaten si Price únicamente envió el artículo o también tuvo alguna intervención como autor.

El de Bayes es un teorema válido del "cálculo de probabilidades", lo que hoy llamamos "Teoría Matemática de la Probabilidad" (TMP). Este teorema también es conocido como teorema de la Probabilidad Inversa, pues explica cómo obtener la probabilidad de un evento A dada la información B calculándola al revés, esto es, estableciendo la probabilidad a priori del evento A, y la probabilidad de que hubiese ocurrido el evento B dado el evento A.

Con las herramientas y la elaboración de la TMP actuales el teorema de Bayes es muy sencillo de probar. De hecho Bayes probó una versión particular que se ha generalizado a espacios abstractos usando medidas de probabilidad. En términos de la TMP, la historia del teorema de Bayes básicamente termina ahí, en un teorema sencillo. Pero como es de uso común en la TMP hasta nuestros días, Bayes también quiso "interpretar" el teorema, es decir, explicarlo en términos de una posible interpretación de la teoría.

Pongamos un ejemplo: ¿Cuál es la probabilidad P de que mañana martes llueva en la ciudad de Guanajuato? La "lluvia de mañana martes en la ciudad de Guanajuato" es el evento A. Lo que sabemos del evento, la información que obtengamos, como los datos meteorológicos actuales y pasados (del pasado inmediato y mediato), la humedad, el clima regional, etcétera, se representan con B. La propuesta de Bayes es calcular cuál es la probabilidad de que llueva mañana martes dada la información de B. Eso es hacer estadística: tenemos unos datos, y dado que tenemos esos datos queremos calcular la probabilidad de algún evento. Con esto Bayes fundó una manera de hacer estadística que ahora llamamos estadística bayesiana.

Supongamos que los meteorólogos le asignan al evento A una probabilidad de 5%. Pero, ¿qué quiere decir eso? En otras áreas de estadística, en la estadística frecuentista, eso se interpreta en términos de muestras repetidas. Se dice: "Si tomas muchas muestras del evento A, el porcentaje tal de los casos caerá en tal o cual intervalo". Pero este problema, el de la lluvia, no podemos tomar la muestra porque sólo hay un "mañana martes" único e irrepetible. Sólo de ciertos aspectos podemos tomar datos y pensar que podemos repetir una muestra. El argumento frecuentista se aplica en esos casos, pero en éste, ¿qué quiere decir que la probabilidad de que llueva mañana es del 5%?

La teoría Bayesiana establece, ese número (la probabilidad) no representa una frecuencia, sino que es una medida de lo que conocemos nosotros, una medida de nuestra incertidumbre y de nuestra certeza. Si al evento "llueve mañana martes en la ciudad de Guanajuato" le asignamos una probabilidad de 5% dados los datos que tenemos, lo que significa es que "nosotros" tenemos más o menos la certeza de que no va a llover mañana, porque es muy poco probable. Entonces lo que mide la estadística bayesiana es la certidumbre y la incertidumbre, la seguridad de quien está esperando el evento, y no solamente "propiedades" del evento en sí. Esto significa también que la probabilidad es una opinión que se puede volver una apuesta. Es una opinión de un "agente" que puede ser una persona o, en nuestro ejemplo, el Sistema Meteorológico Nacional. Esto es, la probabilidad se refiere a un agente acerca de un evento, lo que el agente sabe acerca del evento.

La teoría bayesiana fue desarrollada en el siglo XX al axiomatizar sus principios con los trabajos de De Finetti, Ramsey y Savage, y posteriormente con su fundamentación filosófica, dentro de la epistemología moderna. La idea fundamental, sugerida originalmente por Keynes, es interpretar a la probabilidad como un "grado de conocimiento", no como una frecuencia. Esto fue formalizado al identificar los grados de incertidumbre como un sistema de apuestas, justo para un "agente" que establece la probabilidad a priori de A, las condiciones B dado que ocurre el evento A, y finalmente calcula la probabilidad P de que ocurra el evento A dada la información B.

La publicación del artículo de Bayes, a sus 250 años, nos da un ejemplo contundente de como una idea simple, pero auténtica y fundamentalmente diferente, puede ser seminal y cimentar el desarrollo de toda una disciplina y escuela de pensamiento, como lo es la estadística bayesiana moderna. Sin duda es uno de los artículos fundamentales de la estadística y un evento a celebrar en el Año Internacional de la Estadística.

Para conmemorar el Teorema de Bayes, el programa del 29th European Meeting of Statisticians, en Budapest, Hungría, del 20 al 25 de julio, tendrá una Plática Conmemorativa, impartida por Christian P. Robert, profesor de la Universidad de Paris-Dauphine, Francia. Ver el programa aquí.

Asimismo, el Dr. Garett Roberts de la Universidad de Oxford dará una conferencia conmemorativa sobre este acontecimiento en Guanajuato en una fecha por precisarse.
Una liga de interés:
http://bayesian.org/

Bibliografía:

El artículo original de Bayes: [1] T. Bayes (1763), "An Essay towards solving a Problem in the Doctrine of Chances", Philosophical Transactions of the Royal Society of London 53, 370?418. Se puede descargar en: http://www.stat.ucla.edu/history/essay.pdf

Un libro introductorio a nivel general:
McGrayne, Sharon Bertsch (2011), The theory that would not die: how Bayes' rule cracked the enigma code, hunted down Russian submarines, and emerged triumphant from two centuries of controversy, Sharon Bersch McGrayne, New Haven: Yale University Press

Un libro sobre la fundamentación epistemológica de la Teoría Bayesiana:
Howson y Urbach (1993), Scientific Reasoning: The Bayesian Approach, (Third Edition) Open Court.

Artículos en 2013:

La teoría bayesiana, otra forma de hacer estadística, Andrés Christen

A 250-year argument: Belief, behavior, and the bootstrap, Bull. Amer. Math. Soc. 50 (2013), 129-146, por Bradley Efron.

Comentarios y sugerencias: jac@cimat.mx

Regresar

Instituto Nacional de Estadística y Geografía (INEGI)