La estadística ha permitido la interpretación de datos numéricos correlacionados para el cálculo de probabilidades, siendo catalogada como una ciencia esencial dentro de la vida cotidiana. A través de la aplicación de métodos específicos, es que se pueden llevar a cabo cada uno de los procedimientos que permiten obtener los resultados según el caso de estudio. Es así, como el teorema de Bayes toma importancia dentro de la estadística.
Se considera como un método de revisión cuando se tiene información de un suceso, y se obtienen nuevos datos. Pasa a considerarse como el proceso inverso de la probabilidad total. Según este enunciado generalizado, se establece que trabaja con probabilidad condicional, que se conoce como la ocurrencia de un suceso condicionada por la ocurrencia de otros acontecimientos.
Fue el reverendo Thomas Bayes quien postuló este teorema, aunque no fue considerado como válido sino hasta después de su muerte. Sin embargo, muchos lo cuestionan, aunque si se aplican los procedimientos adecuadamente, los resultados son correctos.
Table of Contents
¿Qué es la probabilidad condicional o condicionada?
Para poder entender el teorema de Bayes, es necesario tener nociones acerca de lo qué es la probabilidad condicional, también conocida bajo el nombre de probabilidad condicionada. Esta se define como la probabilidad de ocurrencia de un evento A, conociendo que existe un evento B. UN hecho a tomar en cuenta, es que necesariamente no debe existir una relación causal o temporal para la ocurrencia de A y B. Ambos sucesos pueden presentarse en momentos distintos, y no existe un orden ni un vínculo al momento en que ocurren. Se expresa mediante la siguiente fórmula: P (A|B), obteniendo de la relación de los sucesos las siguientes fórmulas:
Para el primer caso, se debe tomar en cuenta que P (B) no puede ser igual a 0; mientras en el segundo, es aplicable para el cálculo de probabilidades de una intersección.
¿Qué es el teorema de Bayes?
El teorema de Bayes se ha considerado como un método válido que permite calcular probabilidades condicionales. El enunciado de este postulado establece que se puede calcular la probabilidad de que ocurra un suceso A sabiendo que existe un suceso B que condiciona al primero y viceversa. Por lo general, suele ser útil como método predictivo, causal y de diagnóstico, tomando en cuenta información que se conoce con anterioridad, y nueva información que se relaciona con los eventos.
Teniendo esto tres factores de estudio, se define que para casos de predicción, se busca responder interrogantes en torno a la probabilidad de un suceso, utilizando información acerca de la ocurrencia de otros sucesos predictores. En sentido causal, se busca calcular la probabilidad de que un evento sea consecuencia de otro. Mientras que para diagnóstico, se busca conocer la probabilidad de que ocurra alguno de los anteriores, teniendo como información previa las consecuencias de estos. Esto se puede resumir en dos premisas:
- En casos de estudio de predicción y causales se desconocen las consecuencias, pero la información que se maneja son las causas.
- En casos de estudio de diagnóstico se conocen las consecuencias, mientras que no se posee información de las causas.
Lo que hace que el teorema de Bayes sea un método efectivo de usar, es que puede ser aplicado para el cálculo de distintos tipos de probabilidades, y en cualquier ciencia. A pesar de considerarse un método efectivo, muchos estadistas cuestionan su validez; esto se debe a que consideran que solo es aplicable únicamente en casos donde se presentan eventos excluyentes y exhaustivos. También hacen énfasis en el hecho que al momento de llevar a cabo el procedimiento, solo se basan en condiciones subjetivas.
Fórmula del teorema de Bayes
Al tratarse de un teorema basado en la predicción a través de las probabilidades, se establece la siguiente fórmula tomando en cuenta las variables en estudio:
Donde:
- : se define como la probabilidad a priori del evento A
- : es la probabilidad condicional
- : se conoce como la probabilidad a posteriori del evento A
De esta manera, se resume que dentro de este postulado intervienen tres probabilidades para poder obtener el resultado. Pero si se expresa de manera algebraica, se obtiene la siguiente fórmula:
Historia del teorema de Bayes
El teorema de Bayes data del siglo XVIII. Fue un reverendo y matemático de origen británico, Thomas Bayes, quien expuso este postulado por primera vez. Sin embargo, para el momento, pareciera que este personaje no tenía mucho interés en que el mundo conociera su trabajo, ya que fue traspapelado por el mismo, y dejado en el olvido durante muchos años.
Bayes redactó un artículo titulado “Un ensayo hacia la solución de problemas en la disciplina del azar”, a través del cual se demostraba el uso de la estadística para eventos al azar. En el documento demostraba que utilizando la teoría de la probabilidad era muy difícil prever las consecuencias de suceso. De esta manera, logro establecer las premisas del teorema que permitían la aplicación de un nuevo método utilizando la probabilidad condicional. Pero el propio autor le dio poca importancia a su trabajo, y murió sin hacerlo público.
Para el año 1763, dos años después de la muerte de Thomas Bayes, un amigo decide hacer pública su investigación. Richard Price envió el documento a la Royal Society de Londres, acompañado de una carta. En esta explicaba que había encontrado un ensayo del reverendo, y que su contenido le parecía bastante importante. Consideraba que no se debía olvidar esta investigación. Además, se desconoce si él tuvo alguna participación dentro de la formulación del enunciado, ya que en la redacción explicaba brevemente de que se trataba el teorema. De manera resumida, definió el cálculo de probabilidades a través de supuestos en relación de un evento al azar tomando en cuenta bajo qué circunstancias se da.
La Royal Society consideró que se trataba de una información de gran valor, y la publicó en Philosophical Transactions ese mismo año. Sin embargo, nuevamente la teoría queda en el olvido, y nadie le da importancia.
Pero muchos años después, el trabajo de Bayes es retomado, y se destaca su utilidad para la resolución de problemas en distintos campos y ciencias. Durante el siglo XX fue el momento que tuvo su mayor auge, donde los expertos estadistas lograron trabajar y desglosar este enunciado. Para entonces, fue muy útil en la interpretación de mensajes que se enviaban durante la Segunda Guerra Mundial. También fue de gran ayuda para la decodificación de material genético. El trabajo de Thomas Bayes, aunque no recibió su debido conocimiento para el momento, ha logrado sobrevivir varios siglos desde su postulación.
Aplicaciones del teorema de Bayes
Una de las características más resaltantes del teorema de Bayes, es que puede ser aplicable en distintos campos, así como se puede trabajar con múltiples probabilidades. Esto permite que tenga diversas aplicaciones. En primer lugar, se destaca que puede ser útil para la modificación de las probabilidades subjetivas tomando en cuenta los resultados obtenidos, así como nueva información relacionada con el experimento realizado.
También se destaca la posibilidad de predecir eventos, tomando información previa comparándola con la nueva. Sirviéndose de esta definición, ha sido aplicable en la medicina, pudiendo determinar la probabilidad de que una persona llegue a padecer una enfermedad, siendo el caso más destacable el diagnóstico de cáncer. Para esto, se toman en cuenta condiciones e historial médico familiar que permita calcular la probabilidad de que un diagnóstico sea posible a futuro.
Y dentro del campo informático, también ha tenido gran reconocimiento. A través de algoritmos basados en el teorema de Bayes, es que se puede determinar que correos electrónicos entran dentro de la categoría spam, facilitando la experiencia de los usuarios dentro de estos servicios. Así mismo, este método es una herramienta ideal para la gestión de datos.
La correcta aplicación de esta teoría permite realizar estudios a pequeña escala, que pueden apoyarse en la información de otros, logrando obtener resultados más confiables. Igualmente, tras haber terminado de ejecutar un experimento en un periodo dado, permite recabar información para futuros sucesos. En este caso, se declara que el teorema puede ser aplicado para estudios de manera continua, pero cuando se manejan una cantidad elevada de datos, es necesario apoyarse en otros métodos para obtener resultados correctos.
Demostración del teorema de Bayes
Para demostrar que el teorema de Bayes es válido, se puede resolver un sencillo ejemplo: Se tienen tres cajas que contienen bolas negras y blancas, distribuidas de la siguiente manera:
- U1 = {3B, 1N}
- U2 = {2B, 2N}
- U3 = {1B, 4N}
Al elegir na caja al azar, se extrae una de las bolas, resultando ser blanca ¿Cuál es la caja con mayor probabilidad de ser elegida?
Primero se establece que la elección es al azar, expresándolo de la siguiente manera: P(U1) = P(U2) = P(U3) = 1/3
Se determinan las variables:
- B = {la bola extraída es blanca}
- P (B|U1) = 3/4
- P (B|U2) = 2/4
- P (B|U3) = 1/4
Aplicando la fórmula del teorema de Bayes en cada una de las opciones se tiene que:
- Primera caja:
- Segunda caja:
- Tercera caja:
Al comparar los resultados, se tiene que la primera caja es la que tiene mayor probabilidad de ser escogida para extraer la bola blanca.
¿Quieres seguir ampliando información sobre este teorema? puedes mirar aquí la fuente de este post para profundizar más en la explicación del teorema de Bayes.