Saltar al contenido principal
LibreTexts Español

1.1: Modelos de probabilidad

  • Page ID
    86159
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Modelos de Probabilidad

    La teoría de la probabilidad es un campo central de las matemáticas, ampliamente aplicable a situaciones científicas, tecnológicas y humanas que involucran incertidumbre. Las aplicaciones más obvias son situaciones, como los juegos de azar, en los que ensayos repetidos de esencialmente el mismo procedimiento conducen a resultados diferentes. Por ejemplo, cuando volteamos una moneda, enrollamos un dado, recogemos una carta de una baraja barajada o hacemos girar una pelota sobre una rueda de ruleta, el procedimiento es el mismo de una prueba a otra, pero el resultado (cabezas\((H)\) o colas\((T)\) en el caso de una moneda, de uno a seis en el caso de un dado, etc.) varía de un juicio a otro otro de una manera aparentemente aleatoria.

    Para el caso de voltear una moneda, el resultado del giro podría predecirse a partir de la posición inicial, la velocidad y el momento angular de la moneda y de la naturaleza de la superficie sobre la que aterriza. Así, en un sentido, un volteo de moneda es determinista más que aleatorio y lo mismo puede decirse de los otros ejemplos anteriores. Sin embargo, cuando no se especifican estas condiciones iniciales, como al jugar estos juegos, el resultado puede verse nuevamente como aleatorio en algún sentido intuitivo.

    Muchos experimentos científicos son similares a los juegos de azar en el sentido de que múltiples ensayos de aparentemente el mismo procedimiento conducen a resultados que varían de un ensayo a otro. En algunos casos, esta variación se debe a ligeras variaciones en el procedimiento experimental, en algunos se debe al ruido, y en algunos, como en la mecánica cuántica, generalmente se cree que la aleatoriedad es fundamental. Situaciones similares ocurren en muchos tipos de sistemas, especialmente aquellos en los que el ruido y los retardos aleatorios son importantes. Algunos de estos sistemas, en lugar de ser repeticiones de un procedimiento básico común, son sistemas que evolucionan con el tiempo sin dejar de contener una secuencia de ocurrencias aleatorias similares subyacentes.

    Esta noción intuitiva de aleatoriedad, como se describió anteriormente, es un tipo de incertidumbre muy especial. En lugar de implicar una falta de comprensión, implica un tipo de incertidumbre que puede conducir a modelos probabilísticos con resultados precisos. Como en cualquier campo científico, los modelos pueden o no corresponder muy bien a la realidad, pero cuando sí corresponden a la realidad, existe la sensación de que la situación se entiende completamente, sin dejar de ser aleatoria.

    Por ejemplo, todos sentimos que entendemos voltear una moneda o rodar un dado, pero aún así aceptamos aleatoriedad en cada resultado. La teoría de la probabilidad se desarrolló particularmente para dar un entendimiento preciso y cuantitativo a este tipo de situaciones. El resto de esta sección introduce esta relación entre la visión precisa de la teoría de la probabilidad y la visión intuitiva utilizada en las aplicaciones y el lenguaje cotidiano.

    Después de esta introducción, las siguientes secciones revisan la teoría de la probabilidad como disciplina matemática, con especial énfasis en las leyes de los grandes números. En la sección final de este capítulo, utilizamos la teoría y las leyes de los grandes números para obtener una comprensión más completa de la relación entre la teoría y el mundo real. 1

    La teoría de la probabilidad, como disciplina matemática, comenzó a evolucionar en el siglo XVII e inicialmente se centró en los juegos de azar. La importancia de la teoría creció rápidamente, particularmente en el siglo XX, y ahora juega un papel central en la evaluación de riesgos, la estadística, las redes de datos, la investigación de operaciones, la teoría de la información, la teoría del control, la informática teórica, la teoría cuántica, la teoría de juegos, la neurofisiología y muchos otros campos.

    El concepto central en la teoría de la probabilidad es el de un modelo de probabilidad. Dada la amplitud de la teoría, tanto en matemáticas como en aplicaciones, la simplicidad de los modelos de probabilidad es sorprendente. El primer componente de un modelo de probabilidad es un espacio muestral, que es un conjunto cuyos elementos se denominan resultados o puntos de muestra. Los modelos de probabilidad son particularmente simples en el caso especial donde el espacio muestral es finito, 2 y consideramos solo este caso en el resto de esta sección. El segundo componente de un modelo de probabilidad es una clase de eventos, que puede considerarse por ahora simplemente como la clase de todos los subconjuntos del espacio muestral. El tercer componente es una medida de probabilidad, que puede considerarse por ahora como la asignación de un número no negativo a cada resultado, con la restricción de que estos números deben sumarse a uno sobre el espacio muestral. La probabilidad de un evento es la suma de las probabilidades de los resultados que comprenden ese evento.

    Estos modelos de probabilidad juegan un doble papel. En la primera, los muchos resultados conocidos sobre diversas clases de modelos, y las muchas relaciones conocidas entre modelos, constituyen la esencia de la teoría de la probabilidad. Así, a menudo se estudia un modelo no por ninguna relación con el mundo real, sino simplemente porque el modelo proporciona un bloque de construcción o ejemplo útil para la teoría y por lo tanto útil en última instancia para otros modelos. En el otro rol, cuando la teoría de probabilidad se aplica a algún juego, experimento o alguna otra situación que involucre aleatoriedad, se utiliza un modelo de probabilidad para representar el experimento (en lo que sigue, nos referimos a todas estas situaciones aleatorias como experimentos).

    Por ejemplo, el modelo de probabilidad estándar para rodar un dado utiliza {1, 2, 3, 4, 5, 6} como espacio muestral, teniendo cada resultado posible probabilidad 1/6. Un resultado impar, es decir, el subconjunto {1, 3, 5}, es un ejemplo de un evento en este espacio de muestra, y este evento tiene probabilidad. La correspondencia entre el modelo y el experimento real parece sencilla aquí. Ambos tienen el mismo conjunto de resultados y, dada la simetría entre caras del dado, la elección de probabilidades iguales parece natural. En una inspección más cercana, existe la siguiente diferencia importante entre el modelo y el laminado real de una matriz.

    El modelo anterior corresponde a un solo rollo de un dado, con una probabilidad definida para cada resultado posible. En un experimento del mundo real donde se enrolla un solo dado, se produce un resultado\(k\) de 1 a 6, pero no hay probabilidad observable de\(k\).

    Nuestra noción intuitiva de rodar dados, sin embargo, implica un experimento con rollos repetidos de un dado o rollos de dados diferentes. Con\(n\) rollos en conjunto, hay\(6^{n}\) posibles resultados, uno por cada posible\(n\) -tupla de resultados individuales de dados. El modelo de probabilidad estándar para este experimento de rollo repetido es asignar probabilidad\(6^{-n}\) a cada posible\(n\) -tupla. En este experimento\(n\) -repetición, la frecuencia relativa real de\(k, i . e\)., la fracción de rollos para la que es el resultado\(k\), se puede comparar con el valor de muestra de la frecuencia relativa de\(k\) en el modelo para rollos repetidos. El valor muestral de la frecuencia relativa de\(k\) en este modelo\(n\) de repetición se asemeja a la probabilidad de\(k\) en el experimento de un solo rollo de una manera que se explicará más adelante. Esta relación a través de frecuencias relativas en un experimento repetido ayuda a superar la naturaleza no observable de las probabilidades en el mundo real.

    Espacio muestral de un mundo de probabilidad

    Un resultado o punto de muestra en un modelo de probabilidad corresponde a un resultado completo (con todos los detalles especificados) del experimento que se está modelando. Por ejemplo, un juego de cartas suele ser modelado apropiadamente por la disposición de cartas dentro de una baraja barajada de 52 cartas, ¡dando lugar así a un conjunto de 52! resultados (increíblemente detallados, pero trivialmente simples en estructura), a pesar de que todo el mazo podría no jugarse en una prueba del juego. Una mano de póquer con 4 ases es un evento más que un resultado en este modelo, ya que muchos arreglos de las cartas pueden dar lugar a 4 ases en una mano determinada. Los posibles resultados en un modelo de probabilidad (y en el experimento que se modela) son mutuamente excluyentes y constituyen colectivamente todo el espacio muestral (espacio de posibles resultados). Un resultado a menudo se llama un resultado de grano más fino del modelo en el sentido de que un resultado no\(\omega\) contiene subconjuntos que no sean el conjunto vacío\(\phi\) y el subconjunto singleton\(\{\omega\}\). Por lo tanto, los eventos suelen dar solo información parcial sobre el resultado del experimento, mientras que un resultado especifica completamente el resultado.

    Al elegir el espacio muestral para un modelo de probabilidad de un experimento, a menudo omitimos detalles que parecen irrelevantes para el propósito en cuestión. Así, al modelar el conjunto de resultados para un lanzamiento de moneda como\(\{H, T\}\), ignoramos el tipo de moneda, la velocidad inicial y el momento angular del lanzamiento, etc. también omitimos la rara posibilidad de que la moneda llegue a descansar en su borde. A veces, a la inversa, el espacio muestral se amplía más allá de lo relevante en aras de la simplicidad estructural. Un ejemplo es el uso anterior de una baraja barajada de 52 cartas.

    La elección del espacio muestral en un modelo de probabilidad es similar a la elección de un modelo matemático en cualquier rama de la ciencia. Es decir, se simplifica la situación física al eliminar detalles de poca relevancia aparente. A menudo se hace esto de manera iterativa, utilizando un modelo muy simple para adquirir comprensión inicial, y luego elegir sucesivamente modelos más detallados basados en la comprensión de modelos anteriores.

    La teoría matemática de la probabilidad ve el espacio muestral simplemente como un conjunto abstracto de elementos, y desde un punto de vista estrictamente matemático, la idea de hacer un experimento y obtener un resultado es una distracción. Para visualizar la correspondencia entre la teoría y las aplicaciones, sin embargo, es mejor ver el conjunto abstracto de elementos como el conjunto de posibles resultados de un experimento idealizado en el que, cuando se realiza el experimento idealizado, se produce uno y solo uno de esos resultados. Las dos vistas son matemáticamente idénticas, pero será útil referirse a la primera vista como un modelo de probabilidad y la segunda como un experimento idealizado. En textos de probabilidad aplicada y artículos técnicos, estos experimentos idealizados, más que las situaciones del mundo real, suelen ser el tema principal de discusión. 3

    Asignación de probabilidades para espacios de muestra finitos

    La palabra probabilidad es ampliamente utilizada en el lenguaje cotidiano, y la mayoría de nosotros adjuntamos varios significados intuitivos 4 a la palabra. Por ejemplo, todos estarían de acuerdo en que a algo prácticamente imposible se le debería asignar una probabilidad cercana a 0 y a algo prácticamente seguro se le debería asignar una probabilidad cercana a 1. Para estos casos especiales, esto proporciona una buena justificación para elegir probabilidades. La relación entre virtualmente y close to no están claras por el momento, pero si hay algún proceso limitante implícito, todos coincidiríamos en que, en el límite, la certeza y la imposibilidad corresponden a las probabilidades 1 y 0 respectivamente.

    Entre la imposibilidad virtual y la certeza, si un resultado parece estar más cerca de la certeza que otro, su probabilidad debería ser correspondientemente mayor. Esta noción intuitiva es imprecisa y altamente subjetiva; proporciona poca justificación para elegir probabilidades numéricas para diferentes resultados y, peor aún, poca justificación que justifique que los modelos de probabilidad tengan alguna relación precisa con situaciones del mundo real.

    La simetría a menudo puede proporcionar una mejor justificación para elegir probabilidades. Por ejemplo, la simetría entre\(H\) y\(T\) para una moneda, o la simetría entre las seis caras de un dado, motiva la asignación de probabilidades iguales,\(1 / 2\) cada una para\(H\) y\(T\) y\(1 / 6\) cada una para las seis caras de un dado. Esto es razonable y extremadamente útil, pero no hay una razón completamente convincente para elegir probabilidades basadas en la simetría.

    Otro enfoque es realizar el experimento muchas veces y elegir la probabilidad de cada resultado como la frecuencia relativa de ese resultado (es decir, el número de ocurrencias de ese resultado dividido por el número total de ensayos). La experiencia muestra que la frecuencia relativa de un resultado a menudo se acerca a un valor limitante con un número creciente de ensayos. Asociar la probabilidad de un resultado con esa frecuencia relativa limitante es ciertamente cercano a nuestra intuición y también parece proporcionar un criterio comprobable entre el modelo y el mundo real. Este criterio se discute en las Secciones 1.6.1 y 1.6.2 y proporciona una manera muy concreta de usar probabilidades, ya que sugiere que la aleatoriedad en un solo ensayo tiende a desaparecer en el agregado de muchos ensayos. Otros enfoques para elegir modelos de probabilidad se discutirán más adelante.


    Referencia

    1 Sería atractivo mostrar cómo evolucionó la teoría de probabilidad a partir de situaciones aleatorias del mundo real, pero la teoría de la probabilidad, como la mayoría de las teorías matemáticas, ha evolucionado a partir de interacciones complejas entre desarrollos teóricos y modelos inicialmente sobresimplificados de situaciones reales. Los éxitos y fallas de tales modelos conducen a refinamientos de los modelos y la teoría, que a su vez sugieren aplicaciones a campos totalmente diferentes.

    2 Surgen una serie de cuestiones matemáticas con espacios muestrales infinitos, como se discute en la siguiente sección.

    3 Esto no pretende ser crítica, ya que veremos que hay buenas razones para concentrarse inicialmente en experimentos tan idealizados. Sin embargo, los lectores siempre deben ser conscientes de que los errores de modelado son la principal causa de resultados engañosos en las aplicaciones de probabilidad y, por lo tanto, el modelado debe considerarse seriamente antes de usar los resultados.

    4 Es popular tratar de definir probabilidad por verosimilitud, pero esto no ayuda ya que las palabras son esencialmente sinónimos.


    This page titled 1.1: Modelos de probabilidad is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Robert Gallager (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.