Saltar al contenido principal
LibreTexts Español

1.6: Relación de los modelos de probabilidad con el mundo real

  • Page ID
    86170
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Siempre que ingenieros o científicos experimentados y competentes construyan un modelo de probabilidad para representar aspectos de algún sistema que existe o se está diseñando para alguna aplicación, deben adquirir un conocimiento profundo del sistema y sus circunstancias circundantes, y simultáneamente considerar diversos tipos de modelos de probabilidad utilizados en el análisis probabilístico de sistemas iguales o similares. Por lo general, los modelos de probabilidad muy simples ayudan a comprender el sistema del mundo real, y el conocimiento sobre el sistema del mundo real ayuda a comprender qué aspectos del sistema están bien modelados por un modelo de probabilidad dado. Para un texto como este, hay un espacio insuciente para entender los aspectos del mundo real de cada sistema que puedan ser de interés. Debemos utilizar el lenguaje de varios sistemas canónicos del mundo real para la motivación y la perspicacia al estudiar modelos de probabilidad para diversas clases de sistemas, pero dichos modelos necesariamente deben elegirse más por su tutorial que por su valor práctico.

    Existe el peligro, entonces, de que los lectores salgan con la impresión de que el análisis es más desafiante e importante que modelar. Por el contrario, para trabajar en sistemas del mundo real, el modelado es casi siempre más difícil, más desafiante y más importante que el análisis. El objetivo aquí es proporcionar el conocimiento y la visión necesarios sobre los modelos probabilísticos para que el lector pueda luego combinar esto con una comprensión profunda de áreas de aplicación reales particulares. Esto dará como resultado un uso interactivo útil de modelos, análisis y experimentación.

    En esta sección, nuestro propósito no es aprender a modelar problemas del mundo real, ya que, como se dijo anteriormente, esto requiere un conocimiento profundo y especializado de cualquier área de aplicación que sea de interés. Más bien es entender el siguiente problema conceptual que se planteó en la Sección 1.1. Supongamos que tenemos un modelo de probabilidad de algún experimento del mundo real que involucra aleatoriedad en el sentido expresado allí. Cuando se realiza el experimento del mundo real que se está modelando, hay un resultado, que presumiblemente es uno de los resultados del modelo de probabilidad, pero no hay probabilidad observable.

    Parece intuitivamente natural, para experimentos que pueden llevarse a cabo repetidamente bajo esencialmente las mismas condiciones, asociar la probabilidad de un evento dado con la frecuencia relativa de ese evento a lo largo de muchas repeticiones. Ahora tenemos los antecedentes para entender este enfoque. Primero miramos las frecuencias relativas dentro del modelo de probabilidad, y luego dentro del mundo real.

    Frecuencias relativas en un modelo de probabilidad

    Hemos visto que para cualquier modelo de probabilidad existe un modelo de probabilidad extendida para experimentos idealizados\(n\) IID del modelo original. Para cualquier evento\(A\) en el modelo original, la función indicadora\(\mathbb{I}_{A}\) es una variable aleatoria, y la frecuencia relativa de experimentos\(A\) sobre\(n\) IID es el promedio muestral de\(n\) IID rv cada uno con la distribución de\(\mathbb{I}_{A}\). De la débil ley de los grandes números, esta frecuencia relativa converge en probabilidad a\(\mathrm{E}\left[\mathbb{I}_{A}\right]=\mathrm{Pr}\{A\}\). Al tomar el límite\(n \rightarrow \infty\), la fuerte ley de grandes números dice que la frecuencia relativa de\(A\) converge con probabilidad 1 a\(\operatorname{Pr}\{A\}\).

    En inglés sencillo, esto dice que para grandes\(n\), la frecuencia relativa de un evento (en el modelo\(n\) -repetición IID) es esencialmente la misma que la probabilidad de ese evento. La palabra esencialmente es llevar una gran cantidad de equipaje oculto. Para la ley débil, para cualquiera\(\epsilon, \delta>0\) la frecuencia relativa está dentro\(\epsilon\) de algunos de\(\operatorname{Pr}\{A\}\) con un leve de confianza\(1-\delta\) siempre que\(n\) sea suciamente grande. Para la ley fuerte, los\(\epsilon\) y\(\delta\) se evitan, pero sólo mirando directamente al límite\(n \rightarrow \infty\). Sin embargo, a pesar del equipaje oculto, la frecuencia relativa y la probabilidad están relacionadas como se indica.

    Frecuencias relativas en el mundo real

    Al tratar de resolver si y cuando las leyes de los grandes números tienen mucho que ver con los experimentos del mundo real, debemos ignorar los detalles matemáticos por el momento y estar de acuerdo en que para n grande, la frecuencia relativa de un evento\(A\) sobre los ensayos\(n\) IID de un experimento idealizado es esencialmente \(\operatorname{Pr}\{A\}\). Ciertamente podemos visualizar un experimento del mundo real que tiene el mismo conjunto de posibles resultados que el experimento idealizado y podemos visualizar evaluando la frecuencia relativa de\(A\)\(n\) sobrerepeticiones con grandes\(n\). Si esa frecuencia relativa del mundo real es esencialmente igual a\(\operatorname{Pr}\{A\}\), y esto es cierto para los diversos eventos\(A\) de mayor interés, entonces es razonable plantear la hipótesis de que el experimento idealizado es un modelo razonable para el experimento del mundo real, al menos en la medida en que aquellos eventos dados de los intereses se refieren.

    Un problema con esta comparación de frecuencias relativas es que hemos especificado cuidadosamente un modelo para repeticiones\(n\) IID del experimento idealizado, pero no hemos dicho nada sobre cómo se repiten los experimentos del mundo real. Los experimentos idealizados del IID especifican que la probabilidad condicional de A en un ensayo es la misma sin importar cuáles sean los resultados de los otros ensayos. Intuitivamente, trataríamos entonces de aislar las n pruebas del mundo real para que no se afecten entre sí, pero esto es un poco vago. Los siguientes ejemplos ayudan a explicar este problema y varios otros en la comparación de frecuencias relativas idealizadas y del mundo real.

    Ejemplo 1.6.1. Lanzamiento de monedas: Tirar monedas es ampliamente utilizado como una forma de elegir al primer jugador en varios juegos, y también a veces se usa como una forma primitiva de juego. Su importancia, sin embargo, y la razón de su uso frecuente, es su simplicidad. Al tirar una moneda, argumentaríamos desde la simetría entre las dos caras de la moneda que cada una debería ser igualmente probable (ya que cualquier procedimiento para evaluar la probabilidad de una cara debería aplicarse igualmente a la otra). Así, dado que\(H\) y\(T\) son los únicos resultados (la remota posibilidad de que la moneda se equilibre en su borde se omite del modelo), el modelo razonable y universalmente aceptado para lanzar monedas es ese\(H\) y\(T\) cada uno tiene probabilidad 1/2.

    Por otro lado, las dos caras de una moneda están gofradas de diferentes maneras, de manera que la masa no se distribuye uniformemente. También los dos lados no se comportan de la misma manera al rebotar en una superficie. Cada denominación de cada moneda se comporta de manera ligeramente diferente a este respecto. Así, no sólo las monedas violan la simetría de pequeñas maneras, sino que diferentes monedas la violan de diferentes maneras.

    ¿Cómo probamos si este efecto es significativo? Si asumimos por el momento que los sucesivos tirados de la moneda están bien modelados por el experimento idealizado de los ensayos\(n\) IID, podemos encontrar esencialmente la probabilidad de\(H\) para una moneda en particular como la frecuencia relativa de\(H\) en un número suciamente grande de tiradas independientes de esa moneda. Esto nos da frecuencias relativas ligeramente diferentes para diferentes monedas, y por lo tanto modelos de probabilidad ligeramente diferentes para diferentes monedas.

    El supuesto de lanzamientos independientes también es cuestionable. Considere construir una máquina cuidadosamente diseñada para lanzar monedas y usarla en un ambiente libre de vibraciones. Se inserta una moneda estándar en la máquina de la misma manera para cada lanzamiento y contamos el número de cabezas y colas. Dado que la máquina esencialmente ha eliminado la aleatoriedad, esperaríamos que todas las monedas, o casi todas las monedas, salgan de la misma manera: cuanto más precisa sea la máquina, menos independientes serán los resultados. Al insertar la moneda original de forma aleatoria, un solo ensayo podría tener resultados equiprobables, pero los lanzados sucesivos ciertamente no son independientes. Los sucesivos juicios estarían más cerca de ser independientes si los lanzamientos fueran realizados por un individuo ligeramente ebrio que arrojó las monedas en alto al aire.

    El punto de este ejemplo es que hay muchas monedas diferentes y muchas formas de lanzarlas, y la idea de que un modelo se ajuste a todos es razonable bajo algunas condiciones y no bajo otras. Sin embargo, en lugar de retroceder al cómodo mundo de la teoría, tenga en cuenta que ahora podemos encontrar la frecuencia relativa de cabezas para cualquier moneda dada y esencialmente para cualquier forma dada de arrojar esa moneda. 38

    Ejemplo 1.6.2. Datos binarios: Considere los datos binarios transmitidos a través de un enlace de comunicación o almacenados en una instalación de datos. Los datos suelen ser una mezcla de voz codificada, video, gráficos, texto, etc., con series relativamente largas de cada una, intercaladas con diversos protocolos para recuperar los datos no binarios originales.

    El modelo más simple (y más común) para esto es asumir que cada dígito binario es 0 o 1 con igual probabilidad y que los dígitos sucesivos son estadísticamente independientes. Esto es lo mismo que el modelo para el lanzamiento de monedas después de la trivial modificación de la conversión\(\{H, T\}\) en\(\{0,1\}\). Este también es un modelo bastante apropiado para diseñar una instalación de comunicación o almacenamiento, ya que todas las\(n\) -tuplas son entonces equiprobables (en el modelo) para cada una\(n\), y por lo tanto las instalaciones no necesitan depender de ninguna característica especial de los datos. Por otro lado, si se quiere comprimir los datos, reduciendo el número requerido de bits transmitidos o almacenados por bit entrante, entonces se necesita un modelo más elaborado.

    Desarrollar tal modelo mejorado requeriría averiguar más sobre de dónde provienen los datos; una aplicación ingenua de calcular frecuencias relativas de\(n\) -tuplas probablemente no sería la mejor opción. Por otro lado, existen esquemas de compresión de datos bien conocidos que en esencia rastrean las dependencias en los datos y las utilizan para la compresión de manera coordinada. Estos esquemas se denominan esquemas universales de compresión de datos ya que no se basan en un modelo de probabilidad. Al mismo tiempo, se analizan mejor observando cómo se desempeñan para diversos modelos de probabilidad idealizados.

    El punto de este ejemplo es que la elección de modelos de probabilidad a menudo depende en gran medida de cómo se va a utilizar el modelo. Los modelos más complejos que los dígitos binarios IID suelen basarse en lo que se sabe sobre los procesos de entrada. Medir frecuencias relativas y asociarlas con probabilidades es la conexión conceptual subyacente básica entre el mundo real y los modelos, pero en la práctica esta es esencialmente la relación de último recurso. Para la mayoría de las aplicaciones que estudiaremos, hay una larga historia de modelado para construir, con experimentos según sea necesario.

    Ejemplo 1.6.3. Fábula: En el año 2008, la estructura financiera de Estados Unidos fracasó y la economía mundial se puso de rodillas. Mucho se ha escrito sobre el papel de la codicia en Wall Street y la incompetencia en Washington. Otro aspecto del colapso, sin embargo, fue una fe generalizada en los modelos estocásticos para limitar el riesgo. Estos modelos animaron a las personas a realizar inversiones que resultaron ser mucho más riesgosas de lo que predecían los modelos. Estos modelos fueron creados por algunos de los doctorados más brillantes de las mejores universidades, pero fracasaron miserablemente porque modelaron muy bien los eventos cotidianos, pero modelaron mal los raros eventos y la interconexión de eventos. Fallaron mal al no entender su aplicación, y en particular, al tratar de extrapolar el comportamiento típico cuando su objetivo principal era proteger contra situaciones altamente atípicas. La moraleja de la fábula es que el análisis brillante no ayuda cuando el modelado es pobre; como dicen los ingenieros informáticos, “basura adentro, basura afuera”.

    Los ejemplos anteriores muestran que los problemas de modelar un experimento del mundo real suelen estar conectados con la cuestión de crear un modelo para un conjunto de experimentos que no son exactamente los mismos y no necesariamente corresponden a la noción de repeticiones independientes dentro del modelo. En otras palabras, la cuestión no es sólo si el modelo de probabilidad es razonable para un solo experimento, sino también si el modelo de repetición IID es apropiado para múltiples copias del experimento del mundo real.

    Al menos hemos visto, sin embargo, que si un experimento del mundo real se puede realizar muchas veces con un aislamiento físico entre actuaciones que está bien modelado por el modelo de repetición IID, entonces las frecuencias relativas de eventos en el experimento del mundo real corresponden a frecuencias relativas en el IID idealizado modelo de repetición, que corresponden a probabilidades en el modelo original. Es decir, en circunstancias apropiadas, las probabilidades en un modelo se vuelven esencialmente observables a lo largo de muchas repeticiones.

    Veremos más adelante que nuestro énfasis en las repeticiones de IID se hizo por simplicidad. Existen otros modelos para repeticiones de un modelo básico, como los modelos de Markov, que estudiamos posteriormente. Estos también conducirán a frecuencias relativas que se acerquen a las probabilidades dentro del modelo de repetición. Así, para experimentos repetidos del mundo real que están bien modelados por estos modelos de repetición, las frecuencias relativas del mundo real se aproximan a las probabilidades en el modelo.

    Independencia estadística de los experimentos del mundo real

    Hemos estado discutiendo el uso de frecuencias relativas de un evento\(A\) en un experimento repetido del mundo real para probar\(\operatorname{Pr}\{A\}\) en un modelo de probabilidad de ese experimento. Esto se puede hacer esencialmente con éxito si los ensayos repetidos se corresponden con los ensayos IID en el experimento idealizado. Sin embargo, la afirmación sobre los ensayos IID en el experimento idealizado es un estado sobre las probabilidades en el modelo\(n\) de ensayo extendido. Así, así como probamos\(\operatorname{Pr}\{A\}\) mediante ensayos repetidos del mundo real de un solo experimento, deberíamos ser capaces de probar\(\operatorname{Pr}\left\{A_{1}, \ldots, A_{n}\right\}\) en el modelo de\(n\) repetición por un número mucho mayor de repeticiones de\(\n\) -tuplas en el mundo real en lugar de ensayos individuales.

    Para ser más específicos, elija dos enteros grandes,\(m\) y\(n\), y realice los\(m n\) tiempos de experimento del mundo real subyacentes. Dividir los ensayos mn en\(m\) series de\(n\) ensayos cada uno. Para cualquier\(n\) -tuplas dadas\(A_{1}, \ldots, A_{n}\) de eventos sucesivos, encuentre la frecuencia relativa (sobre\(m\) ensayos de\(n\) tuplas) del evento n-tuplas\(A_{1}, \ldots, A_{n}\). Esto puede entonces ser utilizado esencialmente para probar la probabilidad\(\operatorname{Pr}\left\{A_{1}, \ldots, A_{n}\right\}\) en el modelo para ensayos\(n\) IID. También se pueden probar las probabilidades de eventos individuales, por lo que se puede probar la condición de independencia.

    El lector observador notará que hay una suposición tácita por encima de que las\(n\) tuplas sucesivas pueden modelarse como independientes, por lo que parece que simplemente estamos reemplazando un gran problema por otro mayor. Esto no es del todo cierto, ya que si los ensayos son dependientes con algún modelo de probabilidad dado para ensayos dependientes, entonces esta prueba de independencia rechazará esencialmente la hipótesis de independencia por lo suficientemente grande\(n\). Es decir, no podemos verificar completamente la exactitud de una hipótesis de independencia para el modelo n-trial, aunque en principio podríamos finalmente falsificarla si es falsa.

    Elegir modelos para experimentos del mundo real es principalmente un tema de estadística, y no lo perseguiremos más, excepto por breves discusiones al tratar áreas de aplicación particulares. El propósito aquí ha sido tratar un tema fundamental en la teoría de la probabilidad. Como se dijo anteriormente, las probabilidades no son observables, existen en la teoría pero no se pueden medir directamente en experimentos del mundo real. Hemos demostrado que las probabilidades se vuelven esencialmente observables en el mundo real a través de frecuencias relativas en ensayos repetidos.

    Limitaciones de frecuencias relativas

    La mayoría de las aplicaciones del mundo real que son modeladas por modelos de probabilidad tienen un espacio de muestreo tan grande que no es práctico realizar suficientes pruebas para elegir probabilidades de frecuencias relativas. Incluso una baraja barajada de 52 cartas requeriría muchas más que\(52 ! \approx 8\times10^{67}\) pruebas para que la mayoría de los resultados aparezcan incluso una vez. Por lo tanto, las frecuencias relativas pueden usarse para probar la probabilidad de eventos individuales dados de importancia, pero generalmente no son prácticas para elegir todo el modelo y aún más poco prácticas para elegir un modelo para ensayos repetidos.

    Dado que las frecuencias relativas nos dan una interpretación concreta de lo que significa probabilidad, sin embargo, ahora podemos confiar en otros enfoques, como la simetría, para modelar. De la simetría, por ejemplo, ¡está claro que todos los 52! los posibles arreglos de una baraja de cartas deben ser equiprobables después de barajar. Esto lleva, por ejemplo, a la capacidad de calcular probabilidades de diferentes manos de póquer, etc., que son ejercicios tan populares en las clases de probabilidad elemental.

    Otro procedimiento de modelado valioso es el de construir un modelo de probabilidad donde los posibles resultados se eligen independientemente\(n\) -tuplas de resultados en un modelo más simple. De manera más general, la mayoría de los procesos aleatorios que se estudiarán en este texto se definen como diversas formas de combinar experimentos idealizados más simples.

    Lo que realmente está sucediendo a medida que miramos modelar sistemas cada vez más sofisticados y estudiar modelos cada vez más sofisticados es que estamos desarrollando resultados matemáticos para modelos idealizados simples y relacionando esos resultados con resultados del mundo real (como relacionar ensayos idealizados estadísticamente independientes a ensayos independientes del mundo real). La asociación de frecuencias relativas a probabilidades forma la base de esto, pero generalmente se ejerce sólo en los casos más simples.

    La forma en que se seleccionan modelos de probabilidad de experimentos del mundo real en la práctica es utilizar el conocimiento y la experiencia científica, además de experimentos simples, para elegir un modelo razonable. Los resultados del modelo (como la ley de los grandes números) se utilizan entonces tanto para hipotetizar resultados sobre el experimento del mundo real como para rechazar provisionalmente el modelo cuando otros experimentos muestran que es altamente cuestionable. Aunque los resultados sobre el modelo son matemáticamente precisos, los resultados correspondientes sobre el mundo real son, en el mejor de los casos, hipótesis perspicaces cuyos aspectos más importantes deben ser validados en la práctica.

    Probabilidad subjetiva

    Existen muchas aplicaciones útiles de la teoría de la probabilidad a situaciones distintas de los ensayos repetidos de un experimento dado. Al diseñar un nuevo sistema en el que se plantea la hipótesis de aleatoriedad (del tipo utilizado en los modelos de probabilidad), uno quisiera analizar el sistema antes de construirlo realmente. En tales casos, el sistema del mundo real no existe, por lo que se deben utilizar medios indirectos para construir un modelo de probabilidad. A menudo algunas fuentes de aleatoriedad, como el ruido, se pueden modelar en ausencia del sistema. A menudo, se pueden usar sistemas similares o simulación para ayudar a comprender el sistema y ayudar a formular modelos de probabilidad apropiados. Sin embargo, la elección de las probabilidades es hasta cierto punto subjetiva.

    Otro tipo de situación, de la que un ejemplo canónico es el análisis de riesgos para reactores nucleares, aborda un gran número de resultados muy improbables, cada uno de naturaleza catastrófica. Claramente, la experimentación no puede utilizarse para establecer probabilidades, y no está claro que las probabilidades tengan algún significado real aquí. Sin embargo, puede ser útil elegir un modelo de probabilidad sobre la base de creencias subjetivas que puedan servir de base para razonar sobre el problema. Cuando se maneja bien, esto puede al menos dejar claros los sesgos subjetivos, conduciendo a un enfoque más racional del problema. Cuando se maneja mal, puede ocultar el carácter arbitrario de decisiones posiblemente malas.

    No discutiremos los diversos métodos, a menudo ingeniosos, para elegir probabilidades subjetivas. La razón es que las creencias subjetivas deben basarse en una exposición intensiva y a largo plazo al problema particular involucrado; discutir estos problemas en términos de probabilidad abstracta debilita este vínculo. Nos centraremos en cambio en el análisis de modelos idealizados. Estos se pueden usar para proporcionar información para modelos subjetivos, y resultados más refinados y precisos para modelos objetivos.


    38 No estamos sugiriendo que distinguir diferentes monedas en aras del lanzamiento de monedas sea un problema importante. Más bien, estamos ilustrando que incluso en una situación tan simple, el supuesto de experimentos preparados idénticamente es cuestionable y el supuesto de experimentos independientes es cuestionable. La extensión a\(n\) repeticiones de experimentos IID no es necesariamente un buen modelo para lanzar monedas. Es decir, hay que cuestionar tanto el modelo original como el modelo\(n\) -repetición.


    This page titled 1.6: Relación de los modelos de probabilidad con el mundo real is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Robert Gallager (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.