1.1: Probabilidad
- Page ID
- 150985
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Introducción
Los modelos y técnicas de probabilidad impregnan muchas áreas importantes de la vida moderna. Una variedad de tipos de procesos aleatorios, modelos y técnicas de confiabilidad y consideraciones estadísticas en el trabajo experimental juegan un papel importante en la ingeniería y las ciencias físicas. Las soluciones de los problemas de decisión gerencial utilizan como ayuda el análisis de decisiones, la teoría de la línea de espera, la teoría de inventarios, las series de tiempo, el análisis de costos bajo incertidumbre, todos ellos arraigados Los métodos de análisis estadístico emplean el análisis de probabilidad como disciplina subyacente.
Los desarrollos modernos de probabilidad son matemáticamente cada vez más sofisticados. Para utilizarlos, el practicante necesita una base conceptual sólida que, afortunadamente, pueda alcanzarse a un nivel moderado de sofisticación matemática. Es necesario desarrollar una idea de la estructura del modelo matemático subyacente, del papel de diversos tipos de supuestos y de las principales estrategias de formulación y solución de problemas.
La probabilidad tiene raíces que se extienden muy atrás en la antigüedad. La noción de “azar” jugó un papel central en la práctica ubicua del juego. Pero los actos fortuitos a menudo estaban relacionados con la magia o la religión. Por ejemplo, existen numerosos casos en la Biblia hebrea en los que las decisiones se tomaron “por sorteo” o algún otro mecanismo casual, entendiendo que el resultado fue determinado por la voluntad de Dios. En el Nuevo Testamento, el libro de Hechos describe la selección de un sucesor de Judas Iscariote como uno de “los Doce”. Se plantearon dos nombres, José Barsabbas y Matías. El grupo oró, después dibujó suertes, que cayeron sobre Matías.
Los primeros desarrollos de la probabilidad como disciplina matemática, liberándola de sus connotaciones religiosas y mágicas, llegaron como respuesta a preguntas sobre juegos de azar jugados repetidamente. La formulación matemática debe mucho a la obra de Pierre de Fermat y Blaise Pascal en el siglo XVII. El juego se describe en términos de una prueba bien definida (una jugada); el resultado de cualquier prueba es uno de un conjunto específico de resultados distinguibles. Si bien el resultado de cualquier juego no es predecible, se observan ciertas “regularidades estadísticas” de los resultados. Los posibles resultados se describen en formas que hacen que cada resultado parezca igualmente probable. Si hay N tales posibles resultados “igualmente probables”, a cada uno se le asigna una probabilidad 1/ N.
Los desarrolladores de probabilidad matemática también tomaron señales de los primeros trabajos sobre el análisis de datos estadísticos. El trabajo pionero de John Graunt en el siglo XVII estuvo dirigido al estudio de “estadísticas vitales”, como registros de nacimientos, defunciones y diversas enfermedades. Graunt determinó las fracciones de personas en Londres que murieron de diversas enfermedades durante un periodo de principios del siglo XVII. Unos treinta años después, en 1693, Edmond Halley (de quien lleva el nombre del cometa) publicó las primeras tablas de seguros de vida. Para aplicar estos resultados, se considera la selección de un miembro de la población de manera casual. A continuación, se asigna la probabilidad de que esa persona tenga una enfermedad determinada. El juicio aquí es la selección de una persona, pero el interés está en ciertas características. Podemos hablar del evento de que la persona seleccionada morirá de cierta enfermedad, digamos “consumo”. Si bien es una persona la que es seleccionada, es la muerte por consumo lo que es de interés. De esta formulación estadística surgió un interés no sólo en las probabilidades como fracciones o frecuencias relativas sino también en promedios o expectatones. Estos promedios juegan un papel esencial en la probabilidad moderna.
No intentamos rastrear esta historia, que fue larga y detenida, aunque marcada por destellos de brillantez. Ciertos conceptos y patrones surgidos de la experiencia y la intuición exigieron aclaración. Pasamos más bien directamente a la formulación matemática (el “modelo matemático”) que ha capturado con mayor éxito estas ideas esenciales. Este es el modelo, arraigado en el sistema matemático conocido como teoría de medidas, se llama el modelo Kolmogorov, en honor del brillante matemático ruso A.N. Kolmogorov (1903-1987). Kolmogorov logró reunir diversos desarrollos iniciados a principios de siglo, principalmente en la obra de E. Borel y H. Lebesgue sobre la teoría de las medidas. Kolmogorov publicó su obra de época en alemán en 1933. Fue traducido al inglés y publicado en 1956 por Chelsea Publishing Company.
Resultados y eventos
La probabilidad se aplica a situaciones en las que existe un ensayo bien definido cuyos posibles resultados se encuentran entre aquellos en un conjunto básico dado. Los siguientes son típicos.
- Se tira un par de dados; el resultado se ve en términos de los números de manchas que aparecen en las caras superiores de los dos dados. Si el resultado es visto como un par ordenado, hay treinta y seis resultados igualmente probables. Si el desenlace se caracteriza por el número total de manchas en los dos mueren, entonces hay once resultados posibles (no igualmente probables).
- Se realiza una encuesta a una población con derecho a voto. Los resultados se caracterizan por respuestas a una pregunta. Por ejemplo, las respuestas pueden ser categorizadas como positivas (o favorables), negativas (o desfavorables), o inciertas (o ninguna opinión).
- Se realiza una medición. El resultado es descrito por un número que representa la magnitud de la cantidad en unidades apropiadas. En algunos casos, los valores posibles caen entre un conjunto finito de enteros. En otros casos, los valores posibles pueden ser cualquier número real (generalmente en algún intervalo especificado).
- En la teoría moderna se encuentran nociones mucho más sofisticadas de resultados. Por ejemplo, en la teoría de la comunicación o el control, un sistema de comunicación experimenta solo un flujo de señal en su vida. Pero un sistema de comunicación no está diseñado para un solo flujo de señal. Está diseñado para una de un conjunto infinito de señales posibles. La probabilidad de encontrar cierto tipo de señal es importante en el diseño. Tales señales constituyen un subconjunto del conjunto más grande de todas las señales posibles.
Estas consideraciones muestran que nuestro modelo de probabilidad debe tratar con
- Un ensayo que da como resultado (selecciona) un resultado a partir de un conjunto de resultados conceptualmente posibles. El ensayo no se completa con éxito hasta que se logre uno de los resultados.
- Asociada a cada resultado se encuentra una cierta característica (o combinación de características) pertinente al problema en cuestión. Al sondear por opiniones políticas, es una persona la que es seleccionada. Esa persona tiene muchos rasgos y características (raza, edad, género, ocupación, preferencia religiosa, preferencias por la alimentación, etc.). Pero el rasgo principal, que caracteriza el resultado, es la opinión política sobre la pregunta planteada. Por supuesto, algunas de las otras características pueden ser de interés para el análisis de la encuesta.
Inherente al pensamiento informal, así como al análisis preciso, es la noción de un evento al que se le puede asignar una probabilidad como medida de la probabilidad de que ocurra el evento en cualquier juicio. Un modelo matemático exitoso debe formular estas nociones con precisión. Se identifica un evento en términos de la característica del desenlace observado. El evento “una respuesta favorable” a una pregunta de sondeo ocurre si el resultado observado tiene esa característica; es decir, iff (si y sólo si) el demandado responde afirmativamente. Se roba una mano de cinco cartas. El evento “uno o más ases” ocurre si la mano realmente dibujada tiene al menos un as. Si esa misma mano tiene dos tarjetas del palo de palos, entonces se ha producido el evento “dos palos”. Estas consideraciones llevan a la siguiente definición.
Definición. El evento determinado por alguna característica de los posibles resultados es el conjunto de aquellos resultados que tienen esta característica. El evento ocurre si el resultado del juicio es miembro de ese conjunto (es decir, tiene la característica que determina el evento).
- El evento de lanzar un “siete” con un par de dados (al que llamamos el evento SIETE) consiste en el conjunto de esos posibles resultados con un total de siete spots presentados. El evento SIETE ocurre si el resultado es una de esas combinaciones con un total de siete spots (es decir, pertenece al evento SIETE). Esto podría representarse de la siguiente manera. Supongamos que los dos dados se distinguen (digamos por color) y se toma una imagen de cada una de las treinta y seis combinaciones posibles. En la parte posterior de cada imagen, escribe el número de spots. Ahora el evento SIETE consiste en el set de todas esas fotos con siete en la parte posterior. Lanzar los dados equivale a seleccionar aleatoriamente una de las treinta y seis imágenes. El evento SIETE ocurre si la imagen seleccionada es una del conjunto de esas imágenes con siete en la parte posterior.
- Observar durante un tiempo muy largo (teóricamente infinito) la señal que pasa por un canal de comunicación equivale a seleccionar una de las señales conceptualmente posibles. Ahora tales señales tienen muchas características: el valor máximo de pico, el espectro de frecuencia, el grado de diferenciabilidad, el valor promedio en un período de tiempo dado, etc. Si la señal tiene un valor absoluto pico menor de diez voltios, un espectro de frecuencia esencialmente limitado de 60 herz a 10,000 herz, con pico tasa de cambio 10,000 voltios por segundo, entonces es uno del conjunto de señales con esas características. Se ha producido el suceso “la señal tiene estas características”. Este conjunto (evento) consiste en una infinidad incontable de tales señales.
Una de las ventajas de esta formulación de un evento como subconjunto del conjunto básico de posibles resultados es que podemos utilizar la teoría de conjuntos elementales como ayuda a la formulación. Y las herramientas, como los diagramas de Venn y las funciones de indicador para estudiar combinaciones de eventos, proporcionan poderosas ayudas para establecer y visualizar relaciones entre eventos. Formalizamos estas ideas de la siguiente manera:
- \(\Omega\)Sea el conjunto de todos los resultados posibles del ensayo o experimento básico. A esto lo llamamos el espacio básico o el evento seguro, ya que si el juicio se lleva a cabo con éxito el resultado estará en\(\Omega\); de ahí que el suceso\(\Omega\) seguramente ocurrirá en cualquier juicio. Debemos especificar sin ambigüedades qué resultados son “posibles”. Al lanzar una moneda, los únicos resultados aceptados son “cabezas” y “colas”. Si la moneda se parara sobre su borde, digamos apoyándose contra una pared, ordinariamente consideraríamos que eso es el resultado de un juicio impropio.
- Como señalamos anteriormente, cada resultado puede tener varias características que son la base para describir eventos. Supongamos que estamos sacando una sola carta de una baraja ordinaria de naipes. Cada carta se caracteriza por un “valor nominal” (dos a diez, jota, reina, rey, as) y un “palo” (palos, corazones, diamantes, espadas). Se dibuja un as (ocurre el evento ACE) si el resultado (carta) pertenece al conjunto (evento) de cuatro cartas con as como valor nominal. Se dibuja un corazón si la tarjeta pertenece al conjunto de trece tarjetas con corazón como traje. Ahora puede ser deseable especificar eventos que involucren diversas combinaciones lógicas de las características. Así, nos puede interesar el caso de que el valor nominal sea jack o king y el traje sea corazón o pala. El conjunto para gato o rey está representado por la unión\(J \cup K\) y el conjunto para corazón o pala es la unión\(H \cup S\). La ocurrencia de ambas condiciones significa que el resultado está en la intersección (parte común) designada por\(\cap\). Así, el suceso al que se refiere es
\(E = (J \cup K) \cap (H \cup S)\)
La notación de la teoría de conjuntos hace posible así una formulación precisa del evento\(E\).
\({A_i : i \in J}\)es la clase de conjuntos\(A_i\), uno para cada índice\(i\) en el conjunto de índices\(J\)
Por ejemplo, si\(J = {1, 2, 3}\) entonces\({A_i : i \in J}\) es la clase\({A_1, A_2, A_3}\), y
\(\bigcup_{i \in J} A_i = A_1 \cup A_2 \cup A_3\),\(\bigcup_{i \in J} A_i = A_1 \cap A_2 \cap A_3\),
Si\(J = {1, 2, \cdot\cdot\cdot}\) entonces\({A_i: i \in J}\) es la secuencia\({A_1: 1 \le i}\), y
\(\bigcup_{i \in J} A_i = \bigcup_{i = 1}^{\infty} A_i\),\(\bigcap_{i \in J} A_i = \bigcap_{i = 1}^{\infty} A_i\)
Si el evento E es la unión de una clase de eventos, entonces el evento E ocurre si se produce al menos un evento en la clase. Si F es la intersección de una clase de eventos, entonces el evento F ocurre si todos los eventos de la clase ocurren en el ensayo.
El papel de las uniones disjuntas es tan importante en probabilidad que es útil tener un símbolo que indique la unión de una clase disjunta. Utilizamos la V grande para indicar que los conjuntos combinados en la unión son disjuntos. Así, por ejemplo, escribimos
\(A = \bigvee_{i = 1}^{n} A_i\)para significar\(A = \bigcup_{i = 1}^{n} A_i\) con la condición de que la\(A_i\) forma una clase disjunta
Eventos derivados de una clase
Considera la clase\({E_1, E_2, E_3}\) de eventos. \(A_k\)Sea el evento que\(k\) ocurra exactamente en un juicio y\(B_k\) sea el evento que\(k\) o más ocurran en un juicio. Entonces
\(A_0 = E_1^c E_2^c E_3^c\),\(A_1 = E_1 E_2^c E_3^c \bigvee E_1^c E E_3^c \bigvee E_1^c E_2^c E_3\),\(A_2 = E_1 E_2 E_3^c \bigvee E_1 E_2^c E_3 \bigvee E_1^c E_2 E_3\),\(A_3 = E_1 E_2 E_3\)
Los sindicatos son disjuntos ya que cada par de términos tiene\(E_i\) en uno y\(E_i^c\) en el otro, para al menos uno\(i\). Ahora el se\(B_k\) puede expresar en términos de la\ (a_K\. Por ejemplo
\(V_2 = A_2 \bigvee A_3\)
La unión en esta expresión para\(B_2\) es disjunta ya que no podemos tener exactamente dos de los que\(E_i\) ocurren y exactamente tres de ellos ocurren en el mismo juicio. Podemos expresar\(B_2\) directamente en términos de\(E_i\) lo siguiente:
\(B_2 = E_1 E_2 \cup E_1 E_3 \cup E_2 E_3\)
Aquí la unión no es disjunta, en general. Sin embargo, si un par, digamos\({E_1, E_3}\) es disjunta, entonces\(E_1 E_3 = \emptyset\) y el par\({E_1 E_2, E_2 E_3}\) es disjunta (dibuja un diagrama de Venn). Supongamos que\(C\) es el evento que ocurren los dos primeros o los dos últimos ocurren pero no hay otra combinación. Entonces
\(C = E_1 E_2 E_3^c \bigvee E_1^c E_2 E_3\)
\(D\)Sea el evento de que uno o tres de los eventos ocurran,
\(D = A_1 \bigvee A_3 = E_1 E_2^c E_3^c \bigvee E_1^c E_2 E_3^c \bigvee E_1^c E_2^c E_3 \bigvee E_1 E_2 E_3\)
Los patrones importantes en la teoría de conjuntos conocidos como reglas de DeMorgan son útiles en la entrega de eventos. Para una clase arbitraria\({A_i: i \in J}\) de eventos,
\([\bigcup_{i \in J} A_i]^c = \bigcap_{i \in J} A_i^c\)y\([\bigcap_{i \in J} A_i]^c = \bigcup_{i \in J} A_i^c\)
Un desenlace no está en la unión (es decir, no en al menos uno) del\(A_i\) iff falla en estar en todos\(A_i\), y no está en la intersección (es decir, no en todos) si no logra estar en al menos uno de los\(A_i\).
continuación del ejemplo
Expresar el evento de no más de una ocurrencia de los eventos en\({E_1, E_2, E_3}\) as\(B_2^c\).
\(B_2^c = [E_1 E_2 \cup E_1 E_3 \cup E_2 E_3]^c = (E_1^c \cup E_2^c) (E_1^c \cup E_3^c) (E_2^3 \cup E_3^c) = E_1^c E_2^c \cup E_1^c E_3^c \cup E_2^c E_3^c\)
La última expresión muestra que no más de uno de los\(E_i\) ocurre si al menos dos de ellos no ocurren.