4.0: Introducción a Variables Aleatorias Discretas
- Page ID
- 151083
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Un estudiante toma un cuestionario de diez preguntas, verdadero-falso. Debido a que el alumno tenía una agenda tan ocupada, no podía estudiar y adivina al azar en cada respuesta. ¿Cuál es la probabilidad de que el alumno supere la prueba con al menos un 70%?
Las pequeñas empresas podrían estar interesadas en la cantidad de llamadas telefónicas de larga distancia que hacen sus empleados durante la hora pico del día. Supongamos que el promedio histórico es de 20 llamadas. ¿Cuál es la probabilidad de que los empleados realicen más de 20 llamadas telefónicas de larga distancia durante la hora pico?
Estos dos ejemplos ilustran dos tipos diferentes de problemas de probabilidad que involucran variables aleatorias discretas. Recordemos que los datos discretos son datos que puedes contar, es decir, la variable aleatoria solo puede tomar valores de números enteros. Una variable aleatoria describe los resultados de un experimento estadístico en palabras. Los valores de una variable aleatoria pueden variar con cada repetición de un experimento, a menudo llamado ensayo.
Notación de variables aleatorias
La letra mayúscula X denota una variable aleatoria. Las letras minúsculas como x o y denotan el valor de una variable aleatoria. Si X es una variable aleatoria, entonces X se escribe en palabras, y x se da como un número.
Por ejemplo, deja que X = el número de cabezas que obtienes cuando lanzas tres monedas justas. El espacio muestral para el lanzamiento de tres monedas justas es TTT; THH; HTH; HHT; HTT; THT; THT; TTH; HHH. Entonces, x = 0, 1, 2, 3. X está en palabras y x es un número. Observe que para este ejemplo, los valores x son resultados contables. Debido a que se pueden contar los valores posibles como números enteros que X puede tomar y los resultados son aleatorios (los valores x 0, 1, 2, 3), X es una variable aleatoria discreta.
Funciones de densidad de probabilidad (PDF) para una variable aleatoria
Una función de densidad de probabilidad o función de distribución de probabilidad tiene dos características:
- Una función de densidad de probabilidad es una fórmula matemática que calcula probabilidades para tipos específicos de eventos, lo que hemos venido llamando experimentos. Hay una especie de magia en una función de densidad de probabilidad (Pdf) parcialmente porque la misma fórmula a menudo describe tipos muy diferentes de eventos. Por ejemplo, el binomio Pdf calculará probabilidades de voltear monedas, preguntas de sí/no en un examen, opiniones de votantes en una encuesta de opinión arriba o abajo, de hecho cualquier evento binario. Otras funciones de densidad de probabilidad proporcionarán probabilidades para el tiempo hasta que una parte falle, cuándo un cliente llegará a la cabina de peaje, el número de llamadas telefónicas que llegan a una centralita, la tasa de crecimiento de una bacteria, y así sucesivamente. Existen familias enteras de funciones de densidad de probabilidad que se utilizan en una amplia variedad de aplicaciones, incluyendo medicina, negocios y finanzas, física e ingeniería, entre otras.
Para nuestras necesidades aquí nos concentraremos en solo unas pocas funciones de densidad de probabilidad a medida que desarrollemos las herramientas de la estadística inferencial.
Fórmulas de conteo y la fórmula combinacional
Como ecuación esto es:
\[P(A)=\frac{\text { number of ways to get } \mathrm{A}}{\text { Total number of possible outcomes }}\]
Cuando miramos el espacio de muestra para voltear 3 monedas, podríamos escribir fácilmente el espacio de muestra completo y así podríamos contar fácilmente el número de eventos que alcanzaron nuestro resultado deseado, por ejemplo x = 1, donde X es la variable aleatoria definida como el número de cabezas.
Como tenemos un mayor número de artículos en el espacio de muestra, como una baraja completa de 52 cartas, la capacidad de escribir el espacio de muestra se vuelve imposible.
Vemos que las probabilidades no son más que contar los eventos en cada grupo que nos interesan y dividir por el número de elementos en el universo, o espacio muestral. Esto es bastante fácil si estamos contando estudiantes de segundo año en una clase de Stat, pero en casos más complicados enumerar todos los resultados posibles puede llevar toda la vida. Hay, por ejemplo, 36 posibles resultados de lanzar solo dos dados de seis caras donde la variable aleatoria es la suma del número de puntos en los lados orientados hacia arriba. Si hubiera cuatro dados entonces el número total de posibles resultados se convertiría en 1,296. Hay más de 2.5 MILLONES posibles de manos de póquer de 5 cartas en una baraja estándar de 52 cartas. Obviamente hacer un seguimiento de todas estas posibilidades y contarlas para llegar a una sola probabilidad sería tedioso en el mejor de los casos.
Una alternativa a enumerar el espacio muestral completo y contar el número de elementos que nos interesan, es saltarse el paso de enumerar el espacio de muestra, y simplemente averiguar el número de elementos que contiene y hacer la división adecuada. Si estamos tras una probabilidad realmente no necesitamos ver todos y cada uno de los elementos en el espacio muestral, solo necesitamos saber cuántos elementos hay ahí. Las fórmulas de conteo se inventaron para hacer precisamente esto. Nos dicen el número de subconjuntos desordenados de cierto tamaño que se pueden crear a partir de un conjunto de elementos únicos. Por desordenado se quiere decir que, por ejemplo, al repartir cartas, no importa si tienes {as, as, as, rey} o {rey, as, as, as, as} o {as, rey, as, as, as} o {as, rey, as, as, as} y así sucesivamente. Cada uno de estos subconjuntos son iguales porque cada uno tiene 4 ases y un rey.
Fórmula Combinacional
\[\left(\begin{array}{l}{n} \\ {x}\end{array}\right)=_{n} C_{x}=\frac{n !}{x !(n-x) !}\nonumber\]
Esta es la fórmula que indica el número de subconjuntos desordenados únicos de tamaño x que se pueden crear a partir de n elementos únicos. La fórmula se lee “n combinatoria x”. A veces se lee como “n elige x”. El signo de exclamación “!” se llama factorial y nos dice que tomemos todos los números del 1 al número antes del! y multiplicarlos juntos así 4! es 1·2·3·4=24. Por definición 0! = 1. La fórmula se llama la Fórmula Combinatoria. También se le llama el Coeficiente Binomial, por razones que quedarán claras en breve. Si bien este concepto matemático se entendió mucho antes de 1653, Blaise Pascal recibe un gran crédito por su prueba que publicó en ese año. Además, desarrolló un método generalizado de cálculo de los valores para combinatorios conocidos por nosotros como el Triángulo Pascal. Pascal fue uno de los genios de una época de extraordinario avance intelectual que incluyó la obra de Galileo, René Descartes, Isaac Newton, William Shakespeare y el refinamiento del método científico, la razón misma del tema de este texto.
Encontremos por las malas el número total de combinaciones de los cuatro ases en una baraja de cartas si los íbamos a llevar dos a la vez. El espacio muestral sería:
S= {Pala, Corazón), (Pala, Diamante), (Pala, Club), (Diamante, Club), (Corazón, Diamante), (Corazón, Club)}
Hay 6 combinaciones; formalmente, seis subconjuntos desordenados únicos de tamaño 2 que se pueden crear a partir de 4 elementos únicos. Para usar la fórmula combinatoria resolveríamos la fórmula de la siguiente manera:
\[\left(\begin{array}{l}{4} \\ {2}\end{array}\right)=\frac{4 !}{(4-2) ! 2 !}=\frac{4 \cdot 3 \cdot 2 \cdot 1}{2 \cdot 1 \cdot 2 \cdot 1}=6\nonumber\]
Si quisiéramos saber el número de manos de póquer únicas de 5 cartas que podrían crearse a partir de una baraja de 52 cartas simplemente calculamos:
\[\left(\begin{array}{c}{52} \\ {5}\end{array}\right)\nonumber\]
donde 52 es el número total de elementos únicos de los que estamos dibujando y 5 es el grupo de tamaño en el que los estamos poniendo.
Con la fórmula combinatoria podemos contar el número de elementos en un espacio de muestra sin tener que anotar cada uno de ellos, realmente el trabajo de toda la vida solo por el número de 5 manos de cartas de una baraja de 52 cartas. Ahora podemos aplicar esta herramienta a una función de densidad de probabilidad muy importante, la distribución hipergeométrica.
Recuerde, una función de densidad de probabilidad calcula probabilidades para nosotros. Simplemente ponemos los números apropiados en la fórmula y obtenemos la probabilidad de eventos específicos. No obstante, para que estas fórmulas funcionen deben aplicarse únicamente a los casos para los que fueron diseñadas.