5.5: Promedios
- Page ID
- 82156
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Supongamos que nos interesa saber qué tan alto es el estudiante de primer año seleccionado en nuestro ejemplo. Si sabemos quién es seleccionado, podríamos descubrir fácilmente su altura (suponiendo que la altura de cada estudiante de primer año esté disponible en alguna base de datos). Pero, ¿y si no hemos aprendido la identidad de la persona seleccionada? ¿Aún podemos estimar la altura?
Al principio es tentador decir que no sabemos nada de la altura ya que no sabemos quién es seleccionado. Pero esto claramente no es cierto, ya que la experiencia indica que la gran mayoría de los estudiantes de primer año tienen alturas entre 60 pulgadas (5 pies) y 78 pulgadas (6 pies 6 pulgadas), por lo que podríamos sentirnos seguros al estimar la altura en, digamos, 70 pulgadas. Al menos no estimaríamos la altura como 82 pulgadas.
Con probabilidad podemos ser más precisos y calcular una estimación de la altura sin conocer la selección. Y la fórmula que usamos para este cálculo seguirá funcionando después de que aprendamos la selección real y ajustemos las probabilidades en consecuencia.
Supongamos que tenemos una partición con eventos\(A_i\) cada uno de los cuales tiene algún valor para un atributo como height, digamos\(h_i\). Entonces el valor promedio (también llamado el valor esperado)\(H_{av}\) de este atributo se encontraría a partir de las probabilidades asociadas a cada uno de estos eventos como
\(H_{av} = \displaystyle \sum_{i} p(A_i)h_i \tag{5.9}\)
donde la suma está sobre la partición.
Este tipo de fórmula se puede utilizar para encontrar promedios de muchas propiedades, como puntuaciones SAT, peso, edad o riqueza neta. No es apropiado para propiedades que no son numéricas, como género, color de ojos, personalidad, o intención escolástica mayor.
Tenga en cuenta que esta definición de promedio cubre el caso donde cada evento en la partición tiene un valor para el atributo como height. Esto sería cierto para la altura de los estudiantes de primer año sólo para la partición fundamental. Nos gustaría una forma similar de calcular promedios para otras particiones, por ejemplo la partición de hombres y mujeres. El problema es que no todos los hombres tienen la misma estatura, por lo que no está claro para qué usar\(h_i\) en la Ecuación 5.9.
La solución es definir una estatura promedio de los hombres en términos de una partición de grano más fino como la partición fundamental. El teorema de Bayes es útil en este sentido. Tenga en cuenta que la probabilidad de que el estudiante de primer año\(i\) sea elegido dada la elección se sabe que es un hombre es
\(p(A_i \; | \; M) = \dfrac{p(A_i)p(M \; | \; A_i)}{p(M)} \tag{5.10}\)
donde\(p(M \;|\; A_i)\) es particularmente simple, es 1 o 0 dependiendo de si el estudiante de primer año\(i\) es un hombre o una mujer. Entonces la estatura promedio de los estudiantes de primer año masculino es
\(H_{av}(M) = \displaystyle \sum_{i} p(A_i \; | \; M)h_i \tag{5.11}\)
y de manera similar para las mujeres,
\(H_{av}(W) = \displaystyle \sum_{i} p(A_i \; | \; W)h_i \tag{5.12}\)
Entonces la estatura promedio de todos los estudiantes de primer año viene dada por una fórmula exactamente como la Ecuación 5.9:
\(H_{av} = p(M)H_{av}(M) + p(W)H_{av}(W) \tag{5.13} \)
Estas fórmulas para promedios son válidas si todos\(p(A_i)\) para la partición en cuestión son iguales (por ejemplo, si se elige un estudiante de primer año “al azar”). Pero son más generales, también son válidos para cualquier distribución de probabilidad\(p(A_i)\).
Lo único a tener en cuenta es el caso en el que uno de los eventos tiene una probabilidad igual a cero, por ejemplo, si querías la estatura promedio de estudiantes de primer año de Nevada y no pasó a haber ninguno.