Saltar al contenido principal
LibreTexts Español

11.4: Muestreo Independiente — Comparación de Dos Varianzas Poblacionales o Desviaciones Estándar

  • Page ID
    151851
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    En ocasiones queremos probar si dos poblaciones tienen la misma extensión o variación, medida por varianza o desviación estándar. Esto puede ser una prueba por sí sola o una forma de verificar suposiciones al decidir entre dos modelos diferentes (por ejemplo: varianza agrupada\(t\) ‐prueba vs. varianza desigual\(t\) ‐prueba). Ahora exploraremos pruebas para detectar una diferencia en la varianza entre dos muestras independientes.

    La\(\mathbf{F}\) distribución es una familia de distribuciones relacionadas con la Distribución Normal. Hay dos grados diferentes de libertad, generalmente representados como numerador (\(\mathrm{df}_{\text {num}}\)) y denominador (\(\mathrm{df}_{\text {den}}\)). Además, dado que la F representa datos cuadrados, la inferencia será sobre la varianza más que sobre la desviación estándar.

    Características de\(\mathbf{F}\) Distribution

    clipboard_e0d88cf734f21f65255ca494c1042e116.png

    • Está sesgado positivamente
    • No es negativo
    • Hay 2 grados diferentes de libertad (\(\mathrm{df}_{\text {num}}\),\(\mathrm{df}_{\text {den}}\))
    • Cuando cambian los grados de libertad, se crea una nueva distribución
    • El valor esperado es 1.

    \(\mathbf{F}\)prueba de igualdad de varianzas

    Supongamos que quisiéramos probar la hipótesis nula de que dos desviaciones estándar de población son iguales,\(H_o: \sigma_{1}=\sigma_{2}\). Esto equivale a probar que las varianzas poblacionales son iguales:\(\sigma_{1}^{2}=\sigma_{2}^{2}\). Ahora vamos a escribir estos como una relación equivalente:\(H_o: \dfrac{\sigma_{1}^{2}}{\sigma_{2}^{2}}=1\) o\(H_o: \dfrac{\sigma_{2}^{2}}{\sigma_{2}^{1}}=1\).

    Esta es la lógica detrás de la\(\mathbf{F}\) prueba; si dos varianzas poblacionales son iguales, entonces la relación de varianzas muestrales de cada población tendrá\(\mathbf{F}\) distribución. \(\mathbf{F}\)siempre será una prueba de cola superior en la práctica, por lo que la varianza mayor va en el numerador. Los estadísticos de las pruebas se resumen en la tabla.

    Hipótesis Estadística de prueba
    \ (\ begin {alineado}
    &H_ {o}:\ sigma_ {1}\ geq\ sigma_ {2}\\
    &H_ {a}:\ sigma_ {1} <\ sigma_ {2}
    \ final {alineado}\)
    \(\mathbf{F}=\dfrac{s_{2}^{2}}{s_{1}^{2}}\)\(\alpha\)mesa de uso
    \ (\ begin {alineado}
    &H_ {o}:\ sigma_ {1}\ leq\ sigma_ {2}\\
    &H_ {a}:\ sigma_ {1} >\ sigma_ {2}
    \ final {alineado}\)
    \(\mathbf{F}=\dfrac{s_{1}^{2}}{s_{2}^{2}}\)\(\alpha\)mesa de uso
    \ (\ begin {alineado}
    &H_ {o}:\ sigma_ {1} =\ sigma_ {2}\\
    &H_ {a}:\ sigma_ {1}\ neq\ sigma_ {2}
    \ end {alineado}\)
    \(\mathbf{F}=\dfrac{\max \left(s_{1}^{2}, s_{2}^{2}\right)}{\min \left(s_{1}^{2}, s_{2}^{2}\right)}\)\(\alpha/2\)mesa de uso

    Ejemplo: Variación en existencias

    clipboard_e97b5fa2ebdf81f08946d1af195b96356.png

    Un corredor de bolsa de una firma de corretaje, informó que la tasa media de rendimiento de una muestra de 10 acciones de software (población 1) fue de 12.6 por ciento con una desviación estándar de 4.9 por ciento. La tasa media de rendimiento de una muestra de 8 existencias de servicios públicos (población 2) fue de 10.9, por ciento con una desviación estándar de 3.5 por ciento. En el nivel de significancia .05, ¿puede el corredor concluir que hay más variación en las acciones de software?

    Solución

    Diseño

    Hipótesis de investigación:

    \(H_o: \sigma_{1} \leq \sigma_{2}\)(Las existencias de software no tienen más variación)

    \(H_a: \sigma_{1} > \sigma_{2}\)(Las existencias de software tienen más variación)

    El modelo será\(\mathbf{F}\) prueba para varianzas y el estadístico de prueba de la tabla será\(\mathbf{F}=\dfrac{s_{1}^{2}}{s_{2}^{2}}\). Los grados de libertad para el numerador serán\(n_{1}-1=9\), y los grados de libertad para el denominador serán\(n_{2}-1=7\). La prueba se ejecutará a un nivel de significancia (\(\alpha\)) del 5%. Valor Crítico para\(\mathbf{F}\) con\(\mathrm{df}_{\text {num}}=9\) y\(\mathrm{df}_{\text {den}}=7\) es 3.68. Rechazar\(H_o\) si\(\mathbf{F}\) >3.68.

    Datos/Resultados

    \(\mathbf{F}=4.9^{2} / 3.5^{2}=1.96\), que es menor que el valor crítico, por lo que No Rechazar\(H_o\).

    Conclusión

    No hay pruebas suficientes para reclamar más variación en el stock de software.

    Ejemplo: Prueba de suposiciones del modelo

    Al comparar dos medias de muestras independientes, puede elegir entre la varianza agrupada más poderosa\(t\) ‐test (la suposición es\(\sigma_{1}^{2}=\sigma_{2}^{2}\)) o la varianza desigual más débil\(t\) ‐test (la suposición es\(\sigma_{1}^{2} \neq \sigma_{2}^{2}\). Ahora podemos diseñar una prueba de hipótesis que nos ayude a elegir el modelo adecuado. Revisemos el ejemplo de comparar el MPG para autos compactos de importación y nacionales. Considera este ejemplo una “prueba antes de la prueba principal” para ayudar a elegir el modelo correcto para comparar medias.

    Solución

    Diseño

    Hipótesis de investigación:

    \(H_o: \sigma_{1} = \sigma_{2}\)(elija la\(t\) prueba de varianza agrupada para comparar medias)

    \(H_a: \sigma_{1} \neq \sigma_{2}\)(elija la\(t\) prueba de varianza desigual para comparar medias)

    El modelo será\(\mathbf{F}\) prueba para varianzas, y el estadístico de prueba de la tabla será\(\mathbf{F}=\dfrac{s_{1}^{2}}{s_{2}^{2}}\) (\(s_1\)es más grande). Los grados de libertad para el numerador serán\(n_{1}-1=11\) y los grados de libertad para denominador serán\(n_2‐1=14\). La prueba se ejecutará a un nivel de significancia (\(\alpha\)) del 10%, pero se utilizará la tabla\(\alpha\) =.05 para una prueba de dos colas. Valor Crítico para\(\mathbf{F}\) con\(\mathrm{df}_{\text {num}}=11\) y\(\mathrm{df}_{\text {den}}=14\) es 2.57. Rechazar\(H_o\) si\(\mathbf{F}\) >2.57.

    clipboard_e3429283db4e6b497c200ae565fa96e97.png

    También realizaremos esta prueba de la manera\(p\) ‐valor en Megasat.

    Datos/Resultados

    \(\mathbf{F}=14.894 / 4.654=3.20\), que es más que valor crítico; Rechazar\(H_o\).

    También\(p\) ‐valor = 0.0438 < 0.10, lo que también hace que el resultado sea significativo.

    Conclusión

    No asuma varianzas iguales y ejecute la prueba de varianza desigual\(t\) ‐test para comparar medias poblacionales

    En Resumen

    Este diagrama de flujo resume cuál de los cuatro modelos elegir al comparar dos medias de población. Además, puede utilizar el\(\mathbf{F}\) ‐test para la igualdad de varianzas para tomar la decisión entre la varianza de pool\(t\) ‐test y la varianza desigual\(t\) ‐test.

    clipboard_e290898970b100547aef97dde323e92a3.png


    This page titled 11.4: Muestreo Independiente — Comparación de Dos Varianzas Poblacionales o Desviaciones Estándar is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform.