Saltar al contenido principal
LibreTexts Español

12.3: La distribución F y la relación F

  • Page ID
    150672
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    La distribución utilizada para la prueba de hipótesis es nueva. Se llama la distribución F, inventada por George Snedecor pero nombrada en honor a Sir Ronald Fisher, un estadístico inglés. El\(F\) estadístico es una relación (una fracción). Hay dos conjuntos de grados de libertad; uno para el numerador y otro para el denominador.

    Por ejemplo, si\(F\) sigue una\(F\) distribución y el número de grados de libertad para el numerador es cuatro, y el número de grados de libertad para el denominador es diez, entonces\(F \sim F_{4,10}\).

    Para calcular la\(\bf{F}\) relación se realizan dos estimaciones de la varianza.

    1. Varianza entre muestras: Una estimación de\(\sigma^2\) eso es la varianza de las medias de la muestra multiplicada por\(n\) (cuando los tamaños de muestra son los mismos). Si las muestras son de diferentes tamaños, la varianza entre muestras se pondera para tener en cuenta los diferentes tamaños de muestra. La varianza también se llama variación por tratamiento o variación explicada.
    2. Varianza dentro de las muestras: Una estimación de\(\sigma^2\) eso es el promedio de las varianzas de la muestra (también conocida como varianza agrupada). Cuando los tamaños de muestra son diferentes, se pondera la varianza dentro de las muestras. La varianza también se llama la variación por error o variación inexplicable.
    • \(SS_{between}\)es la suma de cuadrados que representa la variación entre las diferentes muestras
    • \(SS_{within}\)es la suma de cuadrados que representa la variación dentro de las muestras que se debe al azar.

    Encontrar una “suma de cuadrados” significa sumar cantidades cuadradas que, en algunos casos, pueden ser ponderadas. Se utilizó suma de cuadrados para calcular la varianza muestral y la desviación estándar de la muestra en el Cuadro 1.19.

    MS significa "cuadrado medio”. \(MS_{between}\)es la varianza entre grupos, y\(MS_{within}\) es la varianza dentro de los grupos.

    Cálculo de Suma de Cuadrados y Cuadrados

    • \(k\)es el número de grupos diferentes
    • \(n_j\)es el tamaño del\(j^{th}\) grupo
    • \(s_j\)= la suma de los valores en el\(j^{th}\) grupo
    • \(n\)es el número total de todos los valores combinados (tamaño total de la muestra:\(\Sigma n_{j}\))
    • \(x\)es el único valor:\[\sum x=\sum s_{j} \nonumber\]
    • Suma de cuadrados de todos los valores de cada grupo combinado:\[\sum x^{2} \nonumber\]
    • Variabilidad entre grupos:\[SS_{total} =\sum x^{2}-\frac{\left(\sum x^{2}\right)}{n} \nonumber\]
    • Suma total de cuadrados:\[\sum x^{2}-\frac{\left(\sum x\right)^{2}}{n} \nonumber \]
    • Variación explicada: suma de cuadrados que representan la variación entre las diferentes muestras:
      \[SS_{between} =\sum\left[\frac{\left(s_{j}\right)^{2}}{n_{j}}\right]-\frac{\left(\sum s_{j}\right)^{2}}{n} \nonumber\]
    • Variación inexplicable: suma de cuadrados que representan la variación dentro de las muestras debido al azar:\[S S_{\text { within }}=S S_{\text { total }}-S S_{\text { between }} \nonumber\]
    • \(df\)'s para diferentes grupos (\(df\)'s para el numerador):\[df = k – 1 \nonumber\]
    • Ecuación para errores dentro de las muestras (\(df\)'s para el denominador):\[df_{within} = n – k \nonumber\]
    • Cuadrado medio (estimación de varianza) explicada por los diferentes grupos:\[M S_{\text { between }}=\frac{S S_{\text { between }}}{d f_{\text { between }}} \nonumber\]
    • Cuadrado medio (estimación de varianza) que se debe a la casualidad (inexplicable):\[M S_{\mathrm{within}}=\frac{S S_{\mathrm{within}}}{d f_{\mathrm{within}}} \nonumber\]

    \(MS_{between}\)y\(MS_{within}\) se puede escribir de la siguiente manera:

    \[\begin{align*} M S_{\mathrm{between}} & =\frac{S S_{\mathrm{between}}}{d f_{\mathrm{between}}}=\frac{S S_{\mathrm{between}}}{k-1} \\[4pt] M S_{within} &=\frac{SS_{w ithin}}{df_{within}}=\frac{SS_{within}}{n-k}\end{align*} \]

    La prueba de ANOVA unidireccional depende de que\(M S_{between}\) pueda verse influenciada por las diferencias poblacionales entre medias de los diversos grupos. Dado que\(M S_{within}\) compara los valores de cada grupo con su propia media de grupo, el hecho de que las medias grupales puedan ser diferentes no afecta\(M S_{within}\).

    La hipótesis nula dice que todos los grupos son muestras de poblaciones que tienen la misma distribución normal. La hipótesis alternativa dice que al menos dos de los grupos de muestra provienen de poblaciones con diferentes distribuciones normales. Si la hipótesis nula es verdadera,\(M S_{between}\) y ambos\(M S_{within}\) deben estimar el mismo valor.

    Nota

    La hipótesis nula dice que todas las medias poblacionales del grupo son iguales. La hipótesis de igualdad de medias implica que las poblaciones tienen la misma distribución normal, porque se asume que las poblaciones son normales y que tienen varianzas iguales.

    Definición: F-ratio o estadística F

    \[F=\frac{M S_{\text { between }}}{M S_{\text { within }}}\]

    Si\(M S_{between}\) y\(M S_{within}\) estiman el mismo valor (siguiendo la creencia de que\(H_0\) es verdad), entonces la\(F\) relación -debe ser aproximadamente igual a uno. En su mayoría, solo los errores de muestreo contribuirían a variaciones alejadas de uno. Resulta que\(M S_{between}\) consiste en la varianza poblacional más una varianza producida a partir de las diferencias entre las muestras. \(M S_{within}\)es una estimación de la varianza poblacional. Dado que las varianzas son siempre positivas, si la hipótesis nula es falsa, generalmente\(M S_{between}\) será mayor que\(MS_{within}\) .Entonces la\(F\) relación -será mayor que uno. Sin embargo, si el efecto poblacional es pequeño, no es poco\(M S_{within}\) probable que sea mayor en una muestra dada.

    Los cálculos anteriores se realizaron con grupos de diferentes tamaños. Si los grupos son del mismo tamaño, los cálculos se simplifican un poco y la relación F se puede escribir como:

    Fórmula de relación F cuando los grupos son del mismo tamaño

    Los cálculos anteriores se realizaron con grupos de diferentes tamaños. Si los grupos son del mismo tamaño, los cálculos se simplifican un poco y la relación F se puede escribir como

    \[F=\frac{n \cdot s_{\overline{x}}^{2}}{s^{2}_{ pooled }}\]

    donde

    • \(n\)= el tamaño de la muestra
    • \(d f_{\text {numerator}}=k-1\)
    • \(d f_{\text {denominator}}=n-k\)
    • \(s_{pooled}^2\)= la media de las varianzas de la muestra (varianza agrupada)
    • \(s_{\overline x}^2\)= la varianza de las medias de la muestra

    Por lo general, los datos se colocan en una tabla para una fácil visualización. Los resultados de ANOVA unidireccional a menudo se muestran de esta manera por software de computadora.

    Mesa\(\PageIndex{1}\)
    Fuente de variación Suma de cuadrados (\(SS\)) Grados de libertad (\(df\)) Cuadrado medio (\(MS\)) \(F\)
    Factor
    (Entre)
    \ (SS\)) ">\(SS\) (Factor) \ (df\)) ">\(k – 1\) \ (MS\)) ">\(MS(Factor) = \dfrac{SS(Factor)}{k– 1}\) \ (F\) ">\(F = \dfrac{MS(Factor)}{MS(Error)}\)
    Error
    (Dentro)
    \ (SS\)) ">\(SS\) (Error) \ (df\)) ">\(n – k\) \ (MS\)) ">\(MS(Error) = \dfrac{SS(Error)}{n – k}\) \ (F\) ">
    Total \ (SS\)) ">\(SS\) (Total) \ (df\)) ">\(n – 1\) \ (MS\)) "> \ (F\) ">

    Ejemplo 12.2

    Tres planes de dieta diferentes deben ser probados para la pérdida media de peso. Las entradas en la tabla son las pérdidas de peso para los diferentes planes. Los resultados de ANOVA de una vía se muestran en la Tabla\(\PageIndex{2}\).

    Mesa\(\PageIndex{2}\)
    Plan 1:\(n_1 = 4\) Plan 2:\(n_2 = 3\) Plan 3:\(n_3 = 3\)
    \ (n_1 = 4\) ">5 \ (n_2 = 3\) ">3.5 \ (n_3 = 3\) ">8
    \ (n_1 = 4\) ">4.5 \ (n_2 = 3\) ">7 \ (n_3 = 3\) ">4
    \ (n_1 = 4\) ">4 \ (n_2 = 3\) "> \ (n_3 = 3\) ">3.5
    \ (n_1 = 4\) ">3 \ (n_2 = 3\) ">4.5 \ (n_3 = 3\) ">

    \(s_{1}=16.5, s_{2}=15, s_{3}=15.5\)

    A continuación se presentan los cálculos necesarios para rellenar la tabla ANOVA unidireccional. La tabla se utiliza para realizar una prueba de hipótesis.

    \[\begin{align*} S(\text { between }) &=\sum\left[\frac{\left(s_{j}\right)^{2}}{n_{j}}\right]-\frac{\left(\displaystyle \sum s_{j}\right)^{2}}{n} \\[4pt] &=\frac{s_{1}^{2}}{4}+\frac{s_{2}^{2}}{3}+\frac{s_{3}^{2}}{3}-\frac{\left(s_{1}+s_{2}+s_{3}\right)^{2}}{10}\end{align*}\]

    dónde\(n_{1}=4, n_{2}=3, n_{3}=3\) y\(n=n_{1}+n_{2}+n_{3}=10\).

    \[\begin{align*} S(\text { between }) &= \frac{(16.5)^{2}}{4}+\frac{(15)^{2}}{3}+\frac{(15.5)^{2}}{3}-\frac{(16.5+15+15.5)^{2}}{10} \\[4pt] &=2.2458 \\[4pt] S(\text {total}) &=\sum x^{2}-\frac{\left(\sum x\right)^{2}}{n} \\[4pt] &=\left(5^{2}+4.5^{2}+4^{2}+3^{2}+3.5^{2}+7^{2}+4.5^{2}+8^{2}+4^{2}+3.5^{2}\right) -\frac{(5+4.5+4+3+3.5+7+4.5+8+4+3.5)^{2}}{10}\\[4pt] &=244-\frac{47^{2}}{10} \\[4pt] &=244-220.9 \\[4pt] & =23.1 \\[4pt] S(\text {within}) & = S(\text {total})-S S(\text {between}) \\[4pt] &=23.1-2.2458 \\[4pt] &=20.8542 \end{align*}\]

    Mesa\(\PageIndex{3}\)
    Fuente de variación Suma de cuadrados (\(SS\)) Grados de libertad (\(df\)) Cuadrado medio (\(MS\)) \(F\)
    Factor
    (Entre)
    \ (SS\)) ">\(SS(Factor) = SS(Between) \\= 2.2458\) \ (df\)) ">\(k – 1 = 3 groups – 1 \\= 2\) \ (MS\)) ">\(MS(Factor) = \dfrac{SS(Factor)}{k – 1} \\= 2.2458/2 \\= 1.1229\) \ (F\) ">\(F = \dfrac{MS(Factor)}{MS(Error)} \\ = \dfrac{1.1229}{2.9792} \\= 0.3769\)
    Error
    (Dentro)
    \ (SS\)) ">\(SS(Error) = SS(Within) \\ = 20.8542\) \ (df\)) ">\(n – k = 10 total data – 3 groups \\= 7\) \ (MS\)) ">\(MS(Error) = \dfrac{SS(Error)}{n – k} \\= \dfrac{20.8542}{7} \\= 2.9792\) \ (F\) ">
    Total \ (SS\)) ">\(SS(Total) = 2.2458 + 20.8542 \\= 23.1\) \ (df\)) ">\(n – 1 = 10 total data – 1 \\= 9\) \ (MS\)) "> \ (F\) ">

    Ejercicio 12.2

    Como parte de un experimento para ver cómo diferentes tipos de cobertura del suelo afectarían la producción de tomate en rebanado, estudiantes del Colegio Marista cultivaron plantas de tomate bajo diferentes condiciones de cobertura del suelo. Grupos de tres plantas cada uno tuvieron uno de los siguientes tratamientos

    • suelo desnudo
    • una cubierta de suelo comercial
    • plástico negro
    • paja
    • composta

    Todas las plantas crecieron en las mismas condiciones y fueron de la misma variedad. Los estudiantes registraron el peso (en gramos) de los tomates producidos por cada una de las n = 15 plantas:

    Desnudo:\(n_1 = 3\) Cubierta del suelo:\(n_2 = 3\) Plástico:\(n_3 = 3\) Paja:\(n_4 = 3\) Compost:\(n_5 = 3\)
    \ (n_1 = 3\) ">2,625 \ (n_2 = 3\) ">5.348 \ (n_3 = 3\) ">6,583 \ (n_4 = 3\) ">7.285 \ (n_5 = 3\) ">6.277
    \ (n_1 = 3\) ">2.997 \ (n_2 = 3\) ">5.682 \ (n_3 = 3\) ">8.560 \ (n_4 = 3\) ">6.897 \ (n_5 = 3\) ">7.818
    \ (n_1 = 3\) ">4.915 \ (n_2 = 3\) ">5.482 \ (n_3 = 3\) ">3,830 \ (n_4 = 3\) ">9.230 \ (n_5 = 3\) ">8.677
    Mesa\(\PageIndex{4}\)

    Crear la tabla ANOVA unidireccional.

    La prueba de hipótesis ANOVA unidireccional siempre es de cola derecha porque\(F\) los valores más grandes están fuera en la cola derecha de la curva de distribución F y tienden a hacernos rechazar\(H_0\).

    Ejemplo 12.3

    Volvamos al ejercicio de rebanar tomate en Try It. Las medias de los rendimientos de tomate bajo las cinco condiciones de acolchado están representadas por\(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}, \mu_{5}\). Realizaremos una prueba de hipótesis para determinar si todos los medios son iguales o al menos uno es diferente. Usando un nivel de significancia del 5%, pruebe la hipótesis nula de que no hay diferencia en los rendimientos medios entre los cinco grupos contra la hipótesis alternativa de que al menos una media es diferente del resto.

    Responder

    Las hipótesis nulas y alternativas son:

    \(H_{0} : \mu_{1}=\mu_{2}=\mu_{3}=\mu_{4}=\mu_{5}\)

    \(H_{a} : \mu_{i} \neq \mu_{j}\)algunos\(i \neq j\)

    Los resultados de ANOVA de una vía se muestran en la Tabla\(\PageIndex{5}\)

    Mesa\(\PageIndex{5}\)
    Fuente de variación Suma de cuadrados (\(SS\)) Grados de libertad (\(df\)) Cuadrado medio (\(MS\)) F
    Factor (Entre) \ (SS\)) ">36,648,561 \ (df\)) ">\(5 – 1 = 4\) \ (MS\)) ">\(\frac{36,648,561}{4}=9,162,140\) \(\frac{9,162,140}{2,044,672.6}=4.4810\)
    Error (Dentro) \ (SS\)) ">20.446.726 \ (df\)) ">\(15 – 5 = 10\) \ (MS\))” class="mt-align-center">\(\frac{20,446,726}{10}=2,044,672.6\)  
    Total \ (SS\)) ">57,095,287 \ (df\)) ">\(15 – 1 = 14\) \ (MS\)) ">  

    Distribución para la prueba:\(F_{4,10}\)

    \(df(num) = 5 – 1 = 4\)

    \(df(denom) = 15 – 5 = 10\)

    Estadística de prueba:\(F = 4.4810\)

    Esta gráfica muestra una curva de distribución F asimétrica. El eje horizontal se extiende de 0 a 5, y el eje vertical oscila entre 0 y 0.7. La curva está fuertemente sesgada hacia la derecha.
    FIGURA\(\PageIndex{1}\)

    Declaración de probabilidad:\(p\text{-value }= P(F > 4.481) = 0.0248.\)

    Comparar\(\bf{\alpha}\) y el\(\bf p\) -valor:\(\alpha = 0.05\),\(p\text{-value }= 0.0248\)

    Tomar una decisión: Desde\(\alpha > p\) -valor, no podemos aceptar\(H_0\).

    Conclusión: En el nivel de significancia del 5%, tenemos evidencia razonablemente sólida de que las diferencias en los rendimientos medios para cortar plantas de tomate cultivadas en diferentes condiciones de mulching son improbables debido solo al azar. Podemos concluir que al menos algunos de los mantillo condujeron a diferentes rendimientos medios.

    Ejercicio 12.3

    El MRSA, o Staphylococcus aureus, puede causar infecciones bacterianas graves en pacientes hospitalarios. \(\PageIndex{6}\)El cuadro muestra varios recuentos de colonias de diferentes pacientes que pueden tener o no MRSA. Los datos de la tabla se grafican en la Figura\(\PageIndex{2}\).

    Mesa\(\PageIndex{6}\)
    Conc = 0.6 Conc = 0.8 Conc = 1.0 Conc = 1.2 Conc = 1.4
    9 16 22 30 27
    66 93 147 199 168
    98 82 120 148 132

    Gráfica de los datos para las diferentes concentraciones:

    Esta gráfica es una gráfica de dispersión para los datos proporcionados. El eje horizontal está etiquetado como 'Recuentos de colonias' y se extiende de 0 a 200. El eje vertical está etiquetado como 'Concentraciones de triptona' y se extiende de 0.6 a 1.4.

    FIGURA\(\PageIndex{2}\)

    Pruebe si el número medio de colonias es el mismo o diferente. Construye la tabla ANOVA, encuentra el valor p e indica tu conclusión. Utilizar un nivel de significancia del 5%.

    Ejemplo 12.4

    Cuatro hermandades tomaron una muestra aleatoria de hermanas con respecto a sus medias de grado para el último trimestre. Los resultados se muestran en la Tabla\(\PageIndex{7}\).

    Tabla\(\PageIndex{7}\): Grados medios para cuatro hermandades
    Sorority 1 Sorority 2 Sorority 3 Sorority 4
    2.17 2.63 2.63 3.79
    1.85 1.77 3.78 3.45
    2.83 3.25 4.00 3.08
    1.69 1.86 2.55 2.26
    3.33 2.21 2.45 3.18

    Usando un nivel de significancia del 1%, ¿existe una diferencia en las calificaciones medias entre las hermandades?

    Responder

    \(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}\)Dejen ser los medios poblacionales de las hermandades. Recuerde que la hipótesis nula afirma que los grupos de hermandad son de la misma distribución normal. La hipótesis alternativa dice que al menos dos de los grupos de hermandad provienen de poblaciones con diferentes distribuciones normales. Observe que los cuatro tamaños de muestra son cinco cada uno.

    Nota: Este es un ejemplo de un diseño equilibrado, porque cada factor (es decir, hermandad de mujeres) tiene el mismo número de observaciones.

    \(H_{0}: \mu_{1}=\mu_{2}=\mu_{3}=\mu_{4}\)

    \(H_a\): No todos los medios\(\mu_{1}, \mu_{2}, \mu_{3}, \mu_{4}\) son iguales.

    Distribución para la prueba:\(F_{3,16}\)

    donde\(k = 4\) grupos y\(n = 20\) muestras en total

    \(df(num)= k – 1 = 4 – 1 = 3\)

    \(df(denom) = n – k = 20 – 4 = 16\)

    Calcular el estadístico de prueba:\(F = 2.23\)

    Gráfica:

    Esta gráfica muestra una curva de distribución F asimétrica con valores de 0 y 2.23 en el eje x que representan el estadístico de prueba de promedios de grado de hermandad de mujeres. La curva está ligeramente sesgada hacia la derecha, pero es aproximadamente normal. Una línea vertical hacia arriba se extiende desde 2.23 hasta la curva y el área a la derecha de ésta se sombrea para representar el valor p.

    FIGURA\(\PageIndex{3}\)

    Declaración de probabilidad:\(p\text{-value }= P(F > 2.23) = 0.1241\)

    Compare\(\bf{\alpha}\) y el\(\bf p\) valor -value:\(\alpha = 0.01\)
    \(p\text{-value }= 0.1241\)
    \(\alpha < p\) -value

    Tomar una decisión: Desde\(\alpha < p\) -valor, no se puede rechazar\(H_0\).

    Conclusión: No hay evidencia suficiente para concluir que existe una diferencia entre las calificaciones medias para las hermandades.

    Ejercicio 12.4

    Cuatro equipos deportivos tomaron una muestra aleatoria de jugadores respecto a sus GPA del último año. Los resultados se muestran en la Tabla\(\PageIndex{8}\).

    \(\PageIndex{8}\)GPA de mesa para cuatro equipos deportivos
    Basquetbol Béisbol Hockey Lacrosse
    3.6 2.1 4.0 2.0
    2.9 2.6 2.0 3.6
    2.5 3.9 2.6 3.9
    3.3 3.1 3.2 2.7
    3.8 3.4 3.2 2.5

    Utilizar un nivel de significancia del 5%, y determinar si existe una diferencia en el GPA entre los equipos.

    Ejemplo 12.5

    Una clase de cuarto grado es estudiar el medio ambiente. Una de las tareas es cultivar plantas de frijol en diferentes suelos. Tommy optó por cultivar sus plantas de frijol en tierra que se encuentra fuera de su aula mezclada con pelusa secadora. Tara eligió cultivar sus plantas de frijol en tierra para macetas comprada en el vivero local. Nick eligió cultivar sus plantas de frijol en tierra del jardín de su madre. No se utilizaron productos químicos en las plantas, solo agua. Se cultivaron dentro del aula junto a un gran ventanal. Cada niño cultivó cinco plantas. Al final del periodo de crecimiento, se midió cada planta, produciendo los datos (en pulgadas) en la Tabla\(\PageIndex{9}\).

    Plantas de Tommy Plantas de Tara Las plantas de Nick
    24 25 23
    21 31 27
    23 23 22
    30 20 30
    23 28 20
    Mesa\(\PageIndex{9}\)

    ¿Parece que los tres medios en los que se cultivaron las plantas de frijol producen la misma altura media? Prueba a un nivel de significancia del 3%.

    Responder

    Esta vez, realizaremos los cálculos que conduzcan a la estadística F'. Observe que cada grupo tiene el mismo número de plantas, por lo que usaremos la fórmula\(F^{\prime}=\frac{n \cdot s_{\overline{x}}^{2}}{s^{2}_{pooled}}\).

    Primero, calcular la media muestral y la varianza muestral de cada grupo.

      Plantas de Tommy Plantas de Tara Las plantas de Nick
    Media de la muestra 24.2 25.4 24.4
    Varianza de la muestra 11.7 18.3 16.3
    Mesa\(\PageIndex{10}\)

    A continuación, calcular la varianza de las medias de tres grupos (Calcular la varianza de 24.2, 25.4 y 24.4). Varianza de las medias del grupo = 0.413 =\(s_{\overline{x}}^{2}\)

    Entonces\(M S_{b e t w e e n}=n s_{\overline{x}}^{2}=(5)(0.413)\) dónde\(n = 5\) está el tamaño de la muestra (número de plantas que creció cada niño).

    Calcular la media de las tres varianzas muestrales (Calcular la media de 11.7, 18.3 y 16.3). Promedio de las varianzas muestrales = 15.433 =\(\bf{s^2}\) agrupadas

    Entonces\(M S_{\text {within}}=s^{2} \text { pooled }=15.433\).

    El\(F\) estadístico (o\(F\) ratio) es\(F=\frac{M S_{\text { between }}}{M S_{\text { within }}}=\frac{n s_{\overline{x}}^{2}}{s^{2} \text { pooled }}=\frac{(5)(0.413)}{15.433}=0.134\)

    La\(df\) s para el numerador = el número de grupos\(– 1 = 3 – 1 = 2\).

    La\(df\) s para el denominador = el número total de muestras — el número de grupos\(= 15 – 3 = 12\)

    La distribución para la prueba es\(F_{2,12}\) y el\(F\) estadístico es\(F = 0.134\)

    El\(p\) -valor es\(P(F > 0.134) = 0.8759\).

    Decisión: Desde\(\alpha = 0.03\) y el\(p\text{-value }= 0.8759\), entonces no se puede rechazar H0. (¿Por qué?)

    Conclusión: Con un nivel de significancia de 3%, a partir de los datos de la muestra, la evidencia no es suficiente para concluir que las alturas medias de las plantas de frijol son diferentes.

    Notación

    La notación para la\(F\) distribución es\(F \sim F_{d f(n u m), d f(d e n o m)}\) dónde\(df(num) = df_{between}\) y\(df(denom) = df_{within}\). La media para la\(F\) distribución es\(\mu=\frac{d f(n u m)}{d f(\text {denom})-2}\)


    This page titled 12.3: La distribución F y la relación F is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.