14.4: Prueba de hipótesis para regresión lineal simple
- Page ID
- 151912
Ahora describiremos una prueba de hipótesis para determinar si el modelo de regresión es significativo; en otras palabras, ¿el valor de de\(X\) alguna manera ayuda a predecir el valor esperado de\(Y\)?
Supuestos de modelo
- Los errores residuales son aleatorios y normalmente se distribuyen.
- La desviación estándar del error residual no depende de\(X\)
- Existe una relación lineal entre\(X\) y\(Y\)
- Las muestras se seleccionan aleatoriamente
Hipótesis de prueba
\(H_o\):\(X\) y no\(Y\) están correlacionados
\(H_a\):\(X\) y\(Y\) están correlacionados
\(H_o\):\(\beta_1\) (pendiente) = 0
\(H_a\):\(\beta_1\) (pendiente) ≠ 0
Estadística de prueba
\(F=\dfrac{M S_{\text {Regression }}}{M S_{\text {Error }}}\)
\(d f_{\text {num }}=1\)
\(d f_{\text {den }}=n-2\)
Suma de Cuadrados
\(S S_{\text {Total }}=\sum(Y-\bar{Y})^{2}\)
\(S S_{\text {Error }}=\sum(Y-\hat{Y})^{2}\)
\(S S_{\text {Regression }}=S S_{\text {Total }}-S S_{\text {Error }}\)
En regresión lineal simple, esto equivale a decir “¿X es una Y correlacionada?”
Al revisar el modelo\(Y=\beta_{0}+\beta_{1} X+\varepsilon\), siempre que la pendiente (\(\beta_{1}\)) tenga algún valor distinto de cero,\(X\) agregará valor para ayudar a predecir el valor esperado de\(Y\). Sin embargo, si no hay correlación entre X e Y, el valor de la pendiente (\(\beta_{1}\)) será cero. El modelo que podemos usar es muy similar al ANOVA de One Factor.
Los resultados de la prueba se pueden resumir en una tabla ANOVA especial:
Fuente de Variación | Suma de Cuadrados (SS) | Grados de libertad (df) | Cuadrado medio (MS) | \(F\) |
---|---|---|---|---|
Factor (debido a X) | \(\mathrm{SS}_{\text {Regression }}\) | 1 | \(\mathrm{MS}_{\text {Factor }}=\mathrm{SS}_{\text {Factor }} / 1\) | \ (F\)” class="lt-estados-20929">\(\mathrm{F}=\mathrm{MS}_{\text {Factor }} / \mathrm{MS}_{\text {Error }}\) |
Error (Residual) | \(\mathrm{SS}_{\text {Error }}\) | \(n-2\) | \(\mathrm{MS}_{\text {Error }}=\mathrm{SS}_{\text {Error }} / \mathrm{n}-2\) | \ (F\)” class="lt-estados-20929"> |
Total | \(\mathrm{SS}_{\text {Total }}\) | \(n-1\) | \ (F\)” class="lt-estados-20929"> |
Diseño: ¿Existe una correlación significativa entre la lluvia y la venta de gafas de sol?
Hipótesis de investigación s:
\(H_o\): Las ventas y las precipitaciones no están correlacionadas\(H_o\): 1 (pendiente) = 0
\(H_a\): Las ventas y las precipitaciones se correlacionan\(H_a\): 1 (pendiente) ≠ 0
El error tipo I sería rechazar la Hipótesis Null y\(t\) afirmar que la lluvia se correlaciona con las ventas de gafas de sol, cuando no están correlacionadas. La prueba se ejecutará a un nivel de significancia (\(\alpha\)) del 5%.
El estadístico de prueba de la tabla será\(\mathrm{F}=\dfrac{\text { MSRegression }}{\text { MSError }}\). Los grados de libertad para el numerador serán 1, y los grados de libertad para el denominador serán 5‐2=3.
Valor Crítico para\(F\) a\(\alpha\) de 5% con\(df_{num}=1\) y\(df_{den}=3} is 10.13. Reject \(H_o\) si\(F >10.13\). También realizaremos esta prueba usando el método\(p\) ‐value con software estadístico, como Minitab.
Datos/Resultados
\(F=341.422 / 12.859=26.551\), que es más que el valor crítico de 10.13, por lo que Rechazar\(H_o\). Además, el\(p\) ‐valor = 0.0142 < 0.05 que también soporta rechazo\(H_o\).
Conclusión
Las ventas de Gafas de Sol y Lluvia están negativamente correlacionadas.