Saltar al contenido principal

# 10.5: Inferencias estadísticas Acerca de β1

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

Objetivos de aprendizaje

• Aprender a construir un intervalo de confianza para$$β_1$$, la pendiente de la línea de regresión poblacional.
• Aprender a poner a prueba hipótesis respecto a$$β_1$$.

El parámetro$$β_1$$, la pendiente de la línea de regresión poblacional, es de primordial importancia en el análisis de regresión porque da la verdadera tasa de cambio en la media$$E(y)$$ en respuesta a un incremento unitario en la variable predictora$$x$$. Por cada unidad el incremento en$$x$$ la media de la variable de respuesta$$y$$ cambia por$$β_1$$ unidades, aumentando si$$β_1>0$$ y disminuyendo si$$β_1 <0$$. Deseamos construir intervalos de confianza$$β_1$$ y probar hipótesis al respecto.

## Intervalos de confianza para$$β_1$$

La pendiente$$\hat{β}_1$$ de la línea de regresión de mínimos cuadrados es una estimación puntual de$$β_1$$. Un intervalo de confianza para$$β_1$$ viene dado por la siguiente fórmula.

Definición:$$100(1-\alpha )%$$ Confidence Interval for the Slope $$β_1$$ of the Population Regression Line

$\hat{β}_1 \pm t_{α/2} \dfrac{s_{\epsilon}}{\sqrt{SS_{xx}}}$

dónde$$S_\varepsilon =\sqrt{\frac{SSE}{n-2}}$$ y el número de grados de libertad es$$df=n-2$$.

Deben sostenerse los supuestos enumerados en la Sección 10.3.

Definición: desviación estándar de la muestra de errores

El estadístico$$S_\varepsilon$$ se denomina desviación estándar de la muestra de errores. Estima la desviación estándar$$\sigma$$ de los errores en la población de$$y$$ -valores para cada valor fijo de$$x$$ (ver Figura 10.3.1).

Ejemplo$$\PageIndex{1}$$

Construir el intervalo de$$95\%$$ confianza para la pendiente$$β_1$$ de la línea de regresión poblacional basado en el conjunto de datos de muestra de cinco puntos

$\begin{array}{c|c c c c c} x & 2 & 2 & 6 & 8 & 10 \\ \hline y &0 &1 &2 &3 &3\\ \end{array} \nonumber$

Solución:

La estimación puntual$$\hat{β}_1$$ de$$β_1$$ se computó en el Ejemplo 10.4.2 como$$\hat{β}_1=0.34375$$. En el mismo ejemplo$$SS_{xx}$$ se encontró que sí$$SS_{xx}=51.2$$. La suma de los errores al cuadrado$$SSE$$ se computó en el Ejemplo 10.4.4 como$$SSE=0.75$$. Por lo tanto

$S_\varepsilon =\sqrt{\frac{SSE}{n-2}}=\sqrt{\frac{0.75}{3}}=0.50 \nonumber$

Nivel de confianza$$\alpha =1-0.95=0.05$$ lo$$95\%$$ significa$$\alpha /2=0.025$$. De la fila etiquetada$$df=3$$ en la Figura 7.1.6 obtenemos$$t_{0.025}=3.182$$. Por lo tanto

$\hat{\beta _1}\pm t_{\alpha /2}\frac{S_\varepsilon }{\sqrt{SS_{xx}}}=0.34375\pm 3.182\left ( \frac{0.50}{\sqrt{51.2}} \right )=0.34375\pm 0.2223 \nonumber$

que da el intervalo$$(0.1215,0.5661)$$. $$95\%$$Confiamos en que la pendiente$$β_1$$ de la línea de regresión poblacional es entre$$0.1215$$ y$$0.5661$$.

Ejemplo$$\PageIndex{2}$$

Utilizando los datos de muestra del Cuadro 10.4.3 construir un intervalo de$$90\%$$ confianza para la pendiente$$β_1$$ de la línea de regresión poblacional que relaciona la edad y el valor de los automóviles del Ejemplo 10.4.3. Interpretar el resultado en el contexto del problema.

Solución:

La estimación puntual$$\hat{β}_1$$ de$$β_1$$ se computó en el Ejemplo 10.4.3, como fue$$SS_{xx}$$. Sus valores son$$\hat{β}_1=-2.05$$ y$$SS_{xx}=14$$. La suma de los errores al cuadrado$$SSE$$ se computó en el Ejemplo 10.4.5 como$$SSE=28.946$$. Por lo tanto

$S_\varepsilon =\sqrt{\frac{SSE}{n-2}}=\sqrt{\frac{28.946}{8}}=1.902169814 \nonumber$

Nivel de confianza$$\alpha =1-0.90=0.10$$ lo$$90\%$$ significa$$\alpha /2=0.05$$. De la fila etiquetada$$df=8$$ en la Figura 7.1.6 obtenemos$$t_{0.05}=1.860$$. Por lo tanto

$\hat{\beta _1}\pm t_{\alpha /2}\frac{S_\varepsilon }{\sqrt{SS_{xx}}}=-2.05\pm 1.860\left ( \frac{1.902169814}{\sqrt{14}} \right )=-2.05\pm 0.95 \nonumber$

que da el intervalo$$(-3.00,-1.10)$$. $$90\%$$Confiamos en que la pendiente$$β_1$$ de la línea de regresión poblacional es entre$$-3.00$$ y$$-1.10$$. En el contexto del problema esto quiere decir que para los vehículos de esta marca y modelo de entre dos y seis años estamos$$90\%$$ seguros de que por cada año adicional de edad el valor promedio de dicho vehículo disminuye entre$$\1,100$$ y$$\3,000$$.

## Hipótesis de prueba Acerca de β1

Las hipótesis respecto$$β_1$$ pueden probarse utilizando los mismos procedimientos de cinco pasos, ya sea el enfoque de valor crítico o el enfoque$$p$$ -valor, que se introdujeron en la Sección 8.1 y Sección 8.3. La hipótesis nula siempre tiene la forma$$H_0: \beta _1=B_0$$ donde$$B_0$$ es un número determinado a partir de la enunciación del problema. Las tres formas de la hipótesis alternativa, con la terminología para cada caso, son:

Forma de$$H_a$$ Terminología
\ (H_a\)” style="text-align:center;” class="lt-stats-546">$$H_a: \beta _1<B_0$$ Cola izquierda
\ (H_a\)” style="text-align:center;” class="lt-stats-546">$$H_a: \beta _1>B_0$$ Cola derecha
\ (H_a\)” style="text-align:center;” class="lt-stats-546">$$H_a: \beta _1\neq B_0$$ Dos colas

El valor cero para$$B_0$$ es de particular importancia ya que en ese caso lo es la hipótesis nula$$H_0: \beta _1=0$$, que corresponde a la situación en la que no$$x$$ es útil para predecir$$y$$. Porque si$$β_1=0$$ entonces la línea de regresión poblacional es horizontal, entonces la media$$E(y)$$ es la misma para cada valor de$$x$$ y estamos igual de bien en ignorar$$x$$ completamente y aproximarnos$$y$$ por su valor promedio. Dadas dos variables$$x$$ y$$y$$, la carga de la prueba$$x$$ es que es útil para predecir$$y$$, no que no lo sea. Así, la frase “probar si$$x$$ es útil para la predicción de”$$y$$, o palabras a tal efecto, significa realizar la prueba

$H_0: \beta _1=0\; \; \text{vs.}\; \; H_a: \beta _1\neq 0$

Estadístico de prueba estandarizado para pruebas de hipótesis relativas a la pendiente$$β_1$$ of the Population Regression Line

$T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}$

El estadístico de prueba tiene la$$t$$ distribución de Student con$$df=n-2$$ grados de libertad.

Deben sostenerse los supuestos enumerados en la Sección 10.3.

Ejemplo$$\PageIndex{3}$$

Probar, a$$2\%$$ nivel de significancia, si la variable$$x$$ es útil para predecir con$$y$$ base en la información del conjunto de datos de cinco puntos

$\begin{array}{c|c c c c c} x & 2 & 2 & 6 & 8 & 10 \\ \hline y &0 &1 &2 &3 &3\\ \end{array} \nonumber$

Solución:

Realizaremos la prueba utilizando el enfoque de valor crítico.

• Paso 1. Dado que$$x$$ es útil para predecir$$y$$ precisamente cuando la pendiente$$β_1$$ de la línea de regresión poblacional es distinta de cero, la prueba relevante es$H_0: \beta _1=0\\ \text{vs.}\\ H_a: \beta _1\neq 0\; \; @\; \; \alpha =0.02 \nonumber$
• Paso 2. El estadístico de prueba es$T=\frac{\hat{\beta _1}}{S_\varepsilon /\sqrt{SS_{xx}}}$ y tiene la$$t$$ distribución de Student con$$n-2=5-2=3$$ grados de libertad.
• Paso 3. Del Ejemplo 10.4.1,$$β_1=0.34375$$ y$$SS_{xx}=51.2$$. De “Ejemplo$$\PageIndex{1}$$ “,$$S_\varepsilon =0.50$$. Por lo tanto, el valor del estadístico de prueba es$T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}=\frac{0.34375}{0.50/\sqrt{51.2}}=4.919 \nonumber$
• Paso 4. Dado que el símbolo en$$H_a$$ es “$$\neq$$” esta es una prueba de dos colas, por lo que hay dos valores críticos$$\pm t_{\alpha /2}=\pm t_{0.01}$$. Lectura de la línea en la Figura 7.1.6 etiquetada$$df=3$$,$$t_{0.01}=4.541$$. La región de rechazo es$(-\infty ,-4.541]\cup [4.541,\infty ) \nonumber$.
• Paso 5. Como se muestra en la Figura$$\PageIndex{1}$$ “Región de Rechazo y Estadística de Prueba para” el estadístico de prueba cae en la región de rechazo. La decisión es rechazar$$H_0$$. En el contexto del problema nuestra conclusión es:

Los datos proporcionan evidencia suficiente, a$$2\%$$ nivel de significancia, para concluir que la pendiente de la línea de regresión poblacional es distinta de cero, por lo que$$x$$ es útil como predictor de$$y$$.

Ejemplo$$\PageIndex{4}$$

Un vendedor de autos afirma que los automóviles de entre dos y seis años de edad de la marca y modelo discutidos en el Ejemplo 10.4.2 pierden más que$$\1,100$$ en valor cada año. Pruebe esta afirmación a$$5\%$$ nivel de significancia.

Solución:

Realizaremos la prueba utilizando el enfoque de valor crítico.

• Paso 1. En cuanto a las variables$$x$$ y$$y$$, el reclamo del vendedor es que si$$x$$ se incrementa por$$1$$ unidad (un año adicional en edad), entonces$$y$$ disminuye en más de$$1.1$$ unidades (más de$$\1,100$$). Así su aseveración es que la pendiente de la línea de regresión poblacional es negativa, y que es más negativa que$$-1.1$$. En símbolos,$$β_1<-1.1$$. Al contener una desigualdad, ésta tiene que ser la hipótesis alternativa. La hipótesis nula tiene que ser una igualdad y tener el mismo número en el lado derecho, por lo que la prueba relevante es$H_0: \beta _1=-1.1\\ \text{vs.}\\ H_a: \beta _1<-1.1\; \; @\; \; \alpha =0.05 \nonumber$
• Paso 2. El estadístico de prueba es$T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}$ y tiene la$$t$$ distribución de Student con$$8$$ grados de libertad.
• Paso 3. Del Ejemplo 10.4.2,$$β_1=-2.05$$ y$$SS_{xx}=14$$. De “Ejemplo$$\PageIndex{2}$$ “,$$S_\varepsilon =1.902169814$$. Por lo tanto, el valor del estadístico de prueba es$T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}=\frac{-2.05-(-1.1)}{1.902169814/\sqrt{14}}=-1.869 \nonumber$
• Paso 4. Dado que el símbolo en$$H_a$$ es “$$<$$” esta es una prueba de cola izquierda, por lo que hay un solo valor crítico$$-t_{\alpha /2}=-t_{0.05}$$. Lectura de la línea en la Figura 7.1.6 etiquetada$$df=8$$,$$t_{0.05}=1.860$$. La región de rechazo es$(-\infty ,-1.860] \nonumber$.
• Paso 5. Como se muestra en la Figura$$\PageIndex{2}$$ “Región de Rechazo y Estadística de Prueba para" el estadístico de prueba cae en la región de rechazo. La decisión es rechazar$$H_0$$. En el contexto del problema nuestra conclusión es:

Los datos proporcionan evidencia suficiente, a$$5\%$$ nivel de significancia, para concluir que los vehículos de esta marca y modelo y en este rango de edad pierden más de$$\1,100$$ por año en valor, en promedio.

## Llave para llevar

• El parámetro$$β_1$$, la pendiente de la línea de regresión poblacional, es de interés primario porque describe el cambio promedio$$y$$ con respecto al incremento unitario en$$x$$.
• El estadístico$$\hat{β}_1$$, la pendiente de la línea de regresión de mínimos cuadrados, es una estimación puntual de$$β_1$$. Los intervalos de confianza para se$$β_1$$ pueden calcular usando una fórmula.
• Las hipótesis relativas$$β_1$$ se prueban utilizando los mismos procedimientos de cinco pasos introducidos en el Capítulo 8.

This page titled 10.5: Inferencias estadísticas Acerca de β1 is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by via source content that was edited to the style and standards of the LibreTexts platform.