Saltar al contenido principal
LibreTexts Español

10.5: Inferencias estadísticas Acerca de β1

  • Page ID
    151165

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Objetivos de aprendizaje

    • Aprender a construir un intervalo de confianza para\(β_1\), la pendiente de la línea de regresión poblacional.
    • Aprender a poner a prueba hipótesis respecto a\(β_1\).

    El parámetro\(β_1\), la pendiente de la línea de regresión poblacional, es de primordial importancia en el análisis de regresión porque da la verdadera tasa de cambio en la media\( E(y)\) en respuesta a un incremento unitario en la variable predictora\(x\). Por cada unidad el incremento en\(x\) la media de la variable de respuesta\(y\) cambia por\(β_1\) unidades, aumentando si\(β_1>0\) y disminuyendo si\(β_1 <0\). Deseamos construir intervalos de confianza\(β_1\) y probar hipótesis al respecto.

    Intervalos de confianza para\(β_1\)

    La pendiente\(\hat{β}_1\) de la línea de regresión de mínimos cuadrados es una estimación puntual de\(β_1\). Un intervalo de confianza para\(β_1\) viene dado por la siguiente fórmula.

    Definición:\(100(1-\alpha )%\) Confidence Interval for the Slope \(β_1\) of the Population Regression Line

    \[ \hat{β}_1 \pm t_{α/2} \dfrac{s_{\epsilon}}{\sqrt{SS_{xx}}}\]

    dónde\(S_\varepsilon =\sqrt{\frac{SSE}{n-2}}\) y el número de grados de libertad es\(df=n-2\).

    Deben sostenerse los supuestos enumerados en la Sección 10.3.

    Definición: desviación estándar de la muestra de errores

    El estadístico\(S_\varepsilon \) se denomina desviación estándar de la muestra de errores. Estima la desviación estándar\(\sigma\) de los errores en la población de\(y\) -valores para cada valor fijo de\(x\) (ver Figura 10.3.1).

    Ejemplo\(\PageIndex{1}\)

    Construir el intervalo de\(95\%\) confianza para la pendiente\(β_1\) de la línea de regresión poblacional basado en el conjunto de datos de muestra de cinco puntos

    \[\begin{array}{c|c c c c c} x & 2 & 2 & 6 & 8 & 10 \\ \hline y &0 &1 &2 &3 &3\\ \end{array} \nonumber\]

    Solución:

    La estimación puntual\(\hat{β}_1\) de\(β_1\) se computó en el Ejemplo 10.4.2 como\(\hat{β}_1=0.34375\). En el mismo ejemplo\(SS_{xx}\) se encontró que sí\(SS_{xx}=51.2\). La suma de los errores al cuadrado\(SSE\) se computó en el Ejemplo 10.4.4 como\(SSE=0.75\). Por lo tanto

    \[S_\varepsilon =\sqrt{\frac{SSE}{n-2}}=\sqrt{\frac{0.75}{3}}=0.50 \nonumber\]

    Nivel de confianza\(\alpha =1-0.95=0.05\) lo\(95\%\) significa\(\alpha /2=0.025\). De la fila etiquetada\(df=3\) en la Figura 7.1.6 obtenemos\(t_{0.025}=3.182\). Por lo tanto

    \[\hat{\beta _1}\pm t_{\alpha /2}\frac{S_\varepsilon }{\sqrt{SS_{xx}}}=0.34375\pm 3.182\left ( \frac{0.50}{\sqrt{51.2}} \right )=0.34375\pm 0.2223 \nonumber\]

    que da el intervalo\((0.1215,0.5661)\). \(95\%\)Confiamos en que la pendiente\(β_1\) de la línea de regresión poblacional es entre\(0.1215\) y\(0.5661\).

    Ejemplo\(\PageIndex{2}\)

    Utilizando los datos de muestra del Cuadro 10.4.3 construir un intervalo de\(90\%\) confianza para la pendiente\(β_1\) de la línea de regresión poblacional que relaciona la edad y el valor de los automóviles del Ejemplo 10.4.3. Interpretar el resultado en el contexto del problema.

    Solución:

    La estimación puntual\(\hat{β}_1\) de\(β_1\) se computó en el Ejemplo 10.4.3, como fue\(SS_{xx}\). Sus valores son\(\hat{β}_1=-2.05\) y\(SS_{xx}=14\). La suma de los errores al cuadrado\(SSE\) se computó en el Ejemplo 10.4.5 como\(SSE=28.946\). Por lo tanto

    \[S_\varepsilon =\sqrt{\frac{SSE}{n-2}}=\sqrt{\frac{28.946}{8}}=1.902169814 \nonumber\]

    Nivel de confianza\(\alpha =1-0.90=0.10\) lo\(90\%\) significa\(\alpha /2=0.05\). De la fila etiquetada\(df=8\) en la Figura 7.1.6 obtenemos\(t_{0.05}=1.860\). Por lo tanto

    \[\hat{\beta _1}\pm t_{\alpha /2}\frac{S_\varepsilon }{\sqrt{SS_{xx}}}=-2.05\pm 1.860\left ( \frac{1.902169814}{\sqrt{14}} \right )=-2.05\pm 0.95 \nonumber\]

    que da el intervalo\((-3.00,-1.10)\). \(90\%\)Confiamos en que la pendiente\(β_1\) de la línea de regresión poblacional es entre\(-3.00\) y\(-1.10\). En el contexto del problema esto quiere decir que para los vehículos de esta marca y modelo de entre dos y seis años estamos\(90\%\) seguros de que por cada año adicional de edad el valor promedio de dicho vehículo disminuye entre\(\$1,100\) y\(\$3,000\).

    Hipótesis de prueba Acerca de β1

    Las hipótesis respecto\(β_1\) pueden probarse utilizando los mismos procedimientos de cinco pasos, ya sea el enfoque de valor crítico o el enfoque\(p\) -valor, que se introdujeron en la Sección 8.1 y Sección 8.3. La hipótesis nula siempre tiene la forma\(H_0: \beta _1=B_0\) donde\(B_0\) es un número determinado a partir de la enunciación del problema. Las tres formas de la hipótesis alternativa, con la terminología para cada caso, son:

    Forma de\(H_a\) Terminología
    \ (H_a\)” style="text-align:center;” class="lt-stats-546">\(H_a: \beta _1<B_0\) Cola izquierda
    \ (H_a\)” style="text-align:center;” class="lt-stats-546">\(H_a: \beta _1>B_0\) Cola derecha
    \ (H_a\)” style="text-align:center;” class="lt-stats-546">\(H_a: \beta _1\neq B_0\) Dos colas

    El valor cero para\(B_0\) es de particular importancia ya que en ese caso lo es la hipótesis nula\(H_0: \beta _1=0\), que corresponde a la situación en la que no\(x\) es útil para predecir\(y\). Porque si\(β_1=0\) entonces la línea de regresión poblacional es horizontal, entonces la media\(E(y)\) es la misma para cada valor de\(x\) y estamos igual de bien en ignorar\(x\) completamente y aproximarnos\(y\) por su valor promedio. Dadas dos variables\(x\) y\(y\), la carga de la prueba\(x\) es que es útil para predecir\(y\), no que no lo sea. Así, la frase “probar si\(x\) es útil para la predicción de”\(y\), o palabras a tal efecto, significa realizar la prueba

    \[H_0: \beta _1=0\; \; \text{vs.}\; \; H_a: \beta _1\neq 0\]

    Estadístico de prueba estandarizado para pruebas de hipótesis relativas a la pendiente\(β_1\) of the Population Regression Line

    \[T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}\]

    El estadístico de prueba tiene la\(t\) distribución de Student con\(df=n-2\) grados de libertad.

    Deben sostenerse los supuestos enumerados en la Sección 10.3.

    Ejemplo\(\PageIndex{3}\)

    Probar, a\(2\%\) nivel de significancia, si la variable\(x\) es útil para predecir con\(y\) base en la información del conjunto de datos de cinco puntos

    \[\begin{array}{c|c c c c c} x & 2 & 2 & 6 & 8 & 10 \\ \hline y &0 &1 &2 &3 &3\\ \end{array} \nonumber\]

    Solución:

    Realizaremos la prueba utilizando el enfoque de valor crítico.

    • Paso 1. Dado que\(x\) es útil para predecir\(y\) precisamente cuando la pendiente\(β_1\) de la línea de regresión poblacional es distinta de cero, la prueba relevante es\[H_0: \beta _1=0\\ \text{vs.}\\ H_a: \beta _1\neq 0\; \; @\; \; \alpha =0.02 \nonumber\]
    • Paso 2. El estadístico de prueba es\[T=\frac{\hat{\beta _1}}{S_\varepsilon /\sqrt{SS_{xx}}}\] y tiene la\(t\) distribución de Student con\(n-2=5-2=3\) grados de libertad.
    • Paso 3. Del Ejemplo 10.4.1,\(β_1=0.34375 \) y\(SS_{xx}=51.2\). De “Ejemplo\(\PageIndex{1}\) “,\(S_\varepsilon =0.50\). Por lo tanto, el valor del estadístico de prueba es\[T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}=\frac{0.34375}{0.50/\sqrt{51.2}}=4.919 \nonumber\]
    • Paso 4. Dado que el símbolo en\(H_a\) es “\(\neq\)” esta es una prueba de dos colas, por lo que hay dos valores críticos\(\pm t_{\alpha /2}=\pm t_{0.01}\). Lectura de la línea en la Figura 7.1.6 etiquetada\(df=3\),\(t_{0.01}=4.541\). La región de rechazo es\[(-\infty ,-4.541]\cup [4.541,\infty ) \nonumber\].
    • Paso 5. Como se muestra en la Figura\(\PageIndex{1}\) “Región de Rechazo y Estadística de Prueba para” el estadístico de prueba cae en la región de rechazo. La decisión es rechazar\(H_0\). En el contexto del problema nuestra conclusión es:

    Los datos proporcionan evidencia suficiente, a\(2\%\) nivel de significancia, para concluir que la pendiente de la línea de regresión poblacional es distinta de cero, por lo que\(x\) es útil como predictor de\(y\).

    alt
    Figura\(\PageIndex{1}\): Región de rechazo y estadística de prueba por ejemplo\(\PageIndex{3}\)

    Ejemplo\(\PageIndex{4}\)

    Un vendedor de autos afirma que los automóviles de entre dos y seis años de edad de la marca y modelo discutidos en el Ejemplo 10.4.2 pierden más que\(\$1,100\) en valor cada año. Pruebe esta afirmación a\(5\%\) nivel de significancia.

    Solución:

    Realizaremos la prueba utilizando el enfoque de valor crítico.

    • Paso 1. En cuanto a las variables\(x\) y\(y\), el reclamo del vendedor es que si\(x\) se incrementa por\(1\) unidad (un año adicional en edad), entonces\(y\) disminuye en más de\(1.1\) unidades (más de\(\$1,100\)). Así su aseveración es que la pendiente de la línea de regresión poblacional es negativa, y que es más negativa que\(-1.1\). En símbolos,\(β_1<-1.1\). Al contener una desigualdad, ésta tiene que ser la hipótesis alternativa. La hipótesis nula tiene que ser una igualdad y tener el mismo número en el lado derecho, por lo que la prueba relevante es\[H_0: \beta _1=-1.1\\ \text{vs.}\\ H_a: \beta _1<-1.1\; \; @\; \; \alpha =0.05 \nonumber\]
    • Paso 2. El estadístico de prueba es\[T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}\] y tiene la\(t\) distribución de Student con\(8\) grados de libertad.
    • Paso 3. Del Ejemplo 10.4.2,\(β_1=-2.05\) y\(SS_{xx}=14\). De “Ejemplo\(\PageIndex{2}\) “,\(S_\varepsilon =1.902169814\). Por lo tanto, el valor del estadístico de prueba es\[T=\frac{\hat{\beta _1}-B_0}{S_\varepsilon /\sqrt{SS_{xx}}}=\frac{-2.05-(-1.1)}{1.902169814/\sqrt{14}}=-1.869 \nonumber\]
    • Paso 4. Dado que el símbolo en\(H_a\) es “\(<\)” esta es una prueba de cola izquierda, por lo que hay un solo valor crítico\(-t_{\alpha /2}=-t_{0.05}\). Lectura de la línea en la Figura 7.1.6 etiquetada\(df=8\),\(t_{0.05}=1.860\). La región de rechazo es\[(-\infty ,-1.860] \nonumber\].
    • Paso 5. Como se muestra en la Figura\(\PageIndex{2}\) “Región de Rechazo y Estadística de Prueba para" el estadístico de prueba cae en la región de rechazo. La decisión es rechazar\(H_0\). En el contexto del problema nuestra conclusión es:

    Los datos proporcionan evidencia suficiente, a\(5\%\) nivel de significancia, para concluir que los vehículos de esta marca y modelo y en este rango de edad pierden más de\(\$1,100\) por año en valor, en promedio.

    alt
    Figura\(\PageIndex{2}\): Región de rechazo y estadística de prueba para “Ejemplo\(\PageIndex{4}\)

    Llave para llevar

    • El parámetro\(β_1\), la pendiente de la línea de regresión poblacional, es de interés primario porque describe el cambio promedio\(y\) con respecto al incremento unitario en\(x\).
    • El estadístico\(\hat{β}_1\), la pendiente de la línea de regresión de mínimos cuadrados, es una estimación puntual de\(β_1\). Los intervalos de confianza para se\(β_1\) pueden calcular usando una fórmula.
    • Las hipótesis relativas\(β_1\) se prueban utilizando los mismos procedimientos de cinco pasos introducidos en el Capítulo 8.

    This page titled 10.5: Inferencias estadísticas Acerca de β1 is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by via source content that was edited to the style and standards of the LibreTexts platform.