13.8: Práctica de Capítulo
- Page ID
- 151041
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)13.1 El coeficiente de correlación r
1.
Para tener un coeficiente de correlación entre rasgos\(A\) y\(B\), es necesario tener:
- un grupo de sujetos, algunos de los cuales poseen características de rasgo\(A\), el resto poseen los de rasgo\(B\)
- medidas de rasgo\(A\) en un grupo de sujetos y de rasgo\(B\) en otro grupo
- dos grupos de sujetos, uno que podría clasificarse como\(A\) o no\(A\), el otro como\(B\) o no\(B\)
- dos grupos de sujetos, uno que podría clasificarse como\(A\) o no\(A\), el otro como\(B\) o no\(B\)
Definir el Coeficiente de Correlación y dar un ejemplo único de su uso.
3.Si la correlación entre la antigüedad de un automóvil y el dinero gastado en reparaciones es +.90
- El 81% de la variación en el dinero gastado en reparaciones se explica por la antigüedad del auto
- 81% del dinero gastado en reparaciones es inexplicable por la antigüedad del auto
- El 90% del dinero gastado en reparaciones se explica por la antigüedad del auto
- ninguno de los anteriores
Supongamos que el promedio del punto de grado universitario y la porción verbal de una prueba de coeficiente intelectual tenían una correlación de .40. ¿Qué porcentaje de varianza tienen en común estos dos?
5.¿Verdadero o falso? Si es falso, explique por qué: El coeficiente de determinación puede tener valores entre -1 y +1.
6.Verdadero o Falso: Siempre que r se calcula sobre la base de una muestra, el valor que obtenemos para r es sólo una estimación del coeficiente de correlación verdadero que obtendríamos si lo calculáramos para toda la población.
7.Bajo un “diagrama de dispersión” hay una notación de que el coeficiente de correlación es .10. ¿Qué significa esto?
- más y menos 10% de las medias incluye alrededor del 68% de los casos
- una décima parte de la varianza de una variable se comparte con la otra variable
- una décima parte de una variable es causada por la otra variable
- en una escala de -1 a +1, el grado de relación lineal entre las dos variables es +.10
El coeficiente de correlación para\(X\) y\(Y\) se sabe que es cero. Entonces podemos concluir que:
- X y\(Y\) tienen distribuciones estándar
- las variaciones de\(X\) y\(Y\) son iguales
- no existe relación entre\(X\) e Y
- no existe una relación lineal entre\(X\) e Y
- ninguno de estos
¿Cuál adivinarías que sería el valor del coeficiente de correlación para el par de variables: “número de horas-hombre trabajadas” y “número de unidades de trabajo completadas”?
- Aproximadamente 0.9
- Aproximadamente 0.4
- Aproximadamente 0.0
- Aproximadamente -0.4
- Aproximadamente -0.9
En un grupo dado, la correlación entre la altura medida en pies y el peso medido en libras es de +.68. ¿Cuál de los siguientes alteraría el valor de r?
13.2 Prueba de la significancia del coeficiente de correlación
11.
Definir una\(t\) Prueba de un Coeficiente de Regresión, y dar un ejemplo único de su uso.
12.La correlación entre las puntuaciones en una prueba de neuroticismo y las puntuaciones en una prueba de ansiedad es alta y positiva; por lo tanto
13.3 Ecuaciones Lineales
13.
¿Verdadero o Falso? Si es False, corríjalo: Supongamos que un intervalo de confianza\(\beta\) del 95% para la pendiente de la regresión en línea recta de\(Y\) on\(X\) viene dado por\(-3.5 < \beta < -0.5\). Entonces, una prueba bilateral de la hipótesis\(H_{0} : \beta=-1\) resultaría en un rechazo de\(H_0\) al nivel de significancia del 1%.
14.Verdadero o Falso: Es más seguro interpretar los coeficientes de correlación como medidas de asociación en lugar de causalidad debido a la posibilidad de correlación espuria.
15.Nos interesa encontrar la relación lineal entre el número de widgets comprados a la vez y el costo por widget. Se han obtenido los siguientes datos:
\(X\): Número de widgets comprados — 1, 3, 6, 10, 15
\(Y\): Costo por widget (en dólares) — 55, 52, 46, 32, 25
Supongamos que la línea de regresión es\(\hat{y}=-2.5 x+60\). Calculamos el precio promedio por widget si se compran 30 y observamos cuál de los siguientes?
- \(\hat{y}=15 \text { dollars }\); obviamente, estamos equivocados; la predicción\(\hat y\) es en realidad +15 dólares.
- \(\hat{y}=15 \text { dollars }\), lo que parece razonable a juzgar por los datos.
- \ (\ hat {y} =-15\ text {dolares}\, lo cual es una tontería obvia. La línea de regresión debe ser incorrecta.
- \(\hat{y}=-15 \text { dollars }\), lo cual es una tontería obvia. Esto nos recuerda que predecir\(Y\) fuera del rango de\(X\) valores en nuestros datos es una práctica muy mala.
Discutir brevemente la distinción entre correlación y causalidad.
17.Verdadero o Falso: Si\(r\) está cerca de + o -1, diremos que hay una fuerte correlación, con el entendimiento tácito de que nos estamos refiriendo a una relación lineal y nada más.
13.4 La ecuación de regresión
18.
Supongamos que tiene a su disposición la siguiente información para cada uno de los 30 conductores. Proponer un modelo (incluyendo una indicación muy breve de símbolos utilizados para representar variables independientes) para explicar cómo las millas por galón varían de conductor a conductor en base a los factores medidos.
Información:
- millas conducidas por día
- peso del carro
- número de cilindros en el coche
- velocidad media
- millas por galón
- número de pasajeros
Considere un análisis de regresión de mínimos cuadrados de muestra entre una variable dependiente (\(Y\)) y una variable independiente (\(X\)). Un coeficiente de correlación muestral de −1 (menos uno) nos dice que
- no hay relación entre\(Y\) y\(X\) en la muestra
- no hay relación entre\(Y\) y\(X\) en la población
- existe una perfecta relación negativa entre\(Y\) y\(X\) en la población
- existe una perfecta relación negativa entre\(Y\) y\(X\) en la muestra.
En el análisis correlacional, cuando los puntos se dispersan ampliamente alrededor de la línea de regresión, esto significa que la correlación es
13.5 Interpretación de los coeficientes de regresión: elasticidad y transformación logarítmica
21.
En una regresión lineal, ¿por qué necesitamos preocuparnos por el rango de la variable independent (\(X\))?
22.Supongamos que se recoge la siguiente información donde\(X\) está el diámetro del tronco del árbol y\(Y\) es la altura del árbol.
\ (\ PageIndex {3}\) “>X | Y |
4 | 8 |
2 | 4 |
8 | 18 |
6 | 22 |
10 | 30 |
6 | 8 |
Ecuación de regresión:\(\hat{y}_{i}=-3.6+3.1 \cdot X_{i}\)
¿Cuál es su estimación de la altura promedio de todos los árboles que tienen un diámetro de tronco de 7 pulgadas?
23.Los fabricantes de un químico utilizado en los collares antipulgas afirman que bajo condiciones de prueba estándar cada unidad adicional del químico provocará una reducción de 5 pulgas (es decir, dónde\(X_{j}=\text { amount of chemical }\) y\(Y_{J}=B_{0}+B_{1} \cdot X_{J}+E_{J}\),\(H_0:B_1=−5\)
Supongamos que se ha realizado una prueba y los resultados de una computadora incluyen:
Intercepción = 60
Pendiente = −4
Error estándar del coeficiente de regresión = 1.0
Grados de Libertad por Error = 2000
Intervalo de confianza del 95% para la pendiente −2.04, −5.96
¿Esta evidencia es consistente con la afirmación de que el número de pulgas se reduce a razón de 5 pulgas por unidad química?
13.6 Predecir con una ecuación de regresión
24.
¿Verdadero o Falso? Si es False, corríjala: Supongamos que está realizando una regresión lineal simple de\(Y\) on\(X\) y prueba la hipótesis de que la pendiente\(\beta\) es cero frente a una alternativa bilateral. Tienes\(n=25\) observaciones y tu estadística de test computado (\(t\)) es 2.6. Entonces su valor P viene dado por\(.01 < P < .02\), lo que le da un significado límite (es decir, rechazaría\(H_0\) en\(\alpha=.02\) pero no rechazaría\(H_0\) en\(\alpha=.01\)).
25.A un economista le interesa la posible influencia del “Trigo Milagro” en el rendimiento promedio del trigo en un distrito. Para ello ajusta una regresión lineal de rendimiento promedio por año contra año tras la introducción de “Milagro Trigo” por un periodo de diez años.
La línea de tendencia ajustada es
\(\hat{y}_{j}=80+1.5 \cdot X_{j}\)
(\(Y_j\): Rendimiento promedio en el\(j\) año posterior a la introducción)
(\(X_j\):\(j\) año después de la introducción).
- ¿Cuál es el rendimiento promedio estimado para el cuarto año después de la introducción?
- ¿Quieres utilizar esta línea de tendencia para estimar el rendimiento durante, digamos, 20 años después de la introducción? ¿Por qué? ¿Cuál sería tu estimación?
Una interpretación de\(r=0.5\) es que la siguiente parte de la\(Y\) -variación está asociada con la cual variación en\(X\):
27.¿Cuál de los siguientes valores\(r\) indica la predicción más precisa de una variable a partir de otra?
- \(r=1.18\)
- \(r=−.77\)
- \(r=.68\)
13.7 Cómo usar Microsoft Excel® para el análisis de regresión
28.
Se ha utilizado para ajustar un programa de computadora para regresión múltiple\(\hat{y}_{j}=b_{0}+b_{1} \cdot X_{1 j}+b_{2} \cdot X_{2 j}+b_{3} \cdot X_{3 j}\).
Parte de la salida de la computadora incluye:
\ (\ PageIndex {4}\) “>i | \(b_i\) | \(S_{b_i}\) |
0 | 8 | 1.6 |
1 | 2.2 | .24 |
2 | -.72 | .32 |
3 | 0.005 | 0.002 |
- El cálculo del intervalo de confianza para\(b_2\) consiste en _______\(\pm\) (el\(t\) valor de un estudiante) (_______)
- El nivel de confianza para este intervalo se refleja en el valor utilizado para _______.
- Los grados de libertad disponibles para estimar la varianza están directamente relacionados con el valor utilizado para _______
Un investigador ha utilizado un programa de regresión múltiple en 20 puntos de datos para obtener una ecuación de regresión con 3 variables. Parte de la salida de la computadora es:
\ (\ PageIndex {5}\) “>Variable | Coeficiente | Error estándar de\(bf{b_i}\) |
1 | 0.45 | 0.21 |
2 | 0.80 | 0.10 |
3 | 3.10 | 0.86 |
- 0.80 es una estimación de ___________.
- 0.10 es una estimación de ___________.
- Suponiendo que las respuestas satisfagan el supuesto de normalidad, podemos estar 95% seguros de que el valor de\(\beta_2\) está en el intervalo, _______ ± [\(t_{.025} \cdot \)_______], donde\(t_{.025}\) está el valor crítico de la distribución t del estudiante con ____ grados de libertad.