1.1: Fundamentos estadísticos
- Page ID
- 110063
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Los datos están a nuestro alrededor. Los investigadores recopilan datos sobre la efectividad de un medicamento para bajar el colesterol. Los encuestadores informan sobre el porcentaje de estadounidenses que apoyan el control de armas. Los economistas reportan sobre el salario promedio de los egresados universitarios. Hay muchas otras áreas donde se recopilan datos. Para poder entender los datos y cómo resumirlos, necesitamos entender las estadísticas.
Supongamos que quiere conocer el patrimonio neto promedio de un senador estadounidense actual. Hay 100 Senadores, por lo que no es tan difícil recolectar todos los 100 valores, para luego resumir los datos. Si en cambio quieres encontrar el patrimonio neto promedio de todos los Senadores y Representantes actuales en el Congreso de Estados Unidos, solo hay 435 miembros del Congreso. Entonces, aunque va a ser un poco más de trabajo, no es tan difícil encontrar el patrimonio neto promedio de todos los miembros. Ahora suponga que quiere encontrar el patrimonio neto promedio de todos en Estados Unidos. Esto sería muy difícil, si no imposible. Tomaría mucho tiempo y dinero recopilar la información de manera oportuna antes de que todos los valores hayan cambiado. Entonces, en lugar de obtener el patrimonio neto de cada estadounidense, tenemos que encontrar una manera más fácil de encontrar esta información. El patrimonio neto es lo que se quiere medir, y se llama una variable. El patrimonio neto de cada estadounidense se llama población. Lo que tenemos que hacer es recolectar una parte menor de la población, llamada muestra. Para ver cómo funciona esto, formalicemos las definiciones.
Variable: Cualquier característica que se mide a partir de un objeto o individuo.
Población: Un conjunto de mediciones u observaciones de todos los objetos bajo estudio
Muestra: Un conjunto de mediciones u observaciones de algunos objetos en estudio (un subconjunto de una población)
Ejemplo\(\PageIndex{1}\): Declarar poblaciones y muestras
Determinar la población y muestra para cada situación.
- Un investigador quiere determinar la duración del ciclo de vida de un escarabajo de la corteza. Para ello, cría 1000 escarabajos de la corteza y mide el tiempo desde el nacimiento hasta la muerte para cada escarabajo de la corteza.
Población: El conjunto de longitudes del ciclo de vida de todos los escarabajos de la corteza
Muestra: El conjunto de longitudes del ciclo de vida de 1000 escarabajos de corteza
- La Asociación Nacional del Rifle quiere saber qué porcentaje de estadounidenses apoya el derecho a portar armas. Preguntan a 2500 estadounidenses si apoyan el derecho a portar armas.
Población: El conjunto de respuestas de todos los estadounidenses a la pregunta: “¿Apoya el derecho a portar armas?”
Muestra: El conjunto de respuestas de 2500 estadounidenses a la pregunta, “¿Apoya el derecho a portar armas?”
- El Pew Research Center preguntó a 1000 madres en Estados Unidos cuál era su nivel educativo más alto alcanzado.
Población: El conjunto de niveles educativos más altos de todas las madres en Estados Unidos
Muestra: El conjunto de más alto nivel educativo de 1000 madres en Estados Unidos
Es muy importante que entiendas lo que estás tratando de medir antes de medirlo realmente. También, tenga en cuenta que la población es un conjunto de mediciones u observaciones, y no un conjunto de personas. Si dices que la población es toda norteamericana, entonces sólo has dado parte de la historia. Más importante es lo que estás midiendo de todos los estadounidenses. La pregunta es, ¿quieres medir su raza, su color de ojos, sus ingresos, su nivel educativo, el número de hijos que tienen u otras variables? Por lo tanto, es muy importante exponer lo que midió u observó, y de quién o cuáles se tomaron las medidas u observaciones. Una vez que sepas lo que quieres medir u observar, y la fuente de la que quieres tomar medidas u observaciones, necesitas recolectar los datos.
Un conjunto de datos es una colección de valores llamados puntos de datos o valores de datos. N representa el número de puntos de datos en una población, mientras que n representa el número de puntos de datos en una muestra. Un valor de datos que es mucho mayor o menor que todos los demás valores de datos se denomina un valor atípico. A veces los valores atípicos son solo valores de datos inusuales que son muy interesantes y deben estudiarse más a fondo, y a veces son errores. Tendrás que averiguar cuál es cuál.
Para recabar los datos, tenemos que entender los tipos de variables que podemos recopilar. En realidad hay dos tipos diferentes de variables. Uno se llama cualitativo y el otro se llama cuantitativo.
Variable cualitativa (categórica): Variable que representa una característica. Las variables cualitativas no son inherentemente números, por lo que no se pueden agregar, multiplicar o promediar, sino que se pueden representar gráficamente con gráficos como un gráfico de barras.
Ejemplos: género, color de pelo, raza, nacionalidad, religión, grado del curso, año universitario, etc.
Variable cuantitativa (numérica): Variable que representa una cantidad medible. Las variables cuantitativas son inherentemente números, por lo que pueden agregarse, multiplicarse, promediarse y mostrarse gráficamente.
Ejemplos: Altura, peso, número de gatos poseídos, puntuación de un partido de fútbol, etc.
Las variables cuantitativas pueden subdividirse en otras categorías: continuas y discretas.
Variable continua: Variable que puede tomar un número incontable de valores en un rango. En otras palabras, la variable puede ser cualquier número en un rango de valores. Las variables continuas suelen ser cosas que se miden.
Ejemplos: Altura, peso, talla del pie, tiempo para realizar una prueba, longitud, etc.
Variable discreta: Una variable que puede tomar solo valores específicos en un rango. Las variables discretas suelen ser cosas que cuentas.
Ejemplos: coeficiente intelectual, talla de zapatos, talla familiar, número de gatos poseídos, puntuación en un partido de fútbol, etc.
Ejemplo\(\PageIndex{2}\): Determinación de Tipos de Variables
Determinar si cada variable es cuantitativa o cualitativa. Si es cuantitativo, entonces también determina si es continuo o discreto.
- Duración de la carrera
Cuantitativa y continua, ya que esta variable es un número y puede tomar cualquier valor en un intervalo.
- Opinión de una persona sobre el Presidente
Cualitativa, ya que esta variable no es un número.
- Color de la casa en un barrio
Cualitativa, ya que esta variable no es un número.
- Número de casas que se encuentran en ejecución hipotecaria en un estado
Cuantitativa y discreta, ya que esta variable es un número pero sólo puede ser ciertos valores en un intervalo.
- Peso de un bebé al nacer
Cuantitativa y continua, ya que esta variable es un número y puede tomar cualquier valor en un intervalo.
- Nivel de educación más alto de una madre
Cualitativa, ya que la variable no es un número.