Saltar al contenido principal

# 13.1.5: Significancia estadística

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

Frecuentemente, las conclusiones de las generalizaciones inductivas son afirmaciones estadísticas simples. Nuestra premisa es “x por ciento de la muestra es la-de-da”. De esto concluimos: “El mismo porcentaje de la población también lo es”. Cuando el argumento es inductivamente fuerte, los estadísticos dicen que el porcentaje es estadísticamente significativo porque este estadístico es uno que muy probablemente no se deba al azar. El número no necesita ser significativo en el sentido de ser importante; ese es el sentido no técnico de la palabra significativo.

Supongamos que estás interesado en determinar el porcentaje de zurdos en el mundo, y no estás dispuesto a confiar en los resultados de otras personas que han adivinado este porcentaje. A menos que tengas una visión profunda de la base genética de la zurda, tendrás que obtener tu respuesta a partir del muestreo. Tendrás que tomar una muestra y usar la fracción de personas en tu muestra que son zurdas como tu suposición del valor del número objetivo. El número objetivo es lo que los estadísticos llaman un parámetro. El número que usas para adivinar el parámetro se llama estadística. Su estadística tendrá que cumplir con estándares más altos cuanto más seguro debe estar de que es una estimación confiable del parámetro.

Una vez le dije a mi hijo Josué de siete años que era inusual porque era zurdo. Eso le sorprendió, por lo que decidió comprobar si estaba en lo cierto. En la sofisticada terminología de la estadística matemática, diríamos que el objetivo de Joshua era determinar si un determinado parámetro, el porcentaje de zurdos en todo el mundo, es mucho menor al 50 por ciento. Esto es lo que Josué hizo para adquirir una estadística para usar para estimar el parámetro. Dijo: “Eres zurdo, papá. Mamá y mi hermanita no lo son. Eso es dos y dos”. Lo que Josué acababa de hacer, más o menos, era tomar una muestra de cuatro de la vasta población de la Tierra, descubrir que dos de los cuatro son zurdos, y luego calcular la estadística del 50 por ciento como su suposición del parámetro. Un estadístico diría que la estadística de Josué no es significativa porque la muestra es demasiado pequeña. Si Josué tomara una muestra más grande, la afirmación estadística resultante sería más creíble.

Entonces Joshua se dispuso a obtener una muestra más grande. Preguntó a todos los niños de su clase en la escuela si eran zurdos. Dos de veintidós. También dio la vuelta al barrio preguntando a quien pudiera. El nuevo resultado de casa, escuela y barrio fue de siete zurdos de treinta y siete. Esta estadística es más apta para ser significativa, y es mucho menor al 50 por ciento. La moraleja aquí es que cuanto mayor sea el tamaño de la muestra, más seguro puede estar de que el estadístico calculado es estadísticamente significativo. Cuanto más muestreo, menos probable es que el resultado se deba al azar. Los patrones que aparecen en muestras pequeñas pueden desaparecer a medida que crece el tamaño de la muestra; se puede demostrar que son coincidentes. Los patrones significativos y las estadísticas significativas son aquellos que probablemente no sean accidentales o coincidentes; es probable que se encuentren ciertos al examinar más de la población objetivo.

Todavía no hemos respondido a la pregunta de si la estadística de Josué de 7/37 es estadísticamente significativa. ¿Lo es? Definitivamente es una mejor suposición que 2/4, pero para calcular si es significativo se requiere de algún razonamiento sofisticado que involucre fórmulas complejas sobre márgenes de error y niveles de confianza, que no vamos a perseguir aquí. Podemos, sin embargo, bosquejar tres características de la respuesta.

Primero, el margen de error: Tenemos que decidir qué tan precisos queremos que sea nuestra suposición. ¿Podemos estar satisfechos con una precisión de más o menos 10 por ciento, o necesitamos un margen menor, digamos más o menos 1 por ciento? Segundo, el nivel de confianza. ¿Estamos dispuestos a estar tan solo 95 por ciento seguros de que tenemos la respuesta correcta, incluso permitiendo el margen de error? ¿O debemos estar 99 por ciento seguros? Siendo todas las demás cosas iguales, cuanto más confiados necesitamos estar, menos significativas serán las estadísticas que hayamos reunido. Tercero, ¿qué tan sesgado fue el muestreo? ¿Fue al azar? ¿Fue diverso? El tamaño de la población normalmente no es algo que deba tenerse en cuenta si la población es grande en comparación con el tamaño de la muestra.

This page titled 13.1.5: Significancia estadística is shared under a not declared license and was authored, remixed, and/or curated by Bradley H. Dowden.