Saltar al contenido principal
LibreTexts Español

9.1: Introducción a las distribuciones de muestreo

  • Page ID
    152461
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    • Definir estadísticas inferenciales
    • Graficar una distribución de probabilidad para la media de una variable discreta
    • Describir una distribución de muestreo en términos de “todos los resultados posibles”
    • Describir una distribución de muestreo en términos de muestreo repetido
    • Describir el papel de las distribuciones de muestreo en la estadística inferencial
    • Definir el error estándar de la media

    Supongamos que tomó muestras al azar de\(10\) personas de la población de mujeres en Houston, Texas, entre las edades de\(21\) y\(35\) años y computó la altura media de su muestra. No esperarías que tu muestra signifique ser igual a la media de todas las mujeres en Houston. Podría ser algo más baja o podría ser algo más alta, pero no igualaría exactamente la media poblacional. De igual manera, si tomaras una segunda muestra de\(10\) personas de la misma población, no esperarías que la media de esta segunda muestra iguale la media de la primera muestra.

    Recordemos que las estadísticas inferenciales se refieren a generalizar de una muestra a una población. Una parte crítica de las estadísticas inferenciales implica determinar hasta qué punto es probable que las estadísticas de la muestra varíen entre sí y del parámetro poblacional. (En este ejemplo, las estadísticas muestrales son las medias muestrales y el parámetro poblacional es la media poblacional). Como muestran las últimas porciones de este capítulo, estas determinaciones se basan en distribuciones de muestreo.

    Distribuciones Discretas

    Ilustraremos el concepto de distribuciones de muestreo con un ejemplo sencillo. La figura\(\PageIndex{1}\) muestra tres bolas de billar, cada una con un número en ella. Dos de las bolas se seleccionan aleatoriamente (con reemplazo) y se calcula el promedio de sus números.

    aproximación normal al binomio
    Figura\(\PageIndex{1}\): Las bolas de la piscina

    Todos los resultados posibles se muestran a continuación en la Tabla\(\PageIndex{1}\).

    Tabla\(\PageIndex{1}\): Todos los resultados posibles cuando se muestrean dos bolas con reemplazo
    Resultado Bola 1 Bola 2 Media
    1 1 1 1.0
    2 1 2 1.5
    3 1 3 2.0
    4 2 1 1.5
    5 2 2 2.0
    6 2 3 2.5
    7 3 1 2.0
    8 3 2 2.5
    9 3 3 3.0

    Observe que todos los medios son o bien\(1.0\)\(1.5\),\(2.0\),,\(2.5\), o\(3.0\). Las frecuencias de estas medias se muestran en la Tabla\(\PageIndex{2}\). Las frecuencias relativas son iguales a las frecuencias divididas por nueve porque hay nueve posibles resultados.

    Tabla\(\PageIndex{2}\): Frecuencias de medias para\(N = 2\)
    Media Frecuencia Frecuencia relativa
    1.0 1 0.111
    1.5 2 0.222
    2.0 3 0.333
    2.5 2 0.222
    3.0 1 0.111

    La figura\(\PageIndex{2}\) muestra una distribución de frecuencia relativa de las medias con base en la Tabla\(\PageIndex{2}\). Esta distribución es también una distribución de probabilidad ya que el\(Y\) eje -es la probabilidad de obtener una media dada a partir de una muestra de dos bolas además de ser la frecuencia relativa.

    aproximación normal al binomio
    Figura\(\PageIndex{2}\): Distribución de medias para\(N = 2\)

    La distribución mostrada en la Figura\(\PageIndex{2}\) se denomina distribución muestral de la media. Específicamente, es la distribución muestral de la media para un tamaño muestral de\(2\) (\(N = 2\)). Para este sencillo ejemplo, la distribución de bolas de piscina y la distribución de muestreo son ambas distribuciones discretas. Las bolas de alberca tienen solo los valores\(1\),\(2\), y\(3\), y una media muestral puede tener uno de solo cinco valores mostrados en la Tabla\(\PageIndex{2}\).

    Existe una forma alternativa de conceptualizar una distribución de muestreo que será útil para distribuciones más complejas. Imagínese que se muestrean dos bolas (con reemplazo) y se calcula y registra la media de las dos bolas. Entonces este proceso se repite para una segunda muestra, una tercera muestra y eventualmente miles de muestras. Después de tomar miles de muestras y calcular la media para cada una, se dibuja una distribución de frecuencia relativa. Cuantas más muestras, más cerca se acercará la distribución de frecuencia relativa a la distribución de muestreo que se muestra en la Figura\(\PageIndex{2}\). A medida que el número de muestras se acerca al infinito, la distribución de frecuencia relativa se aproximará a la distribución de muestreo. Esto significa que se puede concebir una distribución de muestreo como una distribución de frecuencia relativa basada en un número muy grande de muestras. Para ser estrictamente correctos, la distribución de frecuencia relativa se acerca a la distribución de muestreo a medida que el número de muestras se acerca al infinito.

    Tabla\(\PageIndex{3}\): Todos los resultados posibles cuando se muestrean dos bolas con reemplazo
    Resultado Bola 1 Bola 2 Rango
    1 1 1 0
    2 1 2 1
    3 1 3 2
    4 2 1 1
    5 2 2 0
    6 2 3 1
    7 3 1 2
    8 3 2 1
    9 3 3 0

    Es importante tener en cuenta que cada estadística, no solo la media, tiene una distribución muestral. Por ejemplo, la Tabla\(\PageIndex{3}\) muestra todos los resultados posibles para el rango de dos números (número mayor menos el número menor). El cuadro\(\PageIndex{4}\) muestra las frecuencias para cada uno de los rangos posibles y la Figura\(\PageIndex{3}\) muestra la distribución de muestreo del rango.

    Tabla\(\PageIndex{4}\): Frecuencias de rangos para\(N = 2\)
    Rango Frecuencia Frecuencia relativa
    0 3 0.333
    1 4 0.444
    2 2 0.222
    freq_range.jpg
    Figura\(\PageIndex{3}\): Distribución de rangos para\(N = 2\)

    También es importante tener en cuenta que existe una distribución de muestreo para varios tamaños de muestra. Por simplicidad, hemos estado usando\(N = 2\). La distribución muestral del rango para\(N = 3\) se muestra en la Figura\(\PageIndex{4}\).

    freq_range_3.jpg
    Figura\(\PageIndex{4}\): Distribución de rangos para\(N = 3\)

    Distribuciones continuas

    En el apartado anterior, la población constaba de tres bolas de billar. Ahora consideraremos distribuciones de muestreo cuando la distribución poblacional sea continua. ¿Y si tuviéramos mil bolas de billar con números que van desde\(0.001\) hasta\(1.000\) en pasos iguales? (Aunque esta distribución no es realmente continua, es lo suficientemente cercana como para ser considerada continua para fines prácticos). Como antes, nos interesa la distribución de los medios que obtendríamos si muestreáramos dos bolas y calculáramos la media de estas dos bolas. En el ejemplo anterior, comenzamos calculando la media para cada uno de los nueve posibles resultados. Esto se pondría un poco tedioso para este ejemplo ya que hay\(1,000,000\) posibles resultados (\(1,000\)para la primera bola x\(1,000\) para la segunda). Por lo tanto, es más conveniente utilizar nuestra segunda conceptualización de distribuciones de muestreo que concibe distribuciones de muestreo en términos de distribuciones de frecuencia relativa. Específicamente, la distribución de frecuencia relativa que ocurriría si se tomaran repetidamente muestras de dos bolas y se computara la media de cada muestra.

    Cuando tenemos una distribución verdaderamente continua, no solo es poco práctico sino realmente imposible enumerar todos los resultados posibles. Además, en distribuciones continuas, la probabilidad de obtener cualquier valor único es cero. Por lo tanto, como se discute en la sección “Introducción a las distribuciones”, estos valores se denominan densidades de probabilidad en lugar de probabilidades.

    Distribuciones de Muestreo y Estadística Inferencial

    Como señalamos al inicio de este capítulo, las distribuciones de muestreo son importantes para las estadísticas inferenciales. En los ejemplos dados hasta el momento, se especificó una población y se determinó la distribución muestral de la media y el rango. En la práctica, el proceso avanza de otra manera: se recopilan datos de muestra y a partir de estos datos se estiman parámetros de la distribución de muestreo. Este conocimiento de la distribución muestral puede ser muy útil. Por ejemplo, conocer el grado en que medias de diferentes muestras diferirían entre sí y de la media poblacional le daría una idea de lo cerca que es probable que esté su media de muestra particular de la media de la población. Afortunadamente, esta información está directamente disponible a partir de una distribución de muestreo. La medida más común de la diferencia entre las medias de la muestra es la desviación estándar de la distribución muestral de la media. Esta desviación estándar se llama el error estándar de la media. Si todas las medias de la muestra estuvieran muy cerca de la media poblacional, entonces el error estándar de la media sería pequeño. Por otro lado, si las medias muestrales variaban considerablemente, entonces el error estándar de la media sería grande.

    Para ser específicos, suponga que su media muestral fueron\(125\) y estimó que el error estándar de la media fueron\(5\) (usando un método mostrado en una sección posterior). Si tuvieras una distribución normal, entonces sería probable que la media de tu muestra estuviera dentro de\(10\) las unidades de la media poblacional ya que la mayor parte de una distribución normal está dentro de dos desviaciones estándar de la media.

    Tenga en cuenta que todas las estadísticas tienen distribuciones de muestreo, no solo la media. En secciones posteriores discutiremos la distribución muestral de la varianza, la distribución muestral de la diferencia entre medias y la distribución muestral de la correlación de Pearson, entre otras.


    This page titled 9.1: Introducción a las distribuciones de muestreo is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.