Saltar al contenido principal
LibreTexts Español

1.2: Visión general

  • Page ID
    151079
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    • Para obtener una visión general del material en el texto.

    El ejemplo que dimos en la primera sección parece bastante sencillo, pero ilustra algunos problemas significativos. Supusimos que los\(200\) autos de la muestra tenían un valor promedio de\($8,357\) (un número que se conoce con precisión), y concluimos que la población tiene un promedio de aproximadamente la misma cantidad, aunque aún se desconoce su valor preciso. ¿Qué pasaría si alguien más tomara otra muestra exactamente del mismo tamaño de exactamente la misma población? ¿Obtendría el mismo promedio de muestra que nosotros,\($8,357\)? Casi seguro que no. De hecho, si el investigador que tomó la segunda muestra reportara precisamente el mismo valor, inmediatamente desconfiaríamos de su resultado. El promedio muestral es un ejemplo de lo que se llama una variable aleatoria: un número que varía de un ensayo a otro de un experimento (en este caso, de una muestra a otra), y lo hace de una manera que no se puede predecir con precisión. Las variables aleatorias serán un objeto central de estudio para nosotros, comenzando en el Capítulo 4.

    Otro tema que surge es que las diferentes muestras tienen diferentes niveles de confiabilidad. Hemos supuesto que nuestra muestra de tamaño\(200\) tenía un promedio de\($8,357\). Si una muestra de tamaño\(1,000\) arrojara un valor promedio de\($7,832\), entonces naturalmente consideraríamos este último número como probablemente una mejor estimación del valor promedio de todos los automóviles, ya que provino de una muestra mayor. ¿Cómo se puede expresar esto? Una idea importante desarrollada en el Capítulo 7 es el intervalo de confianza: a partir de los datos construiremos un intervalo de valores utilizando un proceso que tenga cierta probabilidad, digamos una\(95\% \) probabilidad, de generar un intervalo que contenga el verdadero promedio poblacional. Así, en lugar de reportar una sola estimación\($8,357\),, para la media poblacional podríamos decir que, con base en nuestros datos de muestra, estamos\(95\% \) seguros de que el promedio verdadero está dentro\($100\) de nuestra media muestral, es decir, estamos\(95\% \) seguros de que el verdadero promedio es el entre\($8,257\) y \($8,457\). El número se\($100\) calculará a partir de los datos de la muestra tal como lo\($8,357\) fue la media de la muestra. Este "intervalo de\(95\% \) confianza” indicará automáticamente la confiabilidad de la estimación que obtuvimos de la muestra. Además, para obtener la misma posibilidad de contener el parámetro desconocido, una muestra grande normalmente producirá un intervalo más corto que una muestra pequeña. Por lo tanto, las muestras grandes suelen dar resultados más precisos. A menos que hagamos un censo, que es una “muestra” que incluye a toda la población, nunca podremos estar completamente seguros del valor promedio exacto de la población. Lo mejor que podemos hacer es hacer declaraciones de probabilidad, concepto importante que comenzaremos a estudiar formalmente en el Capítulo 3.

    El muestreo puede realizarse no sólo para estimar un parámetro poblacional, sino para probar una afirmación que se haga sobre ese parámetro. Supongamos que un paquete de alimentos afirma que la cantidad de azúcar en una porción del producto es de\(14\) gramos. Un grupo de consumidores podría sospechar que en realidad contiene más. ¿Cómo probarían las afirmaciones competidoras sobre la cantidad de azúcar, "\(14\)gramos” versus “más que\(14\) gramos”? Podrían tomar una muestra aleatoria de quizás paquetes de\(20\) alimentos, medir la cantidad de azúcar en una porción de cada uno, y promediar esas cantidades. No les interesa medir la cantidad promedio de azúcar en una porción por su propio bien; su interés es simplemente si la afirmación sobre la cantidad verdadera es exacta. Dicho de otra manera, están muestreando no para estimar la cantidad promedio de azúcar en una porción, sino para ver si esa cantidad, sea cual sea, es mayor que los\(14\) gramos. Nuevamente porque uno puede tener ciertos conocimientos sólo haciendo un censo, las ideas de probabilidad entran en el análisis. Examinaremos pruebas de hipótesis a partir del Capítulo 8.

    Varias veces en esta introducción hemos utilizado el término “muestra aleatoria”. Generalmente el valor de nuestros datos sólo es tan bueno como la muestra que los produjo. Por ejemplo, supongamos que deseamos estimar la proporción de todos los estudiantes de una universidad grande que son mujeres, lo que denotamos por\(p\). Si seleccionamos\(50\) alumnos al azar y\(27\) de ellos son mujeres, entonces una estimación natural es\( p \approx \hat{p} = 27/50 = 0.54 \) o\(54\% \). La confianza que podamos depositar en esta estimación depende no sólo del tamaño de la muestra, sino de su calidad, sea o no verdaderamente aleatoria, o al menos verdaderamente representativa de toda la población. Si todos\(50\) los estudiantes de nuestra muestra fueron extraídos de un Colegio de Enfermería, entonces la proporción de alumnas en la muestra es probablemente mayor que la de todo el campus. Si todos\(50\) los estudiantes fueran seleccionados de una Facultad de Ciencias de la Ingeniería, entonces se podría subestimar la proporción de estudiantes en todo el cuerpo estudiantil que son mujeres. En cualquier caso, la estimación estaría distorsionada o sesgada. En la práctica estadística es importante un esquema de muestreo imparcial pero en la mayoría de los casos no es fácil de producir. Para este curso introductorio asumiremos que todas las muestras son aleatorias o al menos representativas.

    Llave para llevar

    • Los estadísticos calculados a partir de muestras varían aleatoriamente de una muestra a otra. Las conclusiones sobre los parámetros poblacionales son declaraciones de probabilidad.

    This page titled 1.2: Visión general is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.