Saltar al contenido principal
LibreTexts Español

1.R: Muestreo y Datos (Revisión)

  • Page ID
    150720
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    1.1 Definiciones de Estadística, Probabilidad y Términos Clave

    La teoría matemática de la estadística es más fácil de aprender cuando se conoce el idioma. Este módulo presenta términos importantes que serán utilizados a lo largo del texto.

    1.2 Datos, Muestreo y Variación en Datos y Muestreo

    Los datos son elementos individuales de información que provienen de una población o muestra. Los datos pueden clasificarse como cualitativos (categóricos), cuantitativos continuos o cuantitativos discretos.

    Debido a que no es práctico medir toda la población en un estudio, los investigadores utilizan muestras para representar a la población. Una muestra aleatoria es un grupo representativo de la población elegida mediante un método que da a cada individuo de la población las mismas posibilidades de ser incluido en la muestra. Los métodos de muestreo aleatorio incluyen muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados y muestreo sistemático. El muestreo de conveniencia es un método no aleatorio para elegir una muestra que a menudo produce datos sesgados.

    Las muestras que contienen diferentes individuos dan como resultado diferentes datos. Esto es cierto incluso cuando las muestras son bien elegidas y representativas de la población. Cuando se seleccionan adecuadamente, las muestras más grandes modelan la población más estrechamente que las muestras más pequeñas. Hay muchos problemas potenciales diferentes que pueden afectar la confiabilidad de una muestra. Los datos estadísticos necesitan ser analizados críticamente, no simplemente aceptados.

    1.3 Niveles de medición

    Algunos cálculos generan números que son artificialmente precisos. No es necesario reportar un valor a ocho decimales cuando las medidas que generaron ese valor sólo fueron exactas a la décima más cercana. Redondea tu respuesta final a un decimal más de lo que estaba presente en los datos originales. Esto significa que si tienes datos medidos a la décima de una unidad más cercana, reportar la estadística final a la centésima más cercana.

    Además de redondear tus respuestas, puedes medir tus datos usando los siguientes cuatro niveles de medición.

    • Nivel de escala nominal: datos que no se pueden ordenar ni se pueden utilizar en los cálculos
    • Nivel de escala ordinal: datos que se pueden ordenar; las diferencias no se pueden medir
    • Nivel de escala de intervalo: datos con un orden definido pero sin punto de partida; las diferencias se pueden medir, pero no existe tal cosa como una relación.
    • Nivel de escala de relación: datos con un punto de partida que se puede ordenar; las diferencias tienen significado y se pueden calcular las proporciones.

    A la hora de organizar los datos, es importante saber cuántas veces aparece un valor. ¿Cuántos estudiantes de estadística estudian cinco horas o más para un examen? ¿Qué porcentaje de familias en nuestra cuadra posee dos mascotas? La frecuencia, la frecuencia relativa y la frecuencia relativa acumulativa son medidas que responden preguntas como estas.

    1.4 Diseño Experimental y Ética

    Un estudio mal diseñado no producirá datos confiables. Hay ciertos componentes clave que deben incluirse en cada experimento. Para eliminar las variables al acecho, los sujetos deben ser asignados aleatoriamente a diferentes grupos de tratamiento. Uno de los grupos debe actuar como grupo control, demostrando lo que sucede cuando no se aplica el tratamiento activo. Los participantes en el grupo control reciben un tratamiento placebo que se parece exactamente a los tratamientos activos pero no puede influir en la variable de respuesta. Para preservar la integridad del placebo, tanto los investigadores como los sujetos pueden quedar cegados. Cuando un estudio se diseña adecuadamente, la única diferencia entre los grupos de tratamiento es la que impone el investigador. Por lo tanto, cuando los grupos responden de manera diferente a diferentes tratamientos, la diferencia debe deberse a la influencia de la variable explicativa.

    “Un problema de ética surge cuando estás considerando una acción que te beneficia o algunos te hacen apoyar, lastiman o reducen beneficios a otros, y viola alguna regla”. (Andrew Gelman, “Datos abiertos y métodos abiertos”, Ética y estadística, http://www.stat.columbia.edu/~gelman...nceEthics1.pdf (consultado el 1 de mayo de 2013).) Las violaciones éticas en las estadísticas no siempre son fáciles de detectar. Las asociaciones profesionales y los organismos federales publican lineamientos para su correcta conducta. Es importante que aprendas los procedimientos estadísticos básicos para que puedas reconocer el análisis de datos adecuado.


    This page titled 1.R: Muestreo y Datos (Revisión) is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.