Saltar al contenido principal
LibreTexts Español

1.1: ¿Qué es la Estadística?

  • Page ID
    149703
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Usted está expuesto a las estadísticas regularmente. Si eres fanático de los deportes, entonces tienes las estadísticas de tu jugador favorito. Si te interesa la política, entonces miras las encuestas para ver cómo se siente la gente sobre ciertos temas o candidatos. Si eres ambientalista, entonces investigas los niveles de arsénico en el agua de un pueblo o analizas las temperaturas globales. Si estás en la profesión empresarial, entonces puedes rastrear las ventas mensuales de una tienda o usar procesos de control de calidad para monitorear el número de piezas defectuosas fabricadas. Si estás en la profesión de la salud, entonces puedes ver qué tan exitoso es un procedimiento o el porcentaje de personas infectadas con una enfermedad. Hay muchos otros ejemplos de otras áreas. Para entender cómo recopilar datos y analizarlos, es necesario comprender cuál es el campo de la estadística y las definiciones básicas.

    Definición\(\PageIndex{1}\)

    La estadística es el estudio de cómo recolectar, organizar, analizar e interpretar los datos recopilados de un grupo.

    Hay dos ramas de la estadística. Una se llama estadística descriptiva, que es donde se recopilan y organizan los datos. El otro se llama estadística inferencial, que es donde se analizan e interpretan los datos. Primero hay que mirar las estadísticas descriptivas ya que utilizará las estadísticas descriptivas a la hora de hacer inferencias.

    Para entender cómo crear estadísticas descriptivas y luego realizar inferencias, hay algunas definiciones que debes mirar. Tenga en cuenta que muchas de las palabras que se definen tienen definiciones comunes que se utilizan en terminología no estadística. En estadística, algunos tienen definiciones ligeramente diferentes. Es importante que note la diferencia y utilice las definiciones estadísticas.

    Lo primero que hay que decidir en un estudio estadístico es a quién quieres medir y qué quieres medir. Siempre quieres asegurarte de que puedes responder a la pregunta de a quién has medido y qué has medido. El que se conoce como el individuo y el qué es la variable.

    Definición\(\PageIndex{2}\)

    Individuo — una persona u objeto del que te interesa conocer información.

    Definición\(\PageIndex{3}\)

    Variable — la medición u observación del individuo.

    Si pones el individuo y la variable en una sola declaración, entonces obtienes una población.

    Definición\(\PageIndex{4}\)

    Población — conjunto de todos los valores de la variable para todo el grupo de individuos.

    Observe, la población responde a quién quieres medir y qué quieres medir. Asegúrate de que tu población siempre responda a estas dos preguntas. Si no es así, entonces no le has dado a alguien que esté leyendo tu estudio el cuadro completo. A modo de ejemplo, si solo dices que vas a recolectar datos de los senadores en el Congreso de Estados Unidos, no le has dicho a tu lector quiere que vas a recolectar. ¿Quieres conocer sus ingresos, su grado más alto obtenido, su historial de votos, su edad, su partido político, su género, su estado civil, o cómo se sienten sobre un tema en particular? Sin decir lo que quieres medir, tu lector no tiene idea de qué trata realmente tu estudio.

    A veces la población es muy fácil de recolectar. Como si te interesa encontrar la edad promedio de todos los senadores actuales en el Congreso de Estados Unidos, solo hay 100 senadores. Esto no sería difícil de encontrar. No obstante, si en cambio te interesaba saber la edad promedio que un senador en el Congreso de Estados Unidos asumió primero el cargo para todos los senadores que alguna vez sirvieron en el Congreso de Estados Unidos, entonces esto sería un poco más trabajo. Todavía es factible, pero tomaría un poco de tiempo recolectar. Pero, ¿y si te interesa encontrar el diámetro promedio de la altura del pecho de todos los pinos Ponderosa en el Bosque Nacional Coconino? Esto sería imposible de recolectar realmente. ¿Qué haces en estos casos? En lugar de recolectar a toda la población, se toma un grupo más pequeño de la población, una especie de instantánea de la población. A este grupo más pequeño se le llama muestra.

    Definición\(\PageIndex{5}\)

    Muestra — un subconjunto de la población. Se parece a la población, pero contiene menos datos

    La forma en que recolectas tu muestra puede determinar qué tan precisos son los resultados de tu estudio. Hay muchas formas de recolectar muestras. Algunos de ellos crean mejores muestras que otras. Ningún método de muestreo es perfecto, pero algunos son mejores que otros. Las técnicas de muestreo se discutirán más adelante. Por ahora, date cuenta que cada vez que tomes una muestra encontrarás diferentes valores de datos. La muestra es una instantánea de la población, y hay más información de la que se encuentra en la imagen. La idea es intentar recolectar una muestra que te dé una imagen precisa, pero nunca sabrás con certeza si tu foto es la correcta. A diferencia de las clases anteriores de matemáticas donde siempre hubo una respuesta correcta, en estadística puede haber muchas respuestas, y no se sabe cuáles son las correctas.

    Una vez que tengas tus datos, ya sea de una población o de una muestra, necesitas saber cómo quieres resumir los datos. Como ejemplo, supongamos que está interesado en encontrar la proporción de personas a las que les gusta un candidato, la altura promedio a la que crece una planta usando un nuevo fertilizante, o la variabilidad de los puntajes de las pruebas. Entender cómo desea resumir los datos ayuda a determinar el tipo de datos que desea recopilar. Ya que la población es lo que nos interesa, entonces se quiere calcular un número a partir de la población. Esto se conoce como parámetro. Como ya se mencionó, realmente no se puede recolectar a toda la población. A pesar de que este es el número que te interesa, realmente no puedes calcularlo. En su lugar se utiliza el número calculado a partir de la muestra, llamado estadístico, para estimar el parámetro. Dado que ninguna muestra es exactamente la misma, los valores estadísticos van a ser diferentes de una muestra a otra. Estiman el valor del parámetro, pero nuevamente, no sabes con certeza si tu respuesta es correcta.

    Definición\(\PageIndex{6}\)

    Parámetro — un número calculado a partir de la población. Generalmente denotado con una letra griega. Este número es un número fijo, desconocido que desea encontrar.

    Definición\(\PageIndex{7}\)

    Estadística — un número calculado a partir de la muestra. Generalmente denotado con letras del alfabeto latino, aunque a veces hay una letra griega con un ^ (llamado sombrero) encima de ella. Ya que se pueden encontrar muestras, es fácilmente conocida, aunque cambia dependiendo de la muestra tomada. Se utiliza para estimar el valor del parámetro.

    Un último concepto a mencionar es que existen dos tipos diferentes de variables: cualitativas y cuantitativas. Cada tipo de variable tiene diferentes parámetros y estadísticas que encuentras. Es importante conocer la diferencia entre ellos.

    Definición\(\PageIndex{8}\)

    Variable cualitativa o categórica — respuesta es una palabra o nombre que describe una cualidad del individuo.

    Definición\(\PageIndex{9}\)

    Variable cuantitativa o numérica — la respuesta es un número, algo que se puede contar o medir a partir del individuo.

    Ejemplo\(\PageIndex{1}\) stating definitions for qualitative variable

    En 2010, el Pew Research Center cuestionó a\(1500\) adultos en Estados Unidos para estimar la proporción de la población que favorecía el consumo de marihuana con fines médicos. Se encontró que\(73\)% están a favor de usar mariguana con fines médicos. Anotar el individuo, la variable, la población y la muestra.

    Solución

    Individuo: un adulto estadounidense

    Variable — la respuesta a la pregunta “¿se debe usar la mariguana con fines médicos?” Se trata de datos cualitativos ya que estás registrando la respuesta de una persona —sí o no—.

    Población — conjunto de todas las respuestas de los adultos en EE. UU.

    Muestra — conjunto de 1500 respuestas de adultos estadounidenses que son cuestionados.

    Parámetro — proporción de quienes favorecen la marihuana con fines médicos calculada a partir de la población

    Estadística: proporción de quienes favorecen la marihuana con fines médicos calculada a partir de la muestra

    Ejemplo\(\PageIndex{2}\) stating definitions for qualitative variable

    Un oficial de control de estacionamiento registra al fabricante de cada\(5^{th}\) automóvil en el estacionamiento de la universidad para adivinar el fabricante más común.

    Solución

    Individual — un auto en el estacionamiento de la universidad

    Variable — el nombre del fabricante. Se trata de datos cualitativos ya que estás grabando un tipo de auto.

    Población — conjunto de todos los nombres del fabricante de autos en el estacionamiento de la universidad.

    Muestra — conjunto de nombres registrados del fabricante de los autos en estacionamiento universitario

    Parámetro — proporción de cada tipo de automóvil calculada a partir de la población

    Estadística: proporción de cada tipo de automóvil calculada a partir de la muestra

    Ejemplo\(\PageIndex{3}\) stating definitions for quantitative variable

    Un biólogo quiere estimar la altura promedio de una planta a la que se le da un nuevo alimento vegetal. Ella le da a\(10\) las plantas el nuevo alimento vegetal. Anotar el individuo, la variable, la población y la muestra.

    Solución

    Individual — una planta dada el nuevo alimento vegetal

    Variable — la altura de la planta (Nota: no es la altura promedio ya que no se puede medir un promedio — se calcula a partir de datos.) Se trata de datos cuantitativos ya que tendrás un número.

    Población — conjunto de todas las alturas de las plantas cuando se usa el nuevo alimento vegetal

    Muestra — conjunto de\(10\) alturas de plantas cuando se usa el nuevo alimento vegetal

    Parámetro — altura media de todas las plantas

    Estadística — altura media de las\(10\) plantas

    Ejemplo\(\PageIndex{4}\) stating definitions for quantitative variable

    Un médico quiere ver si un nuevo tratamiento para el cáncer extiende la esperanza de vida de un paciente versus el tratamiento anterior. Ella le da a un grupo de pacientes con\(25\) cáncer el nuevo tratamiento y otro grupo\(25\) del tratamiento antiguo. Luego mide la esperanza de vida de cada uno de los pacientes. Anotar los individuos, las variables, las poblaciones y las muestras.

    Solución

    En este ejemplo hay dos individuos, dos variables, dos poblaciones y dos muestras.

    Individuo 1: paciente con cáncer que recibe nuevo tratamiento

    Individuo 2: paciente con cáncer a quien se le dio tratamiento

    Variable 1: esperanza de vida cuando se le da un nuevo tratamiento. Se trata de datos cuantitativos ya que tendrás un número.

    Variable 2: esperanza de vida cuando se le da tratamiento antiguo. Se trata de datos cuantitativos ya que tendrás un número.

    Población 1: conjunto de todas las expectativas de vida de los pacientes con cáncer que reciben nuevo tratamiento

    Población 2: conjunto de todas las expectativas de vida de pacientes con cáncer a los que se les dio tratamiento antiguo

    Muestra 1: conjunto de expectativas de\(25\) vida de pacientes con cáncer que reciben nuevo tratamiento

    Muestra 2: conjunto de expectativas de\(25\) vida de pacientes con cáncer a los que se les dio tratamiento antiguo

    Parámetro 1 — esperanza de vida promedio de todos los pacientes con cáncer que reciben un nuevo tratamiento

    Parámetro 2 — esperanza de vida promedio de todos los pacientes con cáncer que recibieron tratamiento antiguo

    Estadística 1 — esperanza de vida promedio de los pacientes con\(25\) cáncer que reciben un nuevo tratamiento

    Estadística 2 — esperanza de vida promedio de pacientes con\(25\) cáncer a los que se les ha dado tratamiento

    Existen diferentes tipos de variables cuantitativas, llamadas discretas o continuas. La diferencia está en cuántos valores pueden tener los datos. Si realmente puede contar el número de valores de datos (incluso si está contando hasta el infinito), entonces la variable se llama discreta. Si no es posible contar el número de valores de datos, entonces la variable se llama continua.

    Definición\(\PageIndex{10}\)

    Los datos discretos solo pueden tomar valores particulares como enteros. Los datos discretos suelen ser cosas que cuentas.

    Definición\(\PageIndex{11}\)

    Los datos continuos pueden tomar cualquier valor. Los datos continuos suelen ser cosas que se miden.

    Ejemplo\(\PageIndex{5}\) discrete or continuous

    Clasificar la variable cuantitativa como discreta o continua,

    1. El peso de un gato.
    2. El número de pulgas en un gato.
    3. El tamaño de un zapato.

    Solución

    1. Esto es continuo ya que es algo que se mide.
    2. Esto es discreto ya que es algo que cuentas.
    3. Esto es discreto ya que solo se pueden tener ciertos valores, como\(7, 7.5, 8, 8.5, 9\). No se puede comprar un\(9.73\) zapato.

    También hay cuatro escalas de medición para diferentes tipos de datos con cada edificio en las que están debajo. Ellos son:

    Básculas de Medición:

    Definición\(\PageIndex{12}\)

    Nominal — los datos son solo un nombre o categoría. No hay orden a ningún dato y como no hay números, no se puede hacer ninguna aritmética en este nivel de datos. Ejemplos de esto son el género, el nombre del automóvil, la etnia y la raza.

    Definición\(\PageIndex{13}\)

    Ordinal — datos que son nominales, pero ahora se pueden poner los datos en orden, ya que un valor es más o menor que otro valor. No se puede hacer aritmética sobre estos datos, pero ahora puede poner en orden los valores de datos. Ejemplos de esto son los grados (A, B, C, D, F), el valor posicional en una carrera (1º, 2º, 3º) y el tamaño de una bebida (pequeña, mediana, grande).

    Definición\(\PageIndex{14}\)

    Intervalo — datos que son ordinales, pero ahora se puede restar un valor de otro y esa resta tiene sentido. Se puede hacer aritmética sobre estos datos, pero solo suma y resta. Ejemplos de esto son la temperatura y el tiempo en un reloj.

    Definición\(\PageIndex{15}\)

    Relación — datos que son intervalo, pero ahora se puede dividir un valor por otro y esa relación tiene sentido. Ahora se puede hacer toda la aritmética sobre estos datos. Ejemplos de esto son la altura, el peso, la distancia y el tiempo.

    Los datos nominales y ordinales provienen de variables cualitativas. Los datos de intervalo y relación provienen de variables cuantitativas.

    A la mayoría de las personas les cuesta decidir si los datos son nominales, ordinales, intervalos o proporciones. Primero, si la variable es cualitativa (palabras en lugar de números) entonces es nominal u ordinal. Ahora pregúntate si puedes poner los datos en un orden determinado. Si puedes es ordinal. De lo contrario, es nominal. Si la variable es cuantitativa (números), entonces es intervalo o ratio. Para los datos de relación, un valor de\(0\) medias no hay medición. Esto se conoce como el cero absoluto. Si hay un cero absoluto en los datos, entonces significa que es ratio. Si no hay cero absoluto, entonces los datos son intervalo. Un ejemplo de un cero absoluto es si tienes $\(0\) en tu cuenta bancaria, entonces estás sin dinero. La cantidad de dinero en tu cuenta bancaria son datos de ratio. Palabra de precaución, a veces los datos ordinales se muestran usando números, como\(5\) estar muy de acuerdo y\(1\) estar muy en desacuerdo. Estos números no son realmente números. En su lugar, se utilizan para asignar valores numéricos a datos ordinales. En realidad no se debe realizar ningún cómputo sobre estos datos, aunque mucha gente lo hace. Si hay números, asegúrese de que los números sean números inherentes, y no números que fueron asignados.

    Ejemplo\(\PageIndex{6}\) measurement scale

    Determinar qué escala de medición es cada una.

    1. Tiempo de primera clase
    2. Color de cabello
    3. Tiempo para tomar una prueba
    4. Agrupaciones de edad (bebé, niño pequeño, adolescente, adolescente, adulto mayor)

    Solución

    1. Esto es intervalo ya que es un número, pero\(0\) en punto significa medianoche y no la ausencia de tiempo.
    2. Esto es nominal ya que no es un número, y no hay un orden específico para el color del cabello.
    3. Esta es la relación ya que es un número, y si\(0\) tardas minutos en hacerte una prueba, significa que no te tomaste tiempo para completarla.
    4. Esto es ordinal ya que no es un número, pero podrías poner los datos en orden desde los más pequeños hasta los más viejos o al revés.

    Testo

    Ejercicio\(\PageIndex{1}\)

    1. Supongamos que quiere saber cómo los trabajadores de Arizona envejecen\(16\) o más viajan al trabajo. Para estimar el porcentaje de personas que utilizan los diferentes modos de viaje, se toma una muestra que contiene trabajadores de\(500\) Arizona mayores de edad\(16\). Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    2. Desea estimar los niveles medios de colesterol de los pacientes dos días después de haber tenido un ataque cardíaco. Para estimar la media se recopilan datos de pacientes\(28\) cardíacos. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    3. A Print-O-Matic le gustaría estimar su salario medio de todos los empleados. Para lograrlo cobran el salario de\(19\) los empleados. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    4. Para estimar el porcentaje de hogares en Connecticut que utilizan fuel oil como fuente de calefacción, un investigador recopila información de los hogares de\(1000\) Connecticut sobre qué combustible es su fuente de calefacción. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    5. La Oficina del Censo de Estados Unidos necesita estimar el ingreso medio de los varones en Estados Unidos, recaudan ingresos de\(2500\) los varones. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    6. La Oficina del Censo de Estados Unidos necesita estimar el ingreso medio de las mujeres en Estados Unidos, recaudan ingresos de\(3500\) las mujeres. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    7. Eyeglassmatic fabrica anteojos y les gustaría saber el porcentaje de cada tipo de defecto realizado. Revisan\(25,891\) defectos y clasifican cada defecto que se realiza. Declarar el individuo, la variable, la población, la muestra, el parámetro y la estadística.
    8. La Organización Mundial de la Salud desea estimar la densidad media de personas por kilómetro cuadrado, recogen datos sobre\(56\) países. Declarar el individuo, la variable, la población, la muestra, el parámetro y el estadístico
    9. Anotar la escala de medición para cada uno.
      1. Nivel de colesterol
      2. Tipo de defecto
      3. Tiempo de primera clase
      4. Dictamen sobre una escala de 5 puntos, con 5 que están muy de acuerdo y 1 muy en desacuerdo
    10. Anotar la escala de medición para cada uno.
      1. Temperatura en grados Celsius
      2. Sabores de helado disponibles
      3. Niveles de dolor en una escala del 1 al 10, siendo 10 el peor dolor de la historia
      4. Sueldo de los empleados
    Contestar

    1. Ver soluciones

    3. Ver soluciones

    5. Ver soluciones

    7. Ver soluciones

    9.

    1. relación
    2. nominal
    3. intervalo
    4. ordinal

    This page titled 1.1: ¿Qué es la Estadística? is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.