Saltar al contenido principal
LibreTexts Español

1.3: Tipos de datos y cómo recopilarlos

  • Page ID
    150855
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Para poder utilizar estadísticas, necesitamos datos para analizar. Los datos vienen en una gama increíblemente diversa de formatos, y cada tipo nos da un tipo único de información. En prácticamente cualquier forma, los datos representan el valor medido de las variables. Una variable es simplemente una característica o rasgo de lo que nos interesa entender. En psicología, nos interesan las personas, por lo que podríamos reunir a un grupo de personas y medir sus niveles de estrés (una variable), ansiedad (una segunda variable) y su salud física (una tercera variable). Una vez que tenemos datos sobre estas tres variables, podemos usar estadísticas para entender si están relacionadas y cómo. Antes de hacerlo, necesitamos entender la naturaleza de nuestros datos: qué representan y de dónde provienen.

    Tipos de Variables

    Al realizar investigaciones, los experimentadores suelen manipular variables. Por ejemplo, un experimentador podría comparar la efectividad de cuatro tipos de antidepresivos. En este caso, la variable es “tipo de antidepresivo”. Cuando una variable es manipulada por un experimentador, se llama variable independiente. El experimento busca determinar el efecto de la variable independiente sobre el alivio de la depresión. En este ejemplo, el alivio de la depresión se denomina variable dependiente. En general, la variable independiente es manipulada por el experimentador y se miden sus efectos sobre la variable dependiente.

    Ejemplo\(\PageIndex{1}\)

    ¿Pueden los arándanos ralentizar el envejecimiento? Un estudio indica que los antioxidantes que se encuentran en los arándanos pueden ralentizar el proceso de envejecimiento. En este estudio,\(19\) ratas de un mes de edad (equivalente a\(60\)-year-old humans) were fed either their standard diet or a diet supplemented by either blueberry, strawberry, or spinach powder. After eight weeks, the rats were given memory and motor skills tests. Although all supplemented rats showed improvement, those supplemented with blueberry powder showed the most notable improvement.

    1. ¿Cuál es la variable independiente? (Suplemento dietético: ninguno, arándano, fresa y espinaca)
    2. ¿Cuáles son las variables dependientes? (prueba de memoria y prueba de habilidades motoras)
    Ejemplo\(\PageIndex{2}\)

    ¿El betacaroteno protege contra el cáncer? Se ha pensado que los suplementos de betacaroteno protegen contra el cáncer. Sin embargo, un estudio publicado en el Journal of the National Cancer Institute sugiere que esto es falso. El estudio se realizó con 39 mil mujeres de 45 años en adelante. Estas mujeres fueron asignadas al azar para recibir un suplemento de betacaroteno o un placebo, y se estudió su salud a lo largo de su vida. Las tasas de cáncer para las mujeres que tomaron el suplemento de betacaroteno no difirieron sistemáticamente de las tasas de cáncer de aquellas mujeres que tomaron el placebo.

    1. ¿Cuál es la variable independiente? (suplementos: betacaroteno o placebo)
    2. ¿Cuál es la variable dependiente? (aparición de cáncer)
    Ejemplo\(\PageIndex{3}\)

    ¿Qué tan brillante es correcto? Un fabricante de automóviles quiere saber qué tan brillantes deben ser las luces de freno para minimizar el tiempo requerido para que el conductor de un siguiente automóvil se dé cuenta de que el automóvil de enfrente se está deteniendo y golpee los frenos.

    1. ¿Cuál es la variable independiente? (brillo de las luces de freno)
    2. ¿Cuál es la variable dependiente? (hora de golpear los frenos)

    Niveles de una variable independiente

    Si un experimento compara un tratamiento experimental con un tratamiento control, entonces la variable independiente (tipo de tratamiento) tiene dos niveles: experimental y control. Si un experimento comparara cinco tipos de dietas, entonces la variable independiente (tipo de dieta) tendría\(5\) niveles. En general, el número de niveles de una variable independiente es el número de condiciones experimentales.

    Variables cualitativas y cuantitativas

    Una distinción importante entre variables es entre variables cualitativas y variables cuantitativas. Las variables cualitativas son aquellas que expresan un atributo cualitativo como el color del cabello, color de ojos, religión, película favorita, género, etc. Los valores de una variable cualitativa no implican un ordenamiento numérico. Los valores de la variable “religión” difieren cualitativamente; no se implica ningún ordenamiento de las religiones. Las variables cualitativas a veces se denominan variables categóricas. Las variables cuantitativas son aquellas variables que se miden en términos de números. Algunos ejemplos de variables cuantitativas son la altura, el peso y el tamaño del zapato.

    En el estudio sobre el efecto de la dieta discutido anteriormente, la variable independiente fue el tipo de suplemento: ninguno, fresa, arándano y espinaca. La variable “tipo de suplemento” es una variable cualitativa; no hay nada cuantitativo al respecto. En contraste, la variable dependiente “test de memoria” es una variable cuantitativa ya que el rendimiento de la memoria se midió en una escala cuantitativa (número correcto).

    Variables discretas y continuas

    Las variables como el número de hijos en un hogar se denominan variables discretas ya que las puntuaciones posibles son puntos discretos en la escala. Por ejemplo, un hogar podría tener tres hijos o seis hijos, pero no\(4.53\) hijos. Otras variables como “tiempo para responder a una pregunta” son variables continuas ya que la escala es continua y no está compuesta por pasos discretos. El tiempo de respuesta podría ser\(1.64\) segundos, o podrían ser\(1.64237123922121\) segundos. Por supuesto, los aspectos prácticos de la medición impiden que la mayoría de las variables medidas sean verdaderamente continuas.

    Niveles de medición

    Antes de poder realizar un análisis estadístico, necesitamos medir nuestra variable dependiente. Exactamente cómo se realiza la medición depende del tipo de variable involucrada en el análisis. Los diferentes tipos se miden de manera diferente. Para medir el tiempo que se tarda en responder a un estímulo, podrías usar un cronómetro. Los cronómetros no sirven, claro, a la hora de medir la actitud de alguien hacia un candidato político. Una escala de calificación es más apropiada en este caso (con etiquetas como “muy favorable”, “algo favorable”, etc.). Para una variable dependiente como “color favorito”, simplemente puede anotar la palabra de color (como “rojo”) que ofrece el sujeto.

    Aunque los procedimientos de medición difieren de muchas maneras, pueden clasificarse usando algunas categorías fundamentales. En una categoría determinada, todos los procedimientos comparten algunas propiedades que son importantes para que conozcas. Las categorías se denominan “tipos de escala”, o simplemente “escalas”, y se describen en esta sección.

    Balanzas nominales

    Al medir usando una escala nominal, uno simplemente nombra o categoriza las respuestas. El género, la mano, el color favorito y la religión son ejemplos de variables medidas en una escala nominal. El punto esencial de las escalas nominales es que no implican ningún ordenamiento entre las respuestas. Por ejemplo, al clasificar a las personas según su color favorito, no tiene sentido en que el verde se coloque “por delante” del azul. Las respuestas son meramente categorizadas. Las escalas nominales representan el nivel más bajo de medición.

    Escalas ordinales

    Un investigador que desee medir la satisfacción de los consumidores con sus hornos de microondas podría pedirles que especifiquen sus sentimientos como “muy insatisfechos”, “algo insatisfechos”, “algo satisfechos” o “muy satisfechos”. Los artículos en esta escala están ordenados, que van de menos a más satisfechos. Esto es lo que distingue a las escalas ordinales de las nominales. A diferencia de las escalas nominales, las escalas ordinales permiten comparar el grado en que dos sujetos poseen la variable dependiente. Por ejemplo, nuestro pedido de satisfacción hace que sea significativo afirmar que una persona está más satisfecha que otra con sus hornos de microondas. Tal aseveración refleja el uso por primera persona de una etiqueta verbal que viene más tarde en la lista que la etiqueta elegida por la segunda persona.

    Por otro lado, las escalas ordinales no logran capturar información importante que estará presente en las otras escalas que examinamos. En particular, no se puede suponer que la diferencia entre dos niveles de una escala ordinal sea la misma que la diferencia entre otros dos niveles. En nuestra escala de satisfacción, por ejemplo, la diferencia entre las respuestas “muy insatisfechos” y “algo insatisfechos” probablemente no sea equivalente a la diferencia entre “algo insatisfechos” y “algo satisfechos”. Nada en nuestro procedimiento de medición nos permite determinar si las dos diferencias reflejan la misma diferencia en la satisfacción psicológica. Los estadísticos expresan este punto diciendo que las diferencias entre los valores de escala adyacentes no necesariamente representan intervalos iguales en la escala subyacente dando lugar a las mediciones. (En nuestro caso, la escala subyacente es el verdadero sentimiento de satisfacción, que estamos tratando de medir).

    ¿Y si el investigador hubiera medido la satisfacción al pedir a los consumidores que indicaran su nivel de satisfacción eligiendo un número del uno al cuatro? ¿La diferencia entre las respuestas de uno y dos reflejaría necesariamente la misma diferencia de satisfacción que la diferencia entre las respuestas dos y tres? La respuesta es No. Cambiar el formato de respuesta a números no cambia el significado de la escala. Todavía no estamos en condiciones de afirmar que el paso mental de\(1\) a\(2\) (por ejemplo) es el mismo que el paso mental de\(3\) a\(4\).

    Escalas de intervalo

    Las escalas de intervalo son escalas numéricas en las que los intervalos tienen la misma interpretación en todo momento Como ejemplo, considere la escala de temperatura Fahrenheit. La diferencia entre\(30\) grados y\(40\) grados representa la misma diferencia de temperatura que la diferencia entre\(80\) grados y\(90\) grados. Esto se debe a que cada intervalo\(10\) -grado tiene el mismo significado físico (en términos de la energía cinética de las moléculas).

    Sin embargo, las escalas de intervalo no son perfectas. En particular, no tienen un verdadero punto cero aunque uno de los valores escalados lleve el nombre “cero”. La escala Fahrenheit ilustra el problema. Cero grados Fahrenheit no representa la ausencia completa de temperatura (la ausencia de cualquier energía cinética molecular). En realidad, la etiqueta “cero” se aplica a su temperatura por razones bastante accidentales relacionadas con el historial de medición de temperatura. Dado que una escala de intervalo no tiene verdadero punto cero, no tiene sentido calcular las relaciones de temperaturas. Por ejemplo, no tiene sentido en que la relación de\(40\)\(20\) grados Fahrenheit sea la misma que la relación de\(100\) a\(50\) grados; no se conserva ninguna propiedad física interesante a través de las dos proporciones. Después de todo, si la etiqueta “cero” se aplicara a la temperatura que Fahrenheit pasa a etiquetar como\(10\) grados, las dos proporciones serían en cambio\(30\) hacia\(10\) y\(90\) hacia\(40\), ¡ya no son las mismas! Por ello, no tiene sentido decir que los\(80\) grados son “dos veces más calientes” que los\(40\) grados. Tal afirmación dependería de una decisión arbitraria sobre dónde “iniciar” la escala de temperatura, es decir, qué temperatura llamar cero (mientras que la afirmación pretende hacer una afirmación más fundamental sobre la realidad física subyacente).

    Balanzas de relación

    La escala de cociente de medición es la escala más informativa. Es una escala de intervalo con la propiedad adicional de que su posición cero indica la ausencia de la cantidad que se está midiendo. Se puede pensar en una escala de proporción ya que las tres escalas anteriores se enrollaron en una. Al igual que una escala nominal, proporciona un nombre o categoría para cada objeto (los números sirven como etiquetas). Al igual que una escala ordinal, los objetos están ordenados (en términos del orden de los números). Al igual que una escala de intervalos, la misma diferencia en dos lugares de la escala tiene el mismo significado. Y además, la misma proporción en dos lugares de la escala también lleva el mismo significado.

    La escala Fahrenheit para la temperatura tiene un punto cero arbitrario y, por lo tanto, no es una escala de relación. Sin embargo, cero en la escala Kelvin es cero absoluto. Esto hace que la escala Kelvin sea una escala de relación. Por ejemplo, si una temperatura es dos veces más alta que otra medida en la escala Kelvin, entonces tiene el doble de energía cinética que la otra temperatura.

    Otro ejemplo de una escala de ratio es la cantidad de dinero que tienes en tu bolsillo ahora mismo (25 centavos, 55 centavos, etc.). El dinero se mide en una escala de ratio porque, además de tener las propiedades de una escala de intervalo, tiene un verdadero punto cero: si tienes cero dinero, esto implica la ausencia de dinero. Dado que el dinero tiene un verdadero punto cero, tiene sentido decir que alguien con 50 centavos tiene el doble de dinero que alguien con 25 centavos (o que Bill Gates tiene un millón de veces más dinero que tú).

    ¿Qué nivel de medición se utiliza para las variables psicológicas?

    Las escalas de calificación se utilizan con frecuencia en la investigación psicológica. Por ejemplo, se puede pedir a los sujetos experimentales que califiquen su nivel de dolor, cuánto les gusta un producto de consumo, sus actitudes sobre la pena capital, su confianza en una respuesta a una pregunta de prueba. Por lo general, estas calificaciones se realizan en una escala de 5 puntos o 7 puntos. Estas escalas son escalas ordinales ya que no hay garantía de que una diferencia dada represente lo mismo en todo el rango de la escala. Por ejemplo, no hay forma de estar seguro de que un tratamiento que reduzca el dolor de un nivel de dolor calificado de 3 a un nivel de dolor calificado de 2 represente el mismo nivel de alivio que un tratamiento que reduce el dolor de un nivel de dolor calificado de 7 a un nivel de dolor calificado de 6.

    En los experimentos de memoria, la variable dependiente suele ser el número de ítems correctamente recordados. ¿Qué escala de medición es esta? Se podría argumentar razonablemente que se trata de una escala de ratio. Primero, hay un verdadero punto cero; algunos sujetos pueden no obtener ningún elemento correcto en absoluto. Además, una diferencia de uno representa la diferencia de un ítem recordado en toda la escala. Ciertamente es válido decir que alguien que recordó 12 artículos recordó el doble de artículos que alguien que recordó solo 6 artículos.

    Pero el número de artículos recordados es un caso más complicado de lo que parece al principio. Considera el siguiente ejemplo en el que se pide a los sujetos que recuerden tantos ítems como sea posible de una lista de 10. Supongamos que (a) hay 5 elementos fáciles y 5 elementos difíciles, (b) la mitad de los sujetos son capaces de recordar todos los elementos fáciles y diferentes números de artículos difíciles, mientras que (c) la otra mitad de los sujetos no pueden recordar ninguno de los artículos difíciles pero sí recuerdan diferentes números de artículos fáciles. A continuación se muestran algunos datos de muestra.

    Tabla\(\PageIndex{1}\): Datos de muestra
    Sujeto Artículos fáciles Artículos difíciles Score
    A 0 0 1 1 0 0 0 0 0 0 2
    B 1 0 1 1 0 0 0 0 0 0 3
    C 1 1 1 1 1 1 1 0 0 0 7
    D 1 1 1 1 1 0 1 1 0 1 8

    Comparemos (i) la diferencia entre el puntaje del Sujeto A de 2 y el puntaje del Sujeto B de 3 y (ii) la diferencia entre el puntaje del Sujeto C de 7 y el puntaje del Sujeto D de 8. La primera diferencia es una diferencia de un ítem fácil; la segunda diferencia es una diferencia de un ítem difícil. ¿Estas dos diferencias significan necesariamente la misma diferencia en la memoria? Estamos inclinados a responder “No” a esta pregunta ya que solo puede ser necesaria un poco más de memoria para retener el elemento fácil adicional, mientras que es posible que se necesite mucha más memoria para retener el elemento duro adicional. El punto general es que a menudo es inapropiado considerar las escalas de medición psicológica como intervalo o relación.

    Consecuencias del nivel de medición ¿Por qué estamos tan interesados en el tipo de escala que mide una variable dependiente? El quid de la materia es la relación entre el nivel de medición de la variable y las estadísticas que se pueden calcular de manera significativa con esa variable. Por ejemplo, considere un estudio hipotético en el que se pide a 5 niños que elijan su color favorito de azul, rojo, amarillo, verde y morado. El investigador codifica los resultados de la siguiente manera:

    Tabla\(\PageIndex{2}\): Código de datos de color favorito
    Color Código
    Azul 1
    Rojo 2
    Amarillo 3
    Verde 4
    Morado 5

    Esto significa que si un niño decía que su color favorito era “Rojo”, entonces la elección se codificaba como “2", si el niño decía que su color favorito era “Púrpura”, entonces la respuesta se codificaba como 5, y así sucesivamente. Considere los siguientes datos hipotéticos

    Tabla\(\PageIndex{3}\): Datos de colores favoritos
    Sujeto Color Código
    1 Azul 1
    2 Azul 1
    3 Verde 4
    4 Verde 4
    5 Morado 5

    Cada código es un número, así que nada nos impide computar el código promedio asignado a los niños. El promedio pasa a ser 3, pero se puede ver que no tendría sentido concluir que el color favorito promedio es el amarillo (el color con un código de 3). Tal tontería surge porque el color favorito es una escala nominal, y tomar el promedio de sus etiquetas numéricas es como contar el número de letras en nombre de una serpiente para ver cuánto dura la bestia.

    ¿Tiene sentido calcular la media de los números medidos en una escala ordinal? Esta es una pregunta difícil, una que los estadísticos han debatido desde hace décadas. La opinión predominante (pero de ninguna manera unánime) de los estadísticos es que para casi todas las situaciones prácticas, la media de una variable medida ordinalmente es una estadística significativa. Sin embargo, existen situaciones extremas en las que calcular la media de una variable normalmente medida puede ser muy engañosa.


    This page titled 1.3: Tipos de datos y cómo recopilarlos is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Foster et al. (University of Missouri’s Affordable and Open Access Educational Resources Initiative) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.