6.3: Niveles de medición

Última actualización
Guardar como PDF

Page ID: 144322

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

La primera decisión a tomar en la operacionalización de un constructo es decidir cuál es el nivel de medición pretendido. Los niveles de medición, también llamados escalas de calificación, se refieren a los valores que puede tomar un indicador (pero no dice nada sobre el indicador en sí). Por ejemplo, masculino y femenino (o M y F, o 1 y 2) son dos niveles del indicador “género”. En su artículo seminal titulado “Sobre la teoría de escalas de medición” publicado en Science en 1946, el psicólogo Stanley Smith Stevens (1946) definió cuatro tipos genéricos de escalas de calificación para mediciones científicas: escalas nominales, ordinales, de intervalos y de relación. Las propiedades estadísticas de estas escalas se muestran en el Cuadro 6.1.

Escala	Tendencia Central	Estadísticas	Transformaciones
Nominal	Modo	Chi-cuadrado	Uno a uno (igualdad)
Ordinal	Mediana	Percentil, estadística no paramétrica	Aumento monótona (orden)
Intervalo	Media aritmética, rango, desviación estándar	Correlación, regresión, análisis de varianza	Lineal positivo (afín)
Ratio	Media geométrica, media armónica	Coeficiente de variación	Similitudes positivas (multiplicativas, logarítmicas)

Nota: Todas las escalas de orden superior pueden usar cualquiera de las estadísticas para escalas de orden inferior.

Cuadro 6.1. Propiedades estadísticas de las escalas de calificación

Las escalas nominales, también llamadas escalas categóricas, miden datos categóricos. Estas escalas se utilizan para variables o indicadores que tienen atributos mutuamente excluyentes. Los ejemplos incluyen género (dos valores: masculino o femenino), tipo de industria (manufacturera, financiera, agricultura, etc.) y afiliación religiosa (cristiana, musulmana, judía, etc.). Incluso si asignamos números únicos a cada valor, por ejemplo 1 para hombre y 2 para hembra, los números realmente no significan nada (es decir, 1 no es menor o la mitad de 2) y podrían haberse representado fácilmente de manera no numérica, como M para hombre y F para mujer. Las escalas nominales solo ofrecen nombres o etiquetas para diferentes valores de atributo. La medida apropiada de tendencia central de una escala nominal es el modo, y no se puede definir ni la media ni la mediana. Las estadísticas permisibles son chi-cuadrado y distribución de frecuencia, y solo se permite una transformación uno a uno (igualdad) (por ejemplo, 1=Hombre, 2=Mujer).

Las escalas ordinales son aquellas que miden datos ordenados por rangos, como el ranking de alumnos en una clase como primero, segundo, tercero, etc., con base en su promedio de calificaciones o calificaciones de exámenes. Sin embargo, no se pueden evaluar los valores reales o relativos de los atributos o la diferencia en los valores de los atributos. Por ejemplo, la clasificación de los alumnos en clase no dice nada sobre el GPA real o los puntajes de las pruebas de los estudiantes, o cómo se desempeñaron bien entre sí. Un ejemplo clásico en las ciencias naturales es la escala de dureza mineral de Moh, que caracteriza la dureza de varios minerales por su capacidad para rayar otros minerales. Por ejemplo, los diamantes pueden rayar todos los demás minerales naturales en la tierra y, por lo tanto, el diamante es el mineral “más duro”. Sin embargo, la escala no indica la dureza real de estos minerales o incluso proporciona una evaluación relativa de su dureza. Las escalas ordinales también pueden usar etiquetas de atributos (anclas) como “malo”, “medio” y “bueno”, o “fuertemente insatisfecho”, “algo insatisfecho”, “neutral” o “algo satisfecho” y “fuertemente satisfecho”. En este último caso, podemos decir que los encuestados que están “algo satisfechos” están menos satisfechos que aquellos que están “fuertemente satisfechos”, pero no podemos cuantificar sus niveles de satisfacción. La medida de tendencia central de una escala ordinal puede ser su mediana o modo, y las medias son ininterpretables. Por lo tanto, los análisis estadísticos pueden involucrar percentiles y análisis no paramétricos, pero las técnicas más sofisticadas como correlación, regresión y análisis de varianza, no son apropiadas. Se permite una transformación monótonamente creciente (que conserva el ranking).

Las escalas de intervalo son aquellas en las que los valores medidos no solo están ordenados por rango, sino que también son equidistantes de los atributos adyacentes. Por ejemplo, la escala de temperatura (en Fahrenheit o Celsius), donde la diferencia entre 30 y 40 grados Fahrenheit es la misma que la de entre 80 y 90 grados Fahrenheit. De igual manera, si tienes una escala que pide ingresos anuales de los encuestados utilizando los siguientes atributos (rangos): $0 a 10,000, $10,000 a 20,000, $20,000 a 30,000, y así sucesivamente, esta también es una escala de intervalo, porque el punto medio de cada rango (es decir, $5,000, $15,000, $25,000, etc.) son equidistantes entre sí. La escala de cociente de inteligencia (CI) también es una escala de intervalos, porque la escala está diseñada de tal manera que se supone que la diferencia entre las puntuaciones de CI 100 y 110 es la misma que entre 110 y 120 (aunque realmente no sabemos si ese es realmente el caso). La escala de intervalos nos permite examinar “cuánto más” es un atributo en comparación con otro, lo cual no es posible con escalas nominales u ordinales. Las medidas de tendencia central permitidas incluyen la media, mediana o modo, al igual que las medidas de dispersión, como el rango y la desviación estándar. Los análisis estadísticos permisibles incluyen todos los permitidos para las escalas nominal y ordinal, más correlación, regresión, análisis de varianza, etc. La transformación de escala permitida es lineal positiva. Obsérvese que la escala de satisfacción discutida anteriormente no es estrictamente una escala de intervalos, porque no podemos decir si la diferencia entre “fuertemente satisfecho” y “algo satisfecho” es la misma que entre “neutral” y “algo satisfecho” o entre “algo insatisfecho” y “fuertemente insatisfecho”. Sin embargo, los investigadores de ciencias sociales a menudo “fingen” (incorrectamente) que estas diferencias son iguales para que podamos usar técnicas estadísticas para analizar datos escalados ordinales.

Las escalas de relación son aquellas que tienen todas las cualidades de escalas nominales, ordinales e intervalos, y además, también tienen un punto de “cero verdadero” (donde el valor cero implica falta o no disponibilidad del constructo subyacente). La mayoría de las mediciones en las ciencias naturales e ingeniería, como la masa, la inclinación de un avión y la carga eléctrica, emplean escalas de relación, al igual que algunas variables de ciencias sociales como la edad, la tenencia en una organización y el tamaño de la empresa (medido como recuento de empleados o ingresos brutos). Por ejemplo, una firma de tamaño cero significa que no tiene empleados ni ingresos. La escala de temperatura Kelvin también es una escala de relación, en contraste con las escalas Fahrenheit o Celsius, porque el punto cero en esta escala (equivalente a -273.15 grados Celsius) no es un valor arbitrario sino que representa un estado donde las partículas de materia a esta temperatura tienen cero energía cinética. Estas escalas se denominan escalas de “ratio” porque las proporciones de dos puntos en estas medidas son significativas e interpretables. Por ejemplo, una firma de tamaño 10 empleados es el doble que una firma de tamaño 5, y lo mismo puede decirse de una firma de 10,000 empleados en relación con una firma diferente de 5,000 empleados. Todas las medidas de tendencias centrales, incluidas las medias geométricas y armónicas, están permitidas para las escalas de relación, así como las medidas de relación, como el rango studentizado o el coeficiente de variación. Se permiten todos los métodos estadísticos. También se permiten transformaciones sofisticadas como similares positivas (p. ej., multiplicativas o logarítmicas).

Con base en los cuatro tipos genéricos de escalas discutidos anteriormente, podemos crear escalas de calificación específicas para la investigación en ciencias sociales. Las escalas de calificación comunes incluyen escalas binarias, Likert, diferenciales semánticas o Guttman. Otras escalas menos comunes no se discuten aquí.

Escalas binarias. Las escalas binarias son escalas nominales que consisten en elementos binarios que asumen uno de dos valores posibles, como sí o no, verdadero o falso, y así sucesivamente. Por ejemplo, una escala binaria típica para el constructo de “activismo político” puede consistir en los seis ítems binarios mostrados en la Tabla 6.2. Cada ítem en esta escala es un ítem binario, y el número total de “sí” indicado por un encuestado (un valor de 0 a 6) puede ser utilizado como una medida general del activismo político de esa persona. Para entender cómo se derivaron estos ítems, consulte la sección “Escalamiento” más adelante en este capítulo. Las escalas binarias también pueden emplear otros valores, como masculino o femenino por género, tiempo completo o medio tiempo para la situación laboral, y así sucesivamente. Si se modifica un elemento de situación laboral para permitir más de dos valores posibles (por ejemplo, desempleado, tiempo completo, medio tiempo y jubilado), ya no es binario, sino que sigue siendo un ítem nominal escalado.

¿Alguna vez has escrito una carta a un funcionario público?	Sí	No
¿Alguna vez ha firmado una petición política	Sí	No
¿Alguna vez has donado dinero a una causa política?	Sí	No
¿Alguna vez ha donado dinero a un candidato que se postula para un cargo público?	Sí	No
¿Alguna vez ha escrito una carta política al editor de un periódico o revista?	Sí	No
¿Alguna vez has persuadido a alguien para que cambie sus planes de votación?	Sí	No

Cuadro 6.2. Una escala binaria de seis ítems para medir el activismo político

Escala Likert. Diseñada por Rensis Likert, esta es una escala de calificación muy popular para medir datos ordinales en la investigación en ciencias sociales. Esta escala incluye elementos Likert que son declaraciones de formulación simple a las que los encuestados pueden indicar su grado de acuerdo o desacuerdo en una escala de cinco o siete puntos que van desde “fuertemente en desacuerdo” hasta “fuertemente de acuerdo”. Un ejemplo típico de una escala Likert de seis ítems para el constructo “autoestima laboral” se muestra en el Cuadro 6.3. Las escalas Likert son escalas sumadas, es decir, la puntuación general de la escala puede ser una suma de los valores de atributo de cada ítem seleccionados por un encuestado.

	Totalmente en desacuerdo	Algo en desacuerdo	Neutral	Algo de acuerdo	Totalmente de acuerdo
Me siento bien con mi trabajo	1	2	3	4	5
Me llevo bien con otros en el trabajo	1	2	3	4	5
Estoy orgulloso de mi relación con mi supervisor en el trabajo	1	2	3	4	5
Puedo decir que otras personas en el trabajo están contentas de tenerme ahí	1	2	3	4	5
Puedo decir que mis compañeros de trabajo me respetan	1	2	3	4	5
Siento que hago una contribución útil en el trabajo	1	2	3	4	5

Cuadro 6.3. Una escala Likert de seis ítems para medir la autoestima laboral

Los ítems Likert permiten más granularidad (respuesta más finamente ajustada) que los ítems binarios, incluyendo si los encuestados son neutrales a la declaración. También se pueden usar tres o nueve valores (a menudo llamados “anclajes”), pero es importante usar un número impar de valores para permitir un anclaje “neutro” (o “ni de acuerdo ni en desacuerdo”). Algunos estudios han utilizado un “enfoque de elección forzada” para obligar a los encuestados a estar de acuerdo o en desacuerdo con la declaración de LiKert al dejar caer el punto medio neutral y usar un número par de valores y, pero esta no es una buena estrategia porque algunas personas pueden ser neutrales a una declaración dada y al enfoque de elección forzada no les brinda la oportunidad de dejar constancia de su postura neutral. Una característica clave de una escala Likert es que a pesar de que los enunciados varían en diferentes ítems o indicadores, los anclajes (“fuertemente en desacuerdo” para “estar muy de acuerdo”) siguen siendo los mismos. Las escalas Likert son escalas ordinales porque las anclas no son necesariamente equidistantes, aunque a veces las tratamos como escalas de intervalo.

¿Cómo calificaría sus opiniones sobre el seguro nacional de salud?

	Mucho	Algo	Tampoco	Algo	Mucho
Bueno	□	□	□	□	□	Malo
Útiles	□	□	□	□	□	Inútil
Cuidando	□	□	□	□	□	Inafectivo
Interesante	□	□	□	□	□	Mandrinado

Cuadro 6.4. Una escala diferencial semántica para medir la actitud hacia el seguro nacional de salud

Escala diferencial semántica. Se trata de una escala compuesta (multi-ítem) donde se pide a los encuestados que indiquen sus opiniones o sentimientos hacia una sola declaración usando diferentes pares de adjetivos enmarcados como polos opuestos. Por ejemplo, el constructo “actitud hacia el seguro nacional de salud” se puede medir utilizando cuatro ítems que se muestran en el Cuadro 6.4. Al igual que en la escala Likert, la puntuación general de la escala puede ser una suma de puntajes de ítem individuales. Observe que en las escalas Likert, la declaración cambia pero los anclajes permanecen iguales en todos los artículos. Sin embargo, en escalas diferenciales semánticas, el enunciado permanece constante, mientras que los anclajes (pares de adjetivos) cambian entre ítems. Se cree que el diferencial semántico es una técnica excelente para medir la actitud o los sentimientos de las personas hacia objetos, eventos o comportamientos.

Escala Guttman. Diseñada por Louis Guttman, esta escala compuesta utiliza una serie de ítems dispuestos en orden creciente de intensidad del constructo de interés, desde el menos intenso hasta el más intenso. Como ejemplo, el constructo “actitud hacia los inmigrantes” se puede medir utilizando cinco ítems que se muestran en la Tabla 6.5. Cada ítem en la escala Guttman anterior tiene un peso (no indicado anteriormente) que varía con la intensidad de ese ítem, y la combinación ponderada de cada respuesta se utiliza como medida agregada de una observación.

¿Cómo calificará sus opiniones sobre las siguientes declaraciones sobre inmigrantes?

¿Te importa que los inmigrantes sean ciudadanos de tu país?	Sí	No
¿Te importa que los inmigrantes vivan en tu propio vecindario?	Sí	No
¿Te importaría vivir al lado de un inmigrante	Sí	No
¿Te importaría tener a un inmigrante como tu amigo cercano?	Sí	No
¿Te importaría si alguien de tu familia se casa con un inmigrante?	Sí	No

Cuadro 6.5. Una escala Guttman de cinco puntos para medir la actitud hacia los inmigrantes