Saltar al contenido principal
LibreTexts Español

9.5: Complejidades en la medición cuantitativa

  • Page ID
    144942
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • Definir y proporcionar ejemplos para los cuatro niveles de medición
    • Identificar posibles fuentes de error
    • Diferenciar entre error sistemático y aleatorio

    Para los métodos cuantitativos, ahora debes tener alguna idea sobre cómo funcionan la conceptualización y la operacionalización, y también debes saber evaluar la calidad de tus medidas. Pero la medición es a veces un proceso complejo, y algunos conceptos son más complejos que otros. Medir la afiliación a un partido político de una persona, por ejemplo, es menos complejo que medir su sentido de alienación. En esta sección, consideraremos algunas de estas complejidades en la medición. Primero, echaremos un vistazo a los diversos niveles de medición que existen, y luego consideraremos cómo las medidas pueden estar sujetas a sesgo y error.

    Niveles de medición

    Cuando los científicos sociales miden conceptos, a veces utilizan el lenguaje de variables y atributos. Una variable se refiere a una agrupación de varias características. Los atributos son las características que conforman una variable. Por ejemplo, la variable color del cabello contendría atributos como rubio, marrón, negro, rojo, gris, etc. Los atributos de una variable determinan su nivel de medición. Hay cuatro niveles posibles de medición: nominal, ordinal, intervalo y relación. Los dos primeros niveles de medición son categóricos, es decir, sus atributos son categorías más que números. Estos dos últimos niveles de medición son continuos, es decir, sus atributos son números, no categorías.

    El color del cabello es un ejemplo de un nivel nominal de medición. Las medidas nominales son categóricas y esas categorías no pueden clasificarse matemáticamente. Como persona de pelo castaño (con algo de gris), no puedo decir con certeza que las personas de pelo castaño sean mejores que las rubias. No existe un orden de clasificación entre los colores del cabello. Simplemente son diferentes. Eso es lo que constituye un nivel nominal de medición. El género y la raza también se miden a nivel nominal.

    Pero, ¿qué atributos están contenidos en el color variable del cabello? Rubio, marrón, negro y rojo son colores comunes. No obstante, si enumeráramos solo estos atributos, mi esposa, que actualmente tiene el pelo morado, no cabría en ningún lado. Eso quiere decir que nuestros atributos no fueron exhaustivos. La exhaustividad significa que se listan todos los atributos posibles. Es posible que tengamos que enumerar muchos colores antes de poder cumplir con los criterios de exhaustividad. Claramente, hay un punto en el que se ha cumplido razonablemente la exhaustividad. Si una persona insiste en que su color de pelo es la siena quemada clara, no es tu responsabilidad enumerarlo como opción. Más bien, esa persona sería razonablemente descrita como de pelo castaño. Quizás enumerar una categoría para otro color sería suficiente para que nuestra lista de colores sea exhaustiva.

    ¿Y una persona que tiene múltiples colores de cabello al mismo tiempo, como el rojo y el negro? Caerían en múltiples atributos. Esto viola la regla de la exclusividad mutua, en la que una persona no puede caer en dos atributos diferentes. En lugar de enumerar todas las combinaciones posibles de colores, quizás podrías incluir un atributo multicolor para describir a las personas con más de un color de cabello.

    La discusión sobre el color del cabello elige un punto importante con la medición-reificación. Deberías recordar la reificación de nuestra discusión anterior en este capítulo. Durante muchos años, los atributos para género fueron masculino y femenino. Ahora, nuestra comprensión del género ha evolucionado para abarcar más atributos, incluidos los transgénero, no binarios o genderqueer. Los hijos de padres de diferentes razas a menudo se clasificaban como una raza u otra, aunque se identificaran con ambas culturas por igual. La opción de birracial o multirracial en una encuesta no sólo refleja con mayor precisión la diversidad racial en el mundo real sino que valida y reconoce a las personas que se identifican de esa manera.

    A diferencia de las medidas de nivel nominal, los atributos a nivel ordinal pueden ordenarse por rango. Por ejemplo, el grado de satisfacción de alguien en su relación romántica se puede ordenar por rango. Es decir, se podría decir que no está nada satisfecho, un poco satisfecho, moderadamente satisfecho, o muy satisfecho. Tenga en cuenta que a pesar de que estos tienen un orden de rango para ellos (no en absoluto satisfecho es ciertamente peor que altamente satisfecho), no podemos calcular una distancia matemática entre esos atributos. Simplemente podemos decir que un atributo de una variable de nivel ordinario es más o menos que otro atributo.

    Esto puede resultar un poco confuso al usar escalas Likert. Si alguna vez has realizado una encuesta de satisfacción del cliente o has completado una evaluación de curso para la escuela, estás familiarizado con las escalas Likert. “En una escala del 1 al 5, siendo uno el más bajo y el 5 el más alto, ¿qué probabilidades hay de recomendar nuestra compañía a otras personas?” ¿Te suena familiar? Las escalas Likert utilizan números pero sólo como una taquigrafía para indicar qué atributo (muy probable, algo probable, etc.) la persona siente que los describe mejor. No dirías que tienes “2” más probabilidades de recomendar la empresa. Pero se podría decir que no es muy probable que recomiende la compañía. Los atributos de nivel ordinario también deben ser exhaustivos y mutuamente excluyentes, como ocurre con las variables nominales.

    A nivel de intervalo, los atributos también deben ser exhaustivos y mutuamente excluyentes. Además, se sabe que la distancia entre atributos es igual. Las medidas de intervalo también son continuas, lo que significa que sus atributos son números, más que categorías. Los puntajes de CI son niveles de intervalo, así como las temperaturas Las variables de nivel de intervalo no son particularmente comunes en la investigación en ciencias sociales, pero su característica definitoria es que podemos decir cuánto más o menos un atributo difiere de otro. No podemos, sin embargo, decir con certeza cuál es la proporción de un atributo en comparación con otro. Por ejemplo, no tendría sentido decir que 50 grados es la mitad de caliente que 100 grados.

    Finalmente, a nivel de ratio, los atributos son mutuamente excluyentes y exhaustivos, los atributos pueden ordenarse por rango, la distancia entre atributos es igual y los atributos tienen un verdadero punto cero. Así, con estas variables, podemos decir cuál es la relación de un atributo en comparación con otro. Los ejemplos de variables de relación son la edad y los años de educación. Sabemos, por ejemplo, que una persona que tiene 12 años tiene el doble de edad que alguien que tiene 6 años. Las diferencias entre cada nivel de medición se visualizan en el Cuadro 9.1.

    Tabla 9.1 Criterios para diferentes niveles de medición
    Nominal Ordinal Intervalo Ratio
    Agotado X X X X
    Mutuamente excluyentes X X X X
    Ordenado por rango X X X
    Distancia igual entre atributos X X
    Verdadero punto cero X

    Desafíos en la medición

    Desafortunadamente, las medidas nunca describen perfectamente lo que existe en el mundo real. Las buenas medidas demuestran validez y confiabilidad pero siempre tendrán algún grado de error. El error sistemático hace que nuestras medidas generen datos incorrectos de manera consistente, generalmente debido a un proceso identificable. Imagina que creaste una medida de altura, pero no pusiste una opción para nadie de más de seis pies de altura. Si le diste esa medida a tu colegio o universidad local, es posible que algunos de los miembros más altos del equipo de basquetbol no se midan con precisión. De hecho, estarías bajo la impresión equivocada de que la persona más alta de tu escuela medía seis pies de altura, cuando en realidad probablemente hay personas de más de seis pies en tu escuela. Este error parece inocente, pero si estuvieras usando esa medida para ayudarte a construir un nuevo edificio, ¡esas personas podrían golpearse la cabeza!

    Una forma de error menos inocente surge cuando los investigadores utilizan una redacción de preguntas que podría hacer que los participantes piensen que una opción de respuesta es preferible a otra. Por ejemplo, si te preguntara “¿Crees que el calentamiento global es causado por la actividad humana?” probablemente te sentirías cómodo respondiendo honestamente. Pero, ¿y si te preguntara “¿Estás de acuerdo con el 99% de los científicos en que el calentamiento global es causado por la actividad humana?” ¿Te sentirías cómodo diciendo que no, si eso es lo que honestamente sentiste? Lo dudo. Ese es un ejemplo de una pregunta principal, una pregunta con redacción que influye en cómo responde un participante. Discutiremos las preguntas principales y otros problemas en la redacción de las preguntas con mayor detalle en el Capítulo 11.

    Además del error creado por el investigador, tus participantes pueden causar error en la medición. Algunas personas responderán sin comprender completamente una pregunta, particularmente si la pregunta está redactada de manera confusa. Esa es una fuente de error. Consideremos otro. Si le preguntáramos a la gente si siempre se lavaban las manos después de usar el baño, ¿esperaríamos que la gente fuera perfectamente honesta? Encuestar a la gente sobre si se lavan las manos después de usar el baño solo podría provocar lo que a la gente le gustaría que otros pensaran que hacen, en lugar de lo que realmente hacen. Este es un ejemplo de sesgo de deseabilidad social, en el que los participantes de un estudio de investigación quieren presentarse de una manera positiva y socialmente deseable al investigador. Las personas en tu estudio querrán parecer tolerantes, de mente abierta e inteligentes, pero sus verdaderos sentimientos pueden ser cerrados, simples y sesgados. Entonces, mienten. Esto ocurre a menudo en las encuestas políticas, que pueden mostrar un mayor apoyo a un candidato de raza minoritaria, género o partido político que el que realmente existe en el electorado.

    Una forma relacionada de sesgo se llama sesgo de aquiescencia, también conocido como “sí diciendo”. Ocurre cuando la gente dice que sí a lo que pida el investigador, incluso cuando hacerlo contradice respuestas anteriores. Por ejemplo, una persona podría decir que sí tanto a “Soy un líder confiado en las discusiones grupales” como a “Me siento ansioso al interactuar en las discusiones grupales”. Esas dos respuestas es poco probable que ambas sean ciertas para la misma persona. ¿Por qué alguien haría esto? Similar a la deseabilidad social, las personas quieren ser agradables y amables con el investigador haciéndoles preguntas o podrían ignorar sentimientos contradictorios al responder a cada pregunta. Los encuestados también pueden actuar por razones culturales, tratando de “salvar la cara” para ellos mismos o para la persona que hace las preguntas. Independientemente de la razón, los resultados de tu medida no coinciden con lo que realmente siente la persona.

    Hasta el momento, hemos discutido fuentes de error que provienen de elecciones hechas por encuestados o investigadores. Por lo general, los errores sistemáticos darán como resultado respuestas incorrectas en una dirección u otra. Por ejemplo, el sesgo de deseabilidad social generalmente significa que más personas dirán que votarán por un tercero en una elección que en realidad. Los errores sistemáticos como estos pueden reducirse, pero hay otra fuente de error en la medición que nunca se puede eliminar, y ese es el error aleatorio. A diferencia del error sistemático, que sesga las respuestas consistentemente en una dirección u otra, el error aleatorio es impredecible y no da como resultado consistentemente puntuaciones que sean consistentemente más altas o menores en una medida dada. En cambio, el error aleatorio se parece más al ruido estadístico, que probablemente promediará entre los participantes.

    El error aleatorio está presente en cualquier medición. Si alguna vez has pisado una báscula de baño dos veces y has obtenido dos resultados ligeramente diferentes, tal vez una diferencia de una décima de libra, entonces has experimentado un error aleatorio. A lo mejor estabas parado ligeramente diferente o tenías una fracción de tu pie fuera de la báscula la primera vez. Si tomaras suficientes medidas de tu peso en la misma báscula, podrías averiguar tu verdadero peso. En ciencias sociales, si le diste a alguien una escala que mide la depresión un día después de que perdió su trabajo, probablemente calificaría de manera diferente a si acabara de obtener un ascenso y un aumento. Aunque la persona estuviera clínicamente deprimida, nuestra medida está sujeta a la influencia de las ocurrencias aleatorias de la vida. Así, los científicos sociales hablan con humildad sobre nuestras medidas. Estamos razonablemente seguros de que lo que encontramos es cierto, pero siempre debemos reconocer que nuestras medidas son sólo una aproximación de la realidad.

    La humildad es importante en la medición científica, ya que los errores pueden tener consecuencias reales. Al momento de escribir este libro de texto, mi esposa y yo estamos esperando nuestro primer hijo. Como la mayoría de las personas, utilizamos una prueba de embarazo de la farmacia. Si la prueba decía que mi esposa estaba embarazada cuando no estaba embarazada, eso sería un falso positivo. Por otra parte, si la prueba indicaba que no estaba embarazada cuando de hecho estaba embarazada, eso sería un falso negativo. Incluso si la prueba es 99% precisa, eso significa que una de cada cien mujeres obtendrá un resultado erróneo cuando usen una prueba de embarazo casera. Para nosotros, un falso positivo habría sido inicialmente emocionante, luego devastador cuando descubrimos que no estábamos teniendo un hijo. Un falso negativo habría sido decepcionante al principio y luego bastante impactante cuando descubrimos que efectivamente estábamos teniendo un hijo. Si bien tanto los falsos positivos como los falsos negativos no son muy probables para las pruebas de embarazo caseras (cuando se toman correctamente), el error de medición puede tener consecuencias para las personas que se miden.

    Claves para llevar

    • En las ciencias sociales, nuestras variables pueden ser uno de cuatro niveles diferentes de medición: nominal, ordinal, intervalo o ratio.
    • El error sistemático puede surgir del investigador, participante o instrumento de medición.
    • Los sesgos sistemáticos de error resultan en una dirección particular, mientras que el error aleatorio puede ser en cualquier dirección.
    • Todas las medidas son propensas al error y deben interpretarse con humildad.

    Glosario

    • Sesgo de aquiescencia: cuando los encuestados dicen que sí a lo que pida el investigador
    • Atributos- son las características que componen una variable
    • Medidas categóricas- una medida con atributos que son categorías
    • Medidas continuas- una medida con atributos que son números
    • Exhaustividad: se enumeran todos los atributos posibles
    • Falso negativo- cuando una medida no indica la presencia de un fenómeno, cuando en realidad está presente
    • Falso positivo- cuando una medida indica la presencia de un fenómeno, cuando en realidad no está presente
    • Nivel de intervalo: un nivel de medición que es continuo, puede ordenarse por rango, es exhaustivo y mutuamente excluyente, y para el cual se sabe que la distancia entre atributos es igual
    • Pregunta principal: una pregunta con redacción que influye en cómo responde un participante
    • Escalas Likert- medidas ordinales que usan números como taquigrafía (por ejemplo, 1=muy probable, 2=algo probable, etc.) para indicar qué atributo siente la persona los describe mejor
    • Exclusividad mutua: una persona no puede identificarse con dos atributos diferentes simultáneamente
    • Nivel nominal de medición categórico y esas categorías no pueden clasificarse matemáticamente, aunque son exhaustivas y mutuamente excluyentes
    • Ordinal- nivel de medición que es categórico, esas categorías pueden ordenarse por rango, y son exhaustivas y mutuamente excluyentes
    • Error aleatorio: error impredecible que no da como resultado consistentemente puntuaciones que son consistentemente más altas o más bajas en una medida dada
    • Nivel de relación- nivel de medición en el que los atributos son mutuamente excluyentes y exhaustivos, los atributos pueden ordenarse por rango, la distancia entre atributos es igual y los atributos tienen un verdadero punto cero
    • Sesgo de deseabilidad social: cuando los encuestados responden en función de lo que piensan que le gustaría a otras personas, en lugar de lo que es cierto
    • Error sistemático: las medidas generan datos incorrectos de manera consistente, generalmente en una dirección y debido a un proceso identificable
    • Variable- se refiere a una agrupación de varias características

    Atribuciones de imagen

    satisfacción del usuario por mcmurryJulie CC-0

    pregunta de jambulboy CC-0

    error por stevepb CC-0


    This page titled 9.5: Complejidades en la medición cuantitativa is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Matthew DeCarlo (Open Social Work Education) .