Saltar al contenido principal
LibreTexts Español

7.4: Pruebas de significancia no paramétrica

  • Page ID
    69327
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Las pruebas de significancia descritas en el Capítulo 7.2 suponen que podemos tratar las muestras individuales como si fueran extraídas de una población que normalmente se distribuye. Aunque a menudo es una suposición razonable, hay momentos en que esta es una suposición pobre, como cuando hay un probable valor atípico que no estamos inclinados a eliminar. Las pruebas de significancia no paramétricas nos permiten comparar conjuntos de datos, pero sin hacer suposiciones implícitas sobre la distribución de nuestros datos. En esta sección consideraremos dos pruebas no paramétricas, la prueba de rango firmado de Wicoxson, que podemos usar en lugar de una prueba t pareada, y la prueba de suma de rangos de Wilcoxon, que podemos usar en lugar de una prueba t desapareada.

    Prueba de rango firmado de Wilcoxson

    Cuando usamos datos emparejados primero calculamos la diferencia, d i, entre los valores emparejados de cada muestra. Luego restamos la diferencia esperada de cada d i y luego clasificamos estas diferencias ajustadas de menor a mayor sin considerar el signo. Después asignamos a cada diferencia un rango (1, 2, 3,...) y agregamos de nuevo su signo. Si dos o más entradas tienen la misma diferencia absoluta, entonces promediamos sus rangos. Por último, sumamos los rangos positivos y sumamos los rangos negativos. Si no hay diferencia en los dos conjuntos de datos, entonces esperamos que estas dos sumas sean similares en valor. Si el menor de los dos rangos es menor que un valor crítico, entonces hay razones para creer que los dos conjuntos de datos son significativamente diferentes entre sí; ver Apéndice 6 para una tabla de valores críticos.

    Ejemplo\(\PageIndex{1}\)

    Marecek et. al. desarrollaron un nuevo método electroquímico para la determinación rápida de la concentración del antibiótico monensina en cubas de fermentación [Marecek, V.; Janchenova, H.; Brezina, M.; Betti, M. Anal. Chim. Acta 1991, 244, 15—19]. El método estándar para el análisis es una prueba de actividad microbiológica, que es difícil de completar y requiere mucho tiempo. Se recolectaron muestras de las cubas de fermentación en diversos momentos durante la producción y se analizó la concentración de monensina mediante ambos métodos. Los resultados, en partes por mil (ppt), se reportan en la siguiente tabla. Estos son los mismos datos que en el Ejemplo 7.2.6.

    Muestra Microbiológicos Electroquímica
    1 129.5 132.3
    2 89.6 91.0
    3 76.6 73.6
    4 52.2 58.2
    5 110.8 104.2
    6 50.4 49.9
    7 72.4 82.1
    8 141.4 154.1
    9 75.0 73.4
    10 34.1 38.1
    11 60.3 60.1

    ¿Hay una diferencia significativa entre los métodos en\(\alpha = 0.05\)?

    Solución

    Definir la diferencia entre los métodos como

    \[d_i = (X_\text{elect})_i - (X_\text{micro})_i \nonumber\]

    calculamos la diferencia para cada muestra.

    muestra 1 2 3 4 5 6 7 8 9 10 11
    \(d_i\) 2.8 1.4 —3.0 6.0 —6.6 —0.5 9.7 12.7 —1.6 4.0 —0.2

    A continuación, ordenamos las diferencias individuales de menor a mayor sin considerar el signo

    \(d_i\) —0.2 —0.5 1.4 —1.6 2.8 —3.0 4.0 6.0 —6.6 9.7 12.7

    Luego asignamos a cada diferencia individual un rango, conservando el signo; así

    \(d_i\) —1 —2 3 —4 5 —6 7 8 —9 10 11

    La suma de los rangos negativos es 22 y la suma de los rangos positivos es 44. El valor crítico para 11 muestras y\(\alpha = 0.05\) es 10. Como el menor de nuestros dos rangos, 22, es mayor que 10, no hay evidencia que sugiera que haya una diferencia entre los dos métodos.

    Prueba de Suma de Rango de Wilcoxson

    La prueba de suma de rangos de Wilcoxon (también conocido como prueba U de Mann-Whitney) se utiliza para comparar dos conjuntos de datos desapareados. Los valores en los dos conjuntos de datos se ordenan de menor a mayor, manteniendo la identidad de la muestra. Después de ordenar, a cada valor se le asigna un rango (1, 2, 3,...), nuevamente, manteniendo la identidad muestral. Si dos o más entradas tienen la misma diferencia absoluta, entonces se promedian sus filas. A continuación, sumamos los rangos para cada muestra. Si no hay diferencia en los dos conjuntos de datos, entonces esperamos que los rangos positivo y negativo sean similares en valor. Para dar cuenta de las diferencias en el tamaño de cada muestra, restamos

    \[ \frac{n_i(n_i + 1)}{2} \nonumber\]

    de cada suma donde\(n_i\) es el tamaño de la muestra. Si el menor de los dos rangos es menor que un valor crítico, entonces hay razones para creer que los dos conjuntos de datos son significativamente diferentes entre sí; consulte Appenidx 7 para una tabla de valores críticos.

    Ejemplo\(\PageIndex{2}\)

    Para comparar dos lotes de producción de tabletas de aspirina, se recolectan muestras de cada una y las analizan, obteniendo los siguientes resultados (en mg de aspirina/tableta).

    Lote 1:256, 248, 245, 244, 248, 261

    Lote 2:241, 258, 241, 256, 254

    ¿Hay alguna evidencia de\(\alpha = 0.05\) que existe una diferencia significativa entre estos dos conjuntos de resultados?

    Solución

    Primero, clasificamos los resultados de los más pequeños a los más grandes. Para distinguir entre las dos muestras, las del Lote 1 se muestran en negrita.

    241, 241, 244, 245, 248, 248, 254, 256, 256, 258, 261

    A continuación asignamos rangos, identificando esas muestras del Lote 1 por debajo de ellas.

    1.5, 1.5, 3, 4, 5.5, 5.5, 7, 8.5, 8.5, 10, 11

    La suma de los rangos para el Lote 1 es 37.5 y la suma de los rangos para el Lote 2 es 28.5. Después de ajustar para el tamaño de cada muestra, tenemos

    \[37.5 - \frac{6(6 + 1)}{2} = 16.5 \nonumber\]

    para Lote 1 y

    \[28.5 - \frac{(5)(5+1)}{2} = 13.5 \nonumber\]

    para Lote 2. Del Apéndice 7, el valor crítico para\(\alpha = 0.05\) es 3. Como el menor de nuestros dos rangos, 13.5, es mayor que 3, no hay evidencia que sugiera que haya una diferencia entre los dos métodos.


    This page titled 7.4: Pruebas de significancia no paramétrica is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by David Harvey.