Saltar al contenido principal
LibreTexts Español

11.2: Análisis de conglomerados

  • Page ID
    69323
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En la sección anterior se examinaron los espectros de 24 muestras a 635 longitudes de onda, mostrando los datos trazando la absorbancia en función de la longitud de onda. Otra forma de examinar los datos es graficar la absorbancia de cada muestra a una longitud de onda frente a la absorbancia de la misma muestra a una segunda longitud de onda, como vemos en la siguiente figura usando longitudes de onda de 403.3 nm y 508.7 nm. Tenga en cuenta que esta gráfica sugiere una estructura subyacente a nuestros datos ya que los 24 puntos ocupan un espacio de forma triangular definido por las muestras identificadas como 1, 2 y 3.

    cluster1.png
    Figura\(\PageIndex{1}\): Gráfica que muestra los valores de absorbancia para las 24 muestras de la Figura 11.1.1 a longitudes de onda de 400.3 nm y 508.7 nm. Los números próximos a los puntos son valores de índice para las muestras.

    Podemos extender este análisis a tres longitudes de onda, como vemos en la siguiente figura, y, a tantas como todas las 635 longitudes de onda (¡Por supuesto que no podemos examinar una gráfica de esto tal como existe en el espacio de 635 dimensiones!).

    cluster2.png
    Figura\(\PageIndex{2}\): Gráfica que muestra los valores de absorbancia para las 24 muestras de la Figura 11.1.1 a longitudes de onda de 400.3 nm, 508.7 nm y 801.8 nm. El color de los puntos muestra la absorbancia a 801.8 nm, que es el eje z. Los números próximos a los puntos son valores de índice para las muestras. Tenga en cuenta que los 24 puntos aquí también residen en un espacio de forma triangular.

    Tanto en Figura\(\PageIndex{1}\) como en Figura\(\PageIndex{2}\) (y en las gráficas de mayor dimensión que no podemos mostrar), algunas muestras están más cerca entre sí en el espacio que en otros puntos. Por ejemplo, en la Figura\(\PageIndex{1}\), las muestras 7 y 20 están más cerca entre sí que cualquier otro par de muestras; las muestras 2 y 3, sin embargo, están más alejadas entre sí que cualquier otro par de muestras.

    ¿Cómo funciona un análisis de clúster?

    Un análisis de conglomerados es una forma de examinar nuestros datos en términos de la similitud de las muestras entre sí. La figura\(\PageIndex{3}\) describe los pasos usando un pequeño conjunto de seis puntos definidos por dos variables, a y b. El panel (a) muestra los seis puntos de datos. Los dos puntos más cercanos en distancia son 3 y 4, que conforman el primer cúmulo y que reemplazamos con el punto rojo a medio camino entre ellos, como se ve en el panel (b). Los siguientes dos puntos más cercanos en distancia son 2 y 6, que conforman el segundo cúmulo y que reemplazamos con el punto rojo entre ellos, como se ve en el panel (c). Continuando de esta manera arroja los resultados en el panel (d) donde el tercer cluster reúne los puntos 2, 3, 4 y 6, el cuarto cluster reúne los puntos 1, 2, 3, 4 y 6, y el cluster final reúne los seis puntos.

    cluster3.png
    Figura\(\PageIndex{3}\): Ejemplo de cómo funciona el análisis de conglomerados. Consulte el texto para más detalles.

    Para visualizar los clusters, en términos de la identificación de los puntos en los clusters, el orden en que se forman los clusters, y la similitud relativa de diferencia entre puntos y clusters, mostramos la información en la Figura\(\PageIndex{3d}\) como el dendrograma que se muestra en la Figura\(\PageIndex{4}\), que muestra, por ejemplo, que los racimos de los puntos 3 y 4, y de 2 y 6 son más similares entre sí de lo que son al punto 1 y al punto 6. La escala vertical, que se identifica como Altura, proporciona una medida de la distancia de los puntos individuales o grupos de puntos entre sí.

    cluster4.png
    Figura\(\PageIndex{4}\): Los resultados del análisis de conglomerados en la Figura\(\PageIndex{3d}\) se muestran como un dendrograma.

    ¿Cómo interpretamos los resultados de un análisis de conglomerados?

    Un análisis de conglomerados de las 24 muestras de la Figura 11.1.1 se muestra en la Figura\(\PageIndex{5}\) usando 40 longitudes de onda equidistantes. Hay mucho que podemos aprender de este diagrama sobre la estructura de estas muestras, que podemos dividir en tres grupos distintos de muestras, como lo muestran las cajas. Las muestras dentro de cada conglomerado son más similares entre sí que a las muestras de otros conglomerados. Una posible explicación para esta estructura es que las 24 muestras están compuestas por tres analitos, donde, para cada conglomerado, uno de los analitos está presente a una concentración mayor que los otros dos analitos.

    cluster5.png
    Figura\(\PageIndex{5}\): Análisis de conglomerados de las 24 muestras de la Figura 11.1.1. Las cajas dividen las 24 muestras en tres grupos distintos.

    This page titled 11.2: Análisis de conglomerados is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by David Harvey.