Saltar al contenido principal
LibreTexts Español

13.4: Describiendo Conjuntos de Equivalencia Estructural

  • Page ID
    115146
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Dos actores que son estructuralmente equivalentes tienen los mismos vínculos con todos los demás actores: son perfectamente sustituibles o intercambiables. En los datos “reales”, la equivalencia exacta puede ser bastante rara, y muchos tienen sentido medir la equivalencia aproximada. Existen varios enfoques para examinar el patrón de similitudes en los perfiles de vinculación de actores, y para formar clases de equivalencia estructural.

    Un enfoque muy útil es aplicar el análisis de conglomerados para intentar discernir cuántos conjuntos de equivalencias estructurales hay y qué actores se encuentran dentro de cada conjunto. Examinaremos dos enfoques más comunes: CONCOR y optimización numérica mediante búsqueda tabú.

    Lo que la matriz de similitud y el análisis de conglomerados no nos dicen es qué similitudes hacen que los actores de cada conjunto sean “iguales” y qué diferencias hacen que los actores en un conjunto sean “diferentes” de los actores de otro. Un enfoque muy útil para comprender las bases de similitud y diferencia entre conjuntos de actores estructuralmente equivalentes es el modelo de bloques, y un resumen basado en él llamado matriz de imagen. Ambas ideas han sido explicadas en otra parte. Vamos a echar un vistazo a cómo pueden ayudarnos a entender los resultados de CONCOR y búsqueda tabú.

    Agrupación de perfiles de similitudes o distancias

    El análisis de conglomerados es un método natural para explorar la equivalencia estructural. Dos actores que tienen los patrones similares de vínculos con otros actores se unirán en un clúster, y los métodos jerárquicos mostrarán un “árbol” de unión sucesiva.

    Redes>Funciones y posiciones>Estructural>Perfil puede realizar una variedad de tipos de análisis de conglomerados para evaluar la equivalencia estructural. La Figura 13.12 muestra un diálogo típico para este algoritmo.

    Hanneman Captura de Pantalla 13-4.png

    Figura 13.12: Diálogo de Redes>Roles y Posiciones>Estructural>Perfil

    Dependiendo de cómo se hayan medido las relaciones entre actores, se proporcionan varias formas comunes de construir la matriz de similitud o distancia actor por actor (correlaciones, distancias euclidianas, coincidencias totales o coeficientes de Jaccard). Si desea una medida diferente de similitud, puede construirla en otro lugar (por ejemplo, Herramientas>Similitudes), guardar el resultado y aplicar análisis de clúster directamente (es decir, Herramientas>Cluster).

    Hay algunas otras opciones importantes. Una es, ¿qué hacer con los ítems de la matriz de similitud que indexan la similitud de un actor con ellos mismos (es decir, los valores diagonales)? Una opción (“Retener”) incluye la similitud de un nodo consigo mismo; otra opción (“Ignorar”) excluye los elementos diagonales del cálculo de similitud o diferencia. El método por defecto (“Recíproco”) reemplaza el elemento diagonal para ambos casos con el empate que existe entre los casos.

    Uno puede “Incluir transponer” o no. Si los datos que se examinan son simétricos (es decir, un gráfico simple, no uno dirigido), entonces la transposición es idéntica a la matriz, y no debería incluirse. Para los datos dirigidos, el algoritmo calculará, por defecto, similitudes en las filas (out-ties) pero no in-ties. Si quieres incluir el perfil completo de los vínculos tanto de entrada como de salida para datos dirigidos, debes incluir la transposición.

    Si está trabajando con una matriz de adyacencia sin procesar, la similitud se puede calcular en el perfil de empate (probablemente usando un enfoque de coincidencia o Jaccard). Alternativamente, las adyacencias se pueden convertir en una medida valorada de disimilitud calculando distancias geodésicas (en cuyo caso podrían elegirse correlaciones o distancias euclidianas como medida de similitud).

    La Figura 13.13 muestra los resultados del análisis descrito en el diálogo.

    Hanneman Captura de Pantalla 13-5.png

    Figura 13.13: Perfil de similitud de distancias geodésicas de filas y columnas de la red de información de Knoke

    El primer panel muestra la matriz de equivalencia estructural -o el grado de similitud entre pares de actores (en este caso, disimilitud, ya que optamos por analizar distancias euclidianas).

    El segundo panel muestra un gráfico aproximado de mapas de caracteres de la agrupación. Aquí vemos que los actores 7 y 4 son los más similares, un segundo clúster está formado por los actores 1 y 5; un tercero por los actores 8 y 9. Este algoritmo también proporciona una presentación más pulida del resultado como un dendograma en una ventana separada, como se muestra en la Figura 13.14.

    Hanneman Captura de Pantalla 13-6.png

    Figura 13.14: Dendograma de datos de equivalencia estructural (ver Figura 13.13)

    No hay equivalencia estructural exacta en los datos de ejemplo. Es decir, no hay dos casos que tengan vínculos idénticos con todos los demás casos. El dendograma puede ser particularmente útil para localizar agrupaciones de casos que sean lo suficientemente equivalentes para ser tratados como clases. Las medidas de adecuación de agrupamiento en Herramientas>Clúster pueden proporcionar orientación adicional.

    Otros dos enfoques, CONCOR y optimización, siguen una lógica algo diferente a la del clustering. En ambos métodos, primero se configuran particiones o clases de equivalencia aproximada (el usuario selecciona cuántos), y los casos se asignan a estas clases mediante técnicas numéricas diseñadas para maximizar la similitud dentro de las clases.

    CONCOR

    CONCOR es un enfoque que se ha utilizado desde hace bastante tiempo. Aunque el algoritmo de CONCOR ahora se considera un poco peculiar, la técnica suele producir resultados significativos.

    CONCOR comienza correlacionando cada par de actores (como hicimos anteriormente). Cada fila de esta matriz de correlación actor por actor se extrae luego y se correlaciona entre sí fila. En cierto sentido, el enfoque es preguntar “¿qué tan similar es el vector de similitudes del actor X con el vector de similitudes del actor Y”? Este proceso se repite una y otra vez. Eventualmente los elementos en esta “matriz de correlación iterada” convergen en un valor de +1 o -1 (si quieres convencerte, ¡pruébalo!).

    CONCOR luego divide los datos en dos conjuntos sobre la base de estas correlaciones. Entonces, dentro de cada conjunto (si tiene más de dos actores) se repite el proceso. El proceso continúa hasta que todos los actores están separados (o hasta que perdamos el interés). El resultado es un árbol de ramificación binario que da lugar a una partición final.

    Para ilustración, hemos pedido a CONCOR que nos muestre los grupos que mejor satisfacen esta propiedad cuando creemos que hay cuatro grupos en los datos de información de Knoke. Utilizamos Redes>Roles y posiciones>Estructural>Concor, y establecemos la profundidad de las divisiones = 2 (es decir, dividir los datos dos veces). Todos los algoritmos de bloqueo requieren que tengamos una idea previa sobre cuántos grupos hay. Los resultados se muestran en la Figura 13.15.

    Hanneman Captura de Pantalla 13-7.png

    Figura 13.15: CONCOR en matriz de información Knoke con dos divisiones

    El primer panel muestra las correlaciones de los casos. Incluimos la transposición, por lo que estas correlaciones se basan tanto en el envío como en la recepción de vínculos. Nuestros datos, sin embargo, son binarios, por lo que el uso del coeficiente de correlación (y CONCOR) debe tratarse con precaución.

    El segundo panel muestra las dos divisiones. En la primera división se formaron los dos grupos {1, 4, 5, 2, 7} y {8, 3, 9, 6, 10}. En el segundo fraccionamiento estos se subdividieron en {1, 4}, {5, 2, 7}, {8, 3, 9}, y {6, 10}.

    El tercer panel (la “Matriz Bloqueada”) muestra los datos originales permutados. El resultado aquí podría simplificarse aún más creando una matriz de “imagen de bloque” de las cuatro clases por las cuatro clases, con “1" en bloques de alta densidad y “0" en bloques de baja densidad, como en la Figura 13.16.

    Hanneman Captura de Pantalla 10.png

    Figura 13.16: Imagen en bloque de resultados de CONCOR

    La bondad de ajuste de un modelo de bloques se puede evaluar correlacionando la matriz permutada (el modelo de bloques) contra un modelo “perfecto” con los mismos bloques (es decir, uno en el que todos los elementos de un bloque son unos, y todos los elementos de bloques cero son ceros). Para el modelo CONCOR de dos divisiones (cuatro grupos), este r cuadrado es 0.451. Es decir, aproximadamente 1/2 de la varianza en los lazos en el modelo CONCOR puede ser contabilizada por un modelo de bloque estructural “perfecto”. Esto podría considerarse como OK, pero no es un ajuste maravilloso (no hay un criterio real para lo que encaja bien).

    El modelo de bloques y su imagen también proporcionan una descripción de lo que significa cuando decimos “los actores en el bloque uno son aproximadamente estructuralmente equivalentes”. Es probable que los actores de equivalencia clase uno envíen vínculos a todos los demás actores del bloque dos, pero a ningún otro bloque. Es probable que los actores en equivalencia clase uno reciban vínculos de todos los actores en los bloques 2 y 3. Entonces, no solo hemos identificado las clases, también hemos descrito la forma de las relaciones que hace que los casos sean equivalentes.

    Optimización por Tabu Search

    Este método de bloqueo se ha desarrollado más recientemente, y se basa en el uso extensivo de la computadora. La búsqueda tabú utiliza un algoritmo más moderno (e intensivo en informática) que CONCOR, pero está tratando de implementar la misma idea de agrupar a los actores que son más similares en un bloque. La búsqueda tabú hace esto buscando conjuntos de actores que, si se colocan en un bloque, producen la menor suma de varianzas dentro del bloque en los perfiles de empate. Es decir, si los actores en un bloque tienen vínculos similares, su varianza alrededor del perfil medio del bloque será pequeña. Entonces, la partición que minimiza la suma de las varianzas dentro del bloque está minimizando la varianza general en los perfiles de amarre. En principio, este método debería producir resultados similares (pero no necesariamente idénticos) a CONCOR. En la práctica, esto no siempre es así. Aquí (Figura 13.17) están los resultados de Network>Roles y posiciones>Estructural>Optimización>Binario aplicado a la red de información Knoke, y solicitando cuatro clases. Una variación de la técnica para los datos valorados está disponible como Network>Roles y posiciones>Estructural>Optimización>Valorados.

    Hanneman Captura de Pantalla 13-8.png

    Figura 13.17: Solución optimizada de cuatro bloques para equivalencia estructural de la red de información Knoke

    La correlación general entre las puntuaciones reales en la matriz bloqueada y una matriz “perfecta” compuesta por solo unos y ceros es razonablemente buena (0.544).

    La partición sugerida en clases de equivalencia estructural es {7}, {1, 3, 4, 10, 8, 9}, {5, 2} y {6}.

    Ahora también podemos describir las posiciones de cada una de las clases. La primera clase (actor 7) tiene densos lazos de envío con la tercera (actores 5 y 2); y recibe información de las otras tres clases. La segunda, y la más grande, envía información a la primera y a la tercera clase, y recibe información de la tercera clase. La última clase (actor 6), envía a la primera clase, pero recibe de ninguna.

    Este último análisis ilustra de manera más completa los objetivos primarios de un análisis de equivalencia estructural:

    1) ¿Cuántas clases de equivalencia, o clases de equivalencia aproximada, hay?

    2) ¿Qué tan bueno es el ajuste de esta simplificación en clases de equivalencia al resumir la información sobre todos los nodos?

    3) ¿Cuál es la posición de cada clase, definida por sus relaciones con las otras clases?


    This page titled 13.4: Describiendo Conjuntos de Equivalencia Estructural is shared under a not declared license and was authored, remixed, and/or curated by Robert Hanneman & Mark Riddle.