10.3: Centralidad de cercanía
- Page ID
- 115379
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Las medidas de centralidad de grado podrían ser criticadas porque sólo toman en cuenta los vínculos inmediatos que tiene un actor, o los lazos de los vecinos del actor, más que los vínculos indirectos con todos los demás. Un actor podría estar atado a un gran número de otros, pero esos otros podrían estar bastante desconectados de la red en su conjunto. En un caso como este, el actor podría ser bastante céntrico, pero sólo en un barrio local.
Los enfoques de centralidad de cercanía enfatizan la distancia de un actor con todos los demás en la red al enfocarse en la distancia de cada actor a todos los demás. Dependiendo de cómo se quiera pensar lo que significa estar “cerca” de los demás, se pueden definir una serie de medidas ligeramente diferentes.
Distancias de trayectoria
Network>Centralidad>Cercanía proporciona una serie de formas alternativas de calcular la “distancia” de cada actor a partir de todos los demás. La distancia es la suma de la distancia (por diversos enfoques) de cada ego a todos los demás en la red.
“Lejanza” se transforma entonces en “cercanía” como el recíproco de la lejía. Es decir, la cercanía = una dividida por la lejía. La “cercanía” se puede estandarizar aún más normalizando contra la mínima cercanía posible para una gráfica del mismo tamaño y conexión.
Dada una medida de cercanía o distancia para cada actor, podemos volver a calcular una medida de desigualdad en la distribución de distancias entre los actores, y expresar la “centralización gráfica” relativa a la de la red “estrella” idealizada.
La Figura 10.9 muestra un diálogo para calcular medidas de cercanía de centralidad y centralización gráfica.
Figura 10.9: Diálogo para Redes>Centralidad>Cercanía
Varios enfoques alternativos para medir la “distancia” están disponibles en el ajuste de tipo. El más común es probablemente la distancia de trayectoria geodésica. Aquí, la “distancia” es la suma de las longitudes de los caminos más cortos desde el ego (o hasta el ego) desde todos los demás nodos. Alternativamente, se puede calcular el recíproco de esto, o “cercanía”. Alternativamente, uno puede enfocarse en todos los caminos, no solo en la geodésica o en todos los senderos. La Figura 10.10 muestra los resultados para el enfoque de ruta geodésica de Freeman.
Figura 10.10: Centralidad de cercanía de ruta geodésica para la red de información Knoke
Dado que la red de información está dirigida, se puede calcular la cercanía y la distancia separadas para el envío y la recepción. Vemos que el actor 6 tiene la mayor suma de distancias geodésicas de otros actores (in-far ness de 22) y a otros actores (out-far de 17). Las cifras de distancia pueden ser reexpresadas como cercanía (la reciprocidad de la lejía) y normadas en relación con la mayor cercanía observada en la gráfica (aquí, la cercanía del actor 7).
También se calculan estadísticas resumidas sobre la distribución de las medidas de cercanía y distancia. Vemos que la distribución de la cercanía tiene menor variabilidad que la cercanía, por ejemplo. Esto también se refleja en las\(\left( 54.1\% \right)\) medidas de in-centralización\(\left( 71.5\% \right)\) y out-centralización gráfica; es decir, las distancias dentro están distribuidas de manera más desigual que las distancias externas.
Alcance
Otra forma de pensar qué tan cerca está un actor de todos los demás es preguntar qué porción de todos los demás ego puede llegar en un paso, dos pasos, tres pasos, etc. La rutina Network>Centralidad>Alcanzar Centralidad calcula algunas medidas útiles de lo cerca que está cada actor de todos los demás. La Figura 10.11 muestra los resultados de la red de información Knoke.
Figura 10.11: Centralidad de alcance para la red de información Knoke
Se calcula un índice de la “distancia de alcance” de cada ego hacia (o desde) todos los demás. Aquí, la puntuación máxima (igual al número de nodos) se logra cuando cada otro está a un paso del ego. La suma de cercanía de alcance se vuelve menor ya que los actores son dos pasos, tres pasos, y así sucesivamente (pesos de 1/2, 1/3, etc.). Estas puntuaciones se expresan entonces en forma “normada” dividiendo por el mayor valor de alcance observado.
Las dos mesas finales son bastante fáciles de interpretar. El primero de estos muestra qué proporción de otros nodos se puede llegar desde cada actor en uno, dos y tres pasos (en nuestro ejemplo, todos los demás son alcanzables en tres pasos o menos). La última tabla muestra qué proporciones de otros pueden alcanzar el ego en uno, dos y tres pasos. Tenga en cuenta que todos pueden comunicarse con el periódico (actor 7) en un solo paso.
Vector propio de distancia geodésica
La medida de centralidad de cercanía descrita anteriormente se basa en la suma de las distancias geodésicas de cada actor a todos los demás (distancia). En redes más grandes y complejas que el ejemplo que hemos estado considerando, es posible que esta medida los engañe un poco. Consideremos a dos actores, A y B. El actor A es bastante cercano a un grupo pequeño y bastante cerrado dentro de una red más amplia, y bastante distante de muchos de los miembros de la población. El actor B se encuentra a una distancia moderada de todos los integrantes de la población. Las medidas de distancia para el actor A y el actor B podrían ser bastante similares a la magnitud. En cierto sentido, sin embargo, el actor B es realmente más “central” que el actor A en este ejemplo, porque B es capaz de llegar a más de la red con la misma cantidad de esfuerzo.
El enfoque de vectores propios es un esfuerzo por encontrar a los actores más centrales (es decir, aquellos con la menor distancia de los demás) en términos de la estructura “global” o “general” de la red, y prestar menos atención a patrones que son más “locales”. El método utilizado para hacer esto (análisis factorial) está fuera del alcance del texto actual. De manera general, lo que hace el análisis factorial es identificar “dimensiones” de las distancias entre actores. La ubicación de cada actor con respecto a cada dimensión se denomina “valor propio”, y la colección de dichos valores se denomina “vector propio”. Por lo general, la primera dimensión captura los aspectos “globales” de las distancias entre actores; la segunda y otras dimensiones capturan subestructuras más específicas y locales.
La rutina UCINET Network>Centralidad>Eigenvector calcula la centralidad del actor individual y la centralización gráfica usando pesos en el primer vector propio. Una limitación de la rutina es que no calcula valores para datos asimétricos. Entonces, nuestras medidas aquí se basan en la noción de “cualquier conexión”.
Figura 10.12: Centralidad y centralización de vectores propios para la red de información Knoke
El primer conjunto de estadísticas, los valores propios, nos dicen cuánto del patrón general de distancias entre actores puede verse como reflejo del patrón global (el primer valor propio), y patrones más locales, o adicionales. Nos interesa el porcentaje de la variación general en las distancias que se contabiliza por el primer factor. Aquí, este porcentaje lo es\(74.3\%\). Esto significa que aproximadamente 3/4 de todas las distancias entre actores reflejan la dimensión o patrón principal. Si esta cantidad no es grande (digamos\(70\%\)), se debe tener mucha precaución al interpretar los resultados posteriores, porque el patrón dominante no es hacer un trabajo muy completo de describir los datos. El primer valor propio también debería ser considerablemente mayor que el segundo (aquí, la relación entre el primer valor propio y el segundo es de aproximadamente 5.6 a 1). Esto quiere decir que el patrón dominante es, en cierto sentido, 5.6 veces más “importante” que el patrón secundario.
A continuación, volvemos nuestra atención a las puntuaciones de cada uno de los casos en el\(^\text{st}\) autovector 1. Los puntajes más altos indican que los actores son “más centrales” al patrón principal de distancias entre todos los actores, valores menores indican que los actores son más periféricos. Los resultados son muy similares a los de nuestro análisis anterior de la centralidad de la cercanía, siendo #7, #5 y #2 los más centrales, y el actor #6 siendo el más periférico. Por lo general, el enfoque del valor propio hará lo que se supone que debe hacer: darnos una versión “limpiada” de las medidas de centralidad de cercanía, como lo hace aquí. Es una buena idea examinar ambos, y compararlos.
Por último, se examina la centralización general de la gráfica y la distribución de las centralidades. Hay relativamente poca variabilidad en las centralidades (desviación estándar 0.07) alrededor de la media (0.31). Esto sugiere que, en general, no hay grandes desigualdades en la centralidad o el poder del actor, cuando se miden de esta manera. En comparación con la red pura “estrella”, el grado de desigualdad o concentración de los datos de Knoke es sólo\(20.9\%\) del máximo posible. Esto es mucho menor que la medida de centralización de red para la medida de cercanía “cruda” (49.3), y sugiere que algunas de las diferencias aparentes en el poder utilizando el enfoque de cercanía en bruto pueden deberse más a desigualdades locales que globales.
Las distancias geodésicas entre actores son una medida razonable de un aspecto de centralidad, o ventaja posicional. A veces estas ventajas pueden ser más locales, y a veces más globales. El enfoque factorial analítico es un enfoque que a veces puede ayudarnos a enfocarnos en el patrón más global. Nuevamente, no es que un enfoque sea “correcto” y el otro “incorrecto”. Dependiendo de los objetivos de nuestro análisis, es posible que deseemos enfatizar uno u otros aspectos de las ventajas posicionales que surgen de la centralidad.
Medidas de influencia Hubbell, Katz, Taylor, Stephenson y Zelen
Los enfoques de cercanía geodésica y valor propio consideran la cercanía de la conexión con todos los demás actores, pero solo por el camino “más eficiente” (el geodésico). En algunos casos, el poder o la influencia pueden expresarse a través de todas las vías que conectan a un actor con todos los demás. Varias medidas de cercanía basadas en todas las conexiones del ego con los demás están disponibles en Network>Centralidad>Influencia.
Incluso si queremos incluir todas las conexiones entre dos actores, puede que no tenga mucho sentido considerar un camino de longitud 10 tan importante como un camino de longitud 1. Los enfoques Hubbell y Katz cuentan las conexiones totales entre actores (vínculos para datos no dirigidos, tanto de envío como de recepción de vínculos para datos dirigidos). A cada conexión, sin embargo, se le da un peso de acuerdo a su longitud. Cuanto mayor es la longitud, más débil es la conexión. Cuanto más débil se vuelve la conexión al aumentar la longitud depende de un factor de “atenuación”. En nuestro ejemplo, a continuación, hemos utilizado un factor de atenuación de 0.5. Es decir, una adyacencia recibe un peso de uno, una caminata de longitud dos recibe un peso de 0.5, una conexión de longitud tres recibe un peso de 0.5 al cuadrado (0.25), etc. Los enfoques Hubbell y Katz son muy similares. Katz incluye una matriz de identidad (una conexión de cada actor consigo mismo) como la conexión más fuerte; el enfoque Hubbell no. Según lo calculado por la UCINET, ambos se acercan a “norma” los resultados para ir desde mayores distancias negativas (es decir, los actores son muy cercanos en relación con los otros pares, o tienen alta cohesión) hasta grandes números positivos (es decir, los actores tienen gran distancia en relación con los demás). Los resultados de los enfoques Hubbell y Katz se muestran en las Figuras 10.13 y 10.14.
Figura 10.13: Influencia diádica de Hubbell para la red de información Knoke
Figura 10.14: Influencia diádica de Katz para la red de información Knoke
Al igual que con todas las medidas de propiedades por pares, uno podría analizar los datos mucho más lejos. Podríamos ver qué individuos son similares a cuáles otros (es decir, ¿existen diferentes grupos o estratos definidos por la similitud de sus conexiones totales con todos los demás en la red?). Nuestro interés también podría enfocarse en toda la red, donde podríamos examinar el grado de varianza y la forma de la distribución de las conexiones de las díadas. Por ejemplo, una red en la que se podría esperar que las conexiones totales entre todas las parejas de actores se comporten de manera muy diferente a aquella en la que existen diferencias radicales entre los actores.
El enfoque Hubbell y Katz puede tener más sentido cuando se aplica a datos simétricos, porque no prestan atención a las direcciones de las conexiones (es decir, los lazos de A dirigidos a B son tan importantes como los lazos de B con A para definir la distancia o solidaridad -cercanía- entre ellos). Si nos interesa más específicamente la influencia de A sobre B en una gráfica dirigida, el enfoque de influencia de Taylor proporciona una alternativa interesante.
La medida Taylor, como las demás, utiliza todas las conexiones, y aplica un factor de atenuación. Sin embargo, en lugar de estandarizar en toda la matriz resultante, se adopta un enfoque diferente. Los marginales de columna para cada actor se restan de los marginales de fila, y luego se normaliza el resultado (¿qué dijo?!). Traducido al inglés, observamos el equilibrio entre cada actor que envía conexiones (marginales de fila) y sus conexiones receptoras (marginales de columna). Los valores positivos reflejan entonces una preponderancia de enviar sobre recibir al otro actor de la pareja -o un equilibrio de influencia entre ambos. Tenga en cuenta que el diario (#7) se muestra como un influencer neto con respecto a la mayoría de los demás actores en el resultado a continuación, mientras que la organización de derechos de bienestar (#6) tiene un saldo negativo de influencia con la mayoría de los demás actores. Los resultados para la red de información Knoke se muestran en la Figura 10.15.
Figura 10.15: Influencia diádica de Taylor para la red de información Knoke
Otra medida basada en atenuar y normalizar todas las vías entre cada actor y todos los demás fue propuesta por Stephenson y Zelen, y puede calcularse con Network>Centrality>Information. Esta medida, mostrada en la Figura 10.16, proporciona una normalización más compleja de las distancias de cada actor entre sí, y resume la centralidad de cada actor con la media armónica de su distancia a los demás.
Figura 10.16: Centralidad de la información de Stephenson y Zelen de la red de información Knoke
El panel superior (truncado) muestra la distancia diádica de cada actor entre sí. La medida de resumen se muestra en el panel central, y la información sobre la distribución de las puntuaciones de centralidad se muestra en la sección de estadísticas.
Como ocurre con la mayoría de las otras medidas, los diversos enfoques a la distancia entre actores y en la red en su conjunto proporcionan un menú de opciones. Ninguna definición para medir la distancia será la opción “correcta” para un propósito dado. A veces no sabemos realmente, de antemano, qué enfoque podría ser el mejor, y es posible que tengamos que intentar probar varios.