Saltar al contenido principal
LibreTexts Español

7.3: Distancia

  • Page ID
    115333
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Las propiedades de la red que hemos examinado hasta ahora tratan principalmente de adyacencias: las conexiones directas de un actor a otro. Pero la forma en que las personas están incrustadas en las redes es más compleja que esta. Dos personas, llamarlas A y B, podrían tener cada una cinco amigos. Pero supongamos que ninguno de los amigos de la persona A tiene ningún amigo excepto A. Los cinco amigos de la persona B, en contraste, cada uno tiene cinco amigos. La información disponible para el potencial de influencia de B y B es mucho mayor que la de A. Es decir, a veces ser “amigo de un amigo” puede ser bastante consecuente.

    Para capturar este aspecto de cómo los individuos están incrustados en las redes, un enfoque principal es examinar la distancia que un actor está de los demás. Si dos actores son adyacentes, la distancia entre ellos es uno (es decir, toma un paso para que una señal pase de la fuente al receptor). Si A le dice a B, y B le dice a C (y A no le dice a C), entonces los actores A y C están a una distancia de dos. Cuántos actores se encuentran a diversas distancias de cada actor puede ser importante para comprender las diferencias entre los actores en las limitaciones y oportunidades que tienen como consecuencia de su posición. A veces también nos interesa cuántas formas hay de conectar entre dos actores, a una distancia dada. Es decir, ¿puede el actor A llegar al actor B de más de una manera? A veces, las conexiones múltiples pueden indicar una conexión más fuerte entre dos actores que una sola conexión.

    Las distancias entre actores en una red pueden ser una macrocaracterística importante de la red en su conjunto. Donde las distancias son grandes, puede tomar mucho tiempo para que la información se difunda a través de una población. También puede ser que algunos actores desconozcan y estén influenciados por otros -aunque sean técnicamente alcanzables, los costos pueden ser demasiado altos para realizar intercambios. La variabilidad entre los actores en las distancias que tienen de otros actores puede ser una base para la diferenciación e incluso la estratificación. Aquellos actores que están más cerca de más otros pueden ser capaces de ejercer más poder que los que están más distantes. Tendremos mucho más que decir sobre este aspecto de variabilidad en las distancias de los actores en el próximo capítulo.

    Por el momento, necesitamos aprender un poco de jerga que se utiliza para describir las distancias entre actores: paseos, caminos, semirayos, etc. A partir de estas definiciones básicas, podemos entonces desarrollar algunas formas más poderosas de describir diversos aspectos de las distancias entre actores en una red.

    Paseos etc.

    Para describir con precisión las distancias entre actores en una red, necesitamos alguna terminología. Y, como resulta, si estamos hablando de una gráfica simple o una gráfica dirigida hace una buena diferencia. Si A y B son adyacentes en una gráfica simple, tienen una distancia de uno. En una gráfica directa, sin embargo, A puede ser adyacente a B mientras que B no es adyacente a A - la distancia de A a B es uno, pero no hay distancia de B a A. Debido a esta diferencia, necesitamos términos ligeramente diferentes para describir las distancias entre actores en gráficas y dígrafos.

    Gráficas simples: La forma más general de conexión entre dos actores en una gráfica se llama caminata. Un paseo es una secuencia de actores y relaciones que comienza y termina con actores. Una caminata cerrada es aquella en la que el punto inicial y final de la caminata son el mismo actor. Los paseos son irrestrictos. Una caminata puede involucrar al mismo actor o la misma relación varias veces. Un ciclo es una caminata especialmente restringida que a menudo se utiliza en algoritmos que examinan los barrios (los puntos adyacentes) de los actores. Un ciclo es un paseo cerrado de 3 o más actores, todos los cuales son distintos, excepto el actor de origen/destino. La longitud de una caminata es simplemente el número de relaciones que contiene. Por ejemplo, considere esta gráfica en la Figura 7.10.

    Hanneman Captura de Pantalla 7-10.png

    Figura 7.10: Paseos en una gráfica simple

    Hay muchos paseos en una gráfica (en realidad, un número infinito si estamos dispuestos a incluir caminatas de cualquier longitud, aunque, generalmente, restringimos nuestra atención a longitudes bastante pequeñas). Por ilustrar solo algunos, comienza en el actor A e ir al actor C. Hay un paseo de longitud 2 (A, B, C). Hay una caminata de longitud tres (A, B, D, C). Hay varios paseos de longitud cuatro (A, B, E, D, C; A, B, D, B, C; A, B, E, B, C). Debido a que estos son irrestrictos, los mismos actores y relaciones pueden ser utilizados más de una vez en un paseo dado. No hay ciclos que comiencen y terminen con A. Hay algunos inicios y finales con el actor B (B, D, C, B; B, E, D, B; B, C, D, E, B).

    Por lo general, es más útil restringir un poco nuestra noción de lo que constituye una conexión. Una posibilidad es restringir el conteo solo paseos que no reutilicen relaciones. Un rastro entre dos actores es cualquier caminata que incluya una relación dada no más de una vez (los mismos otros actores, sin embargo, pueden formar parte de un sendero varias veces. La longitud de un sendero es el número de relaciones en él. Todos los senderos son paseos, pero no todos los paseos son senderos. Si el rastro comienza y termina con el mismo actor, se le llama rastro cerrado. En nuestro ejemplo anterior, hay una serie de senderos de A a C. Excluidos son trazados como A, B, D, B, C (que es un paseo, pero no es un sendero porque la relación BD se usa más de una vez).

    Quizás la definición más útil de una conexión entre dos actores (o entre un actor y ellos mismos) es un camino. Un camino es un paseo en el que uno al otro actor y la relación entre sí en la gráfica pueden ser utilizados como máximo una vez. La única excepción a esto es un camino cerrado, que comienza y termina con el mismo actor. Todos los senderos son senderos y paseos, pero todos los paseos y todos los senderos no son caminos. En nuestro ejemplo, hay un número limitado de caminos que conectan A y C: A, B, C; A, B, D, C; A, B, E, D, C.

    Gráficas dirigidas: Caminos, senderos y caminos también se pueden definir para gráficos dirigidos. Pero hay dos sabores de cada uno, dependiendo de si queremos tomar en cuenta la dirección o no. Semi-caminatas, semi-senderos y semi-caminos son los mismos que para los datos no dirigidos. Al definir estas distancias, simplemente se ignora la direccionalidad de las conexiones (es decir, los arcos -o los lazos dirigidos se tratan como si fueran bordes- los lazos no dirigidos). Como siempre, la longitud de estas distancias es el número de relaciones en la caminata, sendero o sendero.

    Si queremos prestar atención a la direccionalidad de las conexiones podemos definir paseos, senderos y caminos de la misma manera que antes, pero con la restricción de que tal vez no “cambiemos de dirección” a medida que avanzamos a través de las relaciones de actor a actor. Considera la gráfica dirigida en la Figura 7.11.

    Hanneman Captura de Pantalla 7-11.png

    Figura 7.11: Paseos en una gráfica dirigida

    En esta gráfica dirigida, hay una serie de caminatas de A a C. Sin embargo, no hay caminatas de C (o cualquier otro lugar) a A. Algunos de estos paseos de A a C también son senderos (por ejemplo, A, B, E, D, B, C). Sin embargo, solo hay tres caminos de A a C. Un camino es de longitud 2 (A, B, C); uno es longitud tres (A, B, D, C); uno es longitud cuatro (A, B, E, D, C).

    Los diversos tipos de conexiones (paseos, senderos, caminos) proporcionan un uso con una serie de formas diferentes de pensar sobre las distancias entre actores. La razón principal por la que los analistas de redes sociales están preocupados por estas distancias es que proporcionan una forma de pensar sobre la fuerza de los lazos o relaciones. Los actores que están conectados en longitudes cortas o distancias pueden tener lazos más fuertes. Su conexión también puede estar menos sujeta a interrupciones y, por lo tanto, más estable y confiable.

    El número de caminatas de una longitud dada entre todas las parejas de actores se puede encontrar elevando la matriz a ese poder. Un método conveniente para lograr esto es usar Herramientas>Álgebra de Matrices y especificar una expresión como out=prod (X1, X1). Esto produce el cuadrado de la matriz X1, y lo almacena como el conjunto de datos “out”. Una discusión más detallada de esta idea se puede encontrar en el capítulo anterior sobre la representación de redes como matrices. Esta matriz podría entonces agregarse a X1 para mostrar el número de caminatas entre dos actores cualesquiera de longitud dos o menos.

    Veamos brevemente las distancias entre pares de actores en los datos de Knoke sobre flujos de información dirigidos. Los recuentos de los números de caminos de varias longitudes se muestran en la Figura 7.12.

    Hanneman Captura de Pantalla 2.png

    Figura 7.12: Número de paseos en la red de información Knoke

    El inventario de las conexiones totales entre actores es principalmente útil para tener una idea de lo “cerca” que está cada par, y para tener una idea de lo estrechamente acoplado que está todo el sistema. Aquí, podemos ver que usando solo conexiones de dos pasos (por ejemplo, “Un amigo de un amigo”), hay mucha conexión en la gráfica en general; también vemos que hay fuertes diferencias entre los actores en su grado de conectividad, y con quién están conectados. Estas diferencias se pueden utilizar para comprender cómo se mueve la información en la red, qué actores probablemente influyan entre sí, y una serie de otras propiedades importantes.

    Distancia geodésica, excentricidad y diámetro

    Una definición particular de la distancia entre actores en una red es utilizada por la mayoría de los algoritmos para definir propiedades más complejas de las posiciones del individuo y la estructura de la red en su conjunto. Esta cantidad es la distancia geodésica. Para los datos tanto dirigidos como no dirigidos, la distancia geodésica es el número de relaciones en la caminata más corta posible de un actor a otro (o, de un actor a sí mismos, si nos importa, lo que generalmente no hacemos).

    La distancia geodésica es ampliamente utilizada en el análisis de redes. Puede haber conexiones entre dos actores en una red. Si consideramos cómo la relación entre dos actores puede proporcionar a cada uno oportunidad y restricción, bien puede darse el caso de que no todos estos vínculos importen. Por ejemplo, supongamos que estoy tratando de enviarle un mensaje a Sue: Como conozco su dirección de correo electrónico, puedo enviarla directamente (una ruta de longitud 1). También conozco a Donna, y sé que Donna tiene la dirección de correo electrónico de Sue. Podría mandar mi mensaje de Sue a Donna, y pedirle que lo reenvíe. Este sería un camino de longitud dos. Ante esta elección, es probable que elija la ruta geodésica (es decir, directamente a Sue) porque es menos problemática y más rápida, y porque no depende de Donna. Es decir, el camino geodésico (o caminos, ya que puede haber más de uno) suele ser la conexión “óptima” o más “eficiente” entre dos actores. Muchos algoritmos en el análisis de redes suponen que los actores utilizarán la ruta geodésica cuando haya alternativas disponibles.

    Utilizando UCINET, podemos localizar fácilmente las longitudes de las rutas geodésicas en nuestros datos dirigidos sobre intercambios de información. Aquí está el cuadro de diálogo para Redes>Cohesión>Distancia.

    Hanneman Captura de Pantalla 7-12.png

    Figura 7.13: Redes>Cohesión>Diálogo de distancia

    Los datos de intercambio de información de Knoke son binarios (la organización A envía información a la organización B, o no lo hace). Es decir, el patrón se resume mediante una matriz de adyacencia. Para los datos binarios, la distancia geodésica entre dos actores es el recuento del número de enlaces en el camino más corto entre ellos.

    También es posible definir la distancia entre dos actores donde se valoran los vínculos. Es decir, donde tenemos una medida de la fuerza de los lazos, los costos de oportunidad de los lazos, o la probabilidad de un empate. Redes>Cohesión>Distancia puede calcular la distancia (y cercanía) para los datos valorados, también (seleccionar el “tipo de datos” apropiado).

    Donde tenemos medidas de las fortalezas de los lazos (por ejemplo, el volumen de comercio en dólares entre dos naciones), la “distancia” entre dos actores se define como la fuerza del camino más débil entre ellos. Si A envía 6 unidades a B, y B envía 4 unidades a C, la “fuerza” de la ruta de A a C (suponiendo que A a B a C es la ruta más corta) es 4.

    Donde tenemos una medida de la probabilidad de que se use un vínculo, la “distancia” entre dos actores se define como el producto a lo largo de la ruta, como en el análisis de ruta en estadística.

    Las partes de Transformación de Cercanía y Factor de Atenuación del diálogo permiten reescalar distancias en distancias cercanas. Para muchos análisis, nos puede interesar pensar en las conexiones entre actores en términos de cuán cercanos o similares son, más que de cuán distantes. Hay una serie de formas en que esto se puede hacer.

    La transformación de proximidad multiplicativa divide la distancia entre la mayor distancia posible entre dos actores. Por ejemplo, si tuviéramos 7 nodos, la distancia máxima posible para los datos de adyacencia sería 6. Este método da una medida de la distancia como porcentaje del máximo teórico para una gráfica dada.

    La transformación aditiva de proximidad resta la distancia real entre dos actores del número de nodos. Es similar al escalado multiplicativo, pero arroja un valor como medida de cercanía, más que una proporción.

    La transformación lineal de cercanía vuelve a escalar la distancia invirtiendo la escala (es decir, la más cercana se vuelve la más distante, la más distante se vuelve la más cercana) y re-puntuando para hacer que la escala oscile de cero (par de nodos más cercano) a uno (par de nodos más distantes).

    El método de decaimiento exponencial convierte la distancia en cercanía al ponderar los eslabones en el camino con valores decrecientes a medida que caen más lejos del ego. Con un factor de atenuación de 0.5, por ejemplo, una trayectoria de A a B a C resultaría en una distancia de 1.5.

    El método de decaimiento de frecuencia se define como 1 menos la proporción de otros actores que están tan cerca o más cerca del objetivo como lo es el ego. La idea (de Ron Burt) es que si hay muchos otros actores más cerca del objetivo al que estás tratando de alcanzar que a ti mismo, efectivamente estás “más distante”.

    En nuestro ejemplo, estamos usando adyacencias dirigidas simples, y los resultados (Figura 7.14) son bastante sencillos.

    Hanneman Captura de Pantalla 7-13.png

    Figura 7.14: Distancias geodésicas para el intercambio de información de Knoke

    Debido a que la red es moderadamente densa, las distancias geodésicas son generalmente pequeñas. Esto sugiere que la información puede viajar bastante rápido en esta red. También tenga en cuenta que hay una distancia geodésica para cada par x, y e y, x, es decir, la gráfica está completamente conectada, y todos los actores son “alcanzables” de todos los demás (es decir, existe un camino de cierta longitud de cada actor a uno a otro actor). Cuando una red no está completamente conectada, no podemos definir exactamente las distancias geodésicas entre todos los pares. El enfoque estándar en tales casos es tratar la distancia geodésica entre actores no conectados como una longitud mayor que la de cualquier distancia real en los datos. Para cada actor, podríamos calcular la media y desviación estándar de sus distancias geodésicas para describir su cercanía a todos los demás actores. Para cada actor, la mayor distancia geodésica de ese actor se llama la excentricidad, una medida de lo lejos que está un actor del otro más alejado.

    Debido a que la red actual está completamente conectada, un mensaje que comienza en cualquier lugar eventualmente llegará a todos. Aunque la computadora no lo ha calculado, es posible que queramos calcular la distancia geodésica media (o mediana), y la desviación estándar en distancias geodésicas para la matriz, y para cada actor por filas y columnas. Esto nos diría qué tan lejos está cada actor el uno del otro como fuente de información para el otro; y qué tan lejos está cada actor el uno del otro que puede estar tratando de influir en ellos. También nos dice qué comportamiento de los actores (en este caso, hayan escuchado algo o no) es más predecible y menos predecible.

    Al mirar toda la red, vemos que está conectada, y que la distancia geodésica promedio entre actores es bastante pequeña. Esto sugiere un sistema en el que es probable que la información llegue a todos, y que lo haga con bastante rapidez. Para obtener otra noción del tamaño de una red, podríamos pensar en su diámetro. El diámetro de una red es la mayor distancia geodésica posible en la red (conectada). En el caso actual, ningún actor está a más de tres pasos de cualquier otro, una red muy “compacta”. El diámetro de una red nos dice lo “grande” que es, en un sentido (es decir, cuántos pasos son necesarios para llegar de un lado a otro). El diámetro también es una cantidad útil ya que se puede utilizar para establecer un límite superior en las longitudes de conexiones que estudiamos. Muchos investigadores limitan sus exploraciones de las conexiones entre actores para involucrar conexiones que no superan el diámetro de la red.

    A veces, la redundancia de la conexión es una característica importante de una estructura de red. Si hay muchos caminos eficientes que conectan a dos actores, se mejoran las probabilidades de que una señal llegue de uno a otro. Un índice de esto es un recuento del número de trayectorias geodésicas entre cada par de actores. Por supuesto, si dos actores son adyacentes, sólo puede haber uno de esos caminos. El número de trayectorias geodésicas se puede calcular con Red>Cohesión>No. de geodésicas, como en la Figura 7.15.

    Hanneman Captura de Pantalla 7-14.png

    Figura 7.15: Diálogo para Redes>Cohesión>No. de geodésicas

    Los resultados se muestran en la Figura 7.16.

    Hanneman Captura de Pantalla 7-15.png

    Figura 7.16: Número de rutas geodésicas para el intercambio de información de Knoke

    Vemos que la mayoría de las conexiones geodésicas entre estos actores no solo son de corta distancia, sino que muy a menudo hay múltiples caminos más cortos de x a y, esto sugiere un par de cosas: el flujo de información no es probable que se rompa, porque hay múltiples caminos; y, será difícil para cualquier individual para ser un poderoso “corredor” en esta estructura porque la mayoría de los actores tienen formas alternativas eficientes de conexión con otros actores que pueden eludir a cualquier actor dado.

    Flujo

    El uso de caminos geodésicos para examinar las propiedades de las distancias entre individuos y para toda la red suele tener mucho sentido. Pero, puede haber otros casos en los que la distancia entre dos actores, y la conectividad de la gráfica en su conjunto es mejor, aunque involucrando todas las conexiones, no solo las más eficientes. Si comienzo un rumor, por ejemplo, pasará por una red por todos los caminos, no solo los más eficientes. La cantidad de crédito que otra persona le da a mi rumor puede depender de cuántas veces lo escuchen de diferentes fuentes -y no de cuán pronto lo escuchen. Para usos de distancia como este, necesitamos tomar en cuenta todas las conexiones entre actores.

    Se han desarrollado varios enfoques para contar la cantidad de conexión entre pares de actores que toman en cuenta todas las conexiones entre ellos. Estas medidas se han utilizado para diferentes propósitos, y estas diferencias se reflejan en los algoritmos utilizados para calcularlas.

    Redes>Cohesión>Flujo Máximo. Una noción de cuán totalmente conectados están dos actores (llamado flujo máximo por la UCINET) pregunta cuántos actores diferentes en el vecindario de una fuente conducen a caminos hacia un objetivo. Si necesito hacerte llegar un mensaje, y solo hay otra persona a la que puedo enviar esto para su retransmisión, mi conexión es débil -aunque la persona a la que se la envío pueda tener muchas formas de llegar a ti. Si, por otro lado, hay cuatro personas a las que puedo enviar mi mensaje, cada una de las cuales tiene una o más formas de retransmitirles mi mensaje, entonces mi conexión es más fuerte. El enfoque del “flujo” sugiere que la fuerza de mi vínculo contigo no es más fuerte que el eslabón más débil de la cadena de conexiones, donde la debilidad significa la falta de alternativas. Esta aproximación a la conexión entre actores está estrechamente relacionada con la noción de entretenimiento que examinaremos un poco más adelante. También está lógicamente cerca de la idea de que el número de vías, no su longitud, puede ser importante para conectar a las personas. Para nuestros datos de flujo de información dirigida, los resultados del recuento de flujo máximo de UCINET se muestran en la Figura 7.17.

    Hanneman Captura de Pantalla 7-16.png

    Figura 7.17: Flujo máximo para la red de información Knoke

    Debes verificar por ti mismo que, por ejemplo, hay cuatro intermediarios, o rutas alternativas, en flujos del actor 1 al actor 2, pero cinco puntos de este tipo en el flujo del actor 2 al actor 1. Cuanto mayor sea el número de flujos de un actor a otro, mayor será la probabilidad de que se produzca la comunicación, y menos “vulnerable” será la conexión. Obsérvese que los actores 6, 7 y 9 están relativamente desfavorecidos. En particular, el actor 6 solo tiene una forma de obtener información de todos los demás actores (el vector de columna de flujos al actor 6).


    This page titled 7.3: Distancia is shared under a not declared license and was authored, remixed, and/or curated by Robert Hanneman & Mark Riddle.