Saltar al contenido principal
LibreTexts Español

6.5: Selección de subconjuntos de los datos

  • Page ID
    115088
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    A medida que trabajamos en la comprensión de la estructura de una red social, hay ocasiones en las que tal vez deseemos centrar nuestra atención en solo una parte de los actores. A veces es solo cuestión de limpiar “maleza” de nodos que no son “importantes”. A veces se trata de seleccionar conjuntos de actores para su consideración por separado.

    UCINET tiene una serie de herramientas integradas que pueden ser útiles para crear nuevos conjuntos de datos a partir de conjuntos de datos existentes, que incluyen solo partes de los actores.

    Data>Extract es una herramienta de propósito general que le permite “mantener” o “eliminar” filas, columnas o matrices para la salida a un nuevo conjunto de datos. Puede seleccionar las filas, columnas o relaciones (matrices) que desea conservar enumerándolas en archivos de datos externos o eligiendo los nombres de las filas, columnas o matrices de las listas desplegables.

    El componente principal de datos>Extract conserva todos los nodos y relaciones entre los nodos que forman parte del componente más grande de una gráfica. En inglés: se conserva la información sobre el actor y las conexiones entre los actores que forman parte del conjunto más grande de actores que están todos conectados. Si una gráfica contiene varios componentes (por ejemplo, si hay algunos “aislados” o hay subgrupos que no tienen conexión con el grupo más grande) solo se conservará el mayor. Muchos análisis requieren que todos los nodos estén conectados. Pero, no todas las redes reales en realidad lo son. Entonces, tal vez desee extraer el componente más grande y analizarlo.

    Datos>Subgrafos de particiones es una herramienta (algo más complicada) que permite dividir los casos en grupos (particiones), y generar archivos de datos separados para cada grupo. El primer paso (después de haber decidido qué casos caen en qué partición), es crear un archivo de datos externo que enumere la pertenencia a la partición. Supongamos que quería poner los nodos 1, 3 y 5 en un valor de una partición (es decir, en un grupo) y los casos 2, 4 y 6 en otro. Crearía un archivo de datos que pareciera: 1, 2, 1, 2, 1, 2. Esto dice, poner el primer nodo en la partición uno, poner el segundo nodo en la partición dos, poner el tercer nodo en la partición uno, etc. Este nombre de archivo se suministra al diálogo >Subgrafos de particiones. También puede limitar el proceso eligiendo generar solo ciertas particiones (enumerarlas en la ventana de diálogo), y/o crear nuevos conjuntos de datos para un valor de partición solo si hay más de algún número (que especifique) de casos.

    Muchos algoritmos de análisis de red generan información sobre la pertenencia a particiones (y guardan la información de pertenencia a particiones como archivos que puede conectar a esta utilidad). También podrías querer imponer tus propias particiones para identificar a personas en una comunidad, personas de un género en particular, etc.

    Datos>Remove isolates crea un nuevo dataset que contiene todos los casos que no están aislados. Un “aislado” es un caso que no tiene ninguna conexión con ningún otro actor. En ocasiones, cuando recolectamos información haciendo un censo de todos los actores de un tipo determinado, o en una ubicación determinada, algunos están “aislados”. Si bien este suele ser un dato social interesante, es posible que deseemos centrar nuestra atención en la comunidad de actores que están conectados (aunque no necesariamente formando un solo “componente”).

    Datos>Remove pendant crea un nuevo conjunto de datos que contiene todos los casos que no son “colgantes”. Un “colgante” es una caja que está conectada a la gráfica por una sola corbata; casos como estos “colgarán” de cajas más centrales que están más fuertemente conectadas. Al mirar gráficos grandes con muchos actores, es posible que deseemos limitar la atención a los nodos que están conectados a al menos otros dos actores, para centrar la atención en el “núcleo” de la red. Quitar aislamientos y colgantes puede ayudar a despejar parte del “desorden”.

    Data>Egon es una herramienta que nos permite extraer actores particulares y aquellos en su “vecindario” inmediato como conjuntos de datos separados. Como veremos más adelante, la “red del ego” de un solo actor, o de alguna selección de actores (todos los hombres, todos los casos con alto entremecimiento, etc.) suele ser el foco de investigación más que la estructura de toda la red.

    Una “red de ego” es el conjunto de actores que están conectados con un actor focal, junto con las relaciones entre el ego y los alteradores, y cualquier relación entre los alteradores. La estructura de las redes del ego (ya sean densas o delgadas, y si contienen “agujeros estructurales”) suelen ser variables críticas para comprender y predecir el comportamiento del “ego”.

    La herramienta Data>Egon te permite enumerar los “egos” o “nodos focales” que quieres extraer usando una lista de archivos externos o seleccionando sus etiquetas de una lista desplegable. El diálogo pregunta si quieres incluir el ego, o solo retener información sobre los vecinos del ego; la opción más común, y por defecto, es incluir el ego así como los vecinos del ego.

    Data>Unpack es una herramienta para crear un nuevo dataset que contiene un subconjunto de matrices de un dataset más grande. Por ejemplo, si hubiéramos almacenado información de relación tanto de “gusto” como de “cónyuge” en un solo conjunto de datos, podemos usar esta utilidad para crear archivos de datos separados para una o ambas relaciones. Las relaciones que se van a “desempaquetar” se seleccionan de un cuadro desplegable.

    Data>Join es una herramienta que se puede utilizar para combinar conjuntos separados de datos en un nuevo conjunto de datos. A menudo recopilamos información de atributos sobre actores en varios entornos diferentes (por ejemplo, varias aulas en una escuela) y los almacenamos como archivos separados. O bien, podemos tener múltiples archivos que contienen información sobre diferentes atributos de actores (por ejemplo, un archivo podría ser cosas que conocemos de fuentes externas como edad, sexo, etc.; otro archivo podría contener información sobre qué partición de una gráfica cae cada actor). Es posible que queramos combinar toda la información de atributo en un solo archivo. O bien, podríamos tener información sobre diferentes relaciones entre un mismo conjunto de actores, que se han almacenado como archivos de datos separados (como en el ejemplo de las relaciones de “gusto” y “cónyuge”).

    Usando Data>Unir>Filas combinará dos o más matrices (almacenadas como archivos separados) en una sola matriz que tiene filas para todos los nodos en cada uno de los archivos. Si tuviera archivos separados que indicaran la edad de los alumnos en cada una de las dos aulas, y quisiera crear un solo archivo con todos los alumnos, se utilizaría el enfoque de “filas”.

    Usando Data>Unir>Columnas combinará dos o más matrices (almacenadas como archivos separados) en una sola matriz que tiene el mismo número de filas que cada uno de los archivos de entrada, pero agrega las columnas. Si tuviera información sobre edad y sexo para los actores A, B y C en un archivo e información sobre centralidad y grado para los actores A, B y C en otro, podría hacer una unión de columna para producir un archivo que enumerara edad, sexo, centralidad y grado para los actores A, B y C.

    Usando Data>Unir>Matrices combinará información sobre múltiples relaciones entre los mismos conjuntos de actores en un solo archivo. Cada archivo de entrada tiene los mismos actores por matriz de actores, pero para diferentes relaciones. El archivo de salida combina los múltiples archivos en una matriz tridimensional de actor por actor por relación.


    This page titled 6.5: Selección de subconjuntos de los datos is shared under a not declared license and was authored, remixed, and/or curated by Robert Hanneman & Mark Riddle.