Saltar al contenido principal
LibreTexts Español

5.2: Gestión de Bases de Datos Geoespaciales

  • Page ID
    88790
    • Anonymous
    • LibreTexts

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • El objetivo de esta sección es comprender las propiedades básicas de un sistema de gestión de bases de datos relacionales.

    Una base de datos es una recopilación estructurada de archivos de datos. Un sistema de gestión de bases de datos (DBMS) es un paquete de software que permite la creación, almacenamiento, mantenimiento, manipulación y recuperación de grandes conjuntos de datos que se distribuyen sobre uno o más archivos. Un DBMS y sus funciones asociadas suelen ser accedidas a través de paquetes de software comerciales como Microsoft Access, Oracle, FileMaker Pro o Avanquest MyDatabase. La administración de bases de datos normalmente se refiere al manejo de datos tabulares en formato de fila y columna y se usa frecuentemente para actividades personales, comerciales, gubernamentales y científicas. Los sistemas de gestión de bases de datos geoespaciales, alternativamente, incluyen la funcionalidad de un DBMS pero también contienen información geográfica específica sobre cada punto de datos, como identidad, ubicación, forma y orientación. La integración de esta información geográfica con los datos de atributos tabulares de un DBMS clásico proporciona a los usuarios herramientas poderosas para visualizar y responder a las preguntas espacialmente explícitas que surgen en una sociedad cada vez más tecnológica.

    Existen varios tipos de modelos de bases de datos, como los modelos planos, jerárquicos, de red y relacionales (Worboys 1995; Jackson 1999) .Worboys, M. F. 1995. SIG: Una perspectiva informática. Londres: Taylor & Francis. , Jackson, M. 1999. “Treinta Años (y Más) de Bases de Datos”. Tecnología de Información y Software 41:969—78. Una base de datos plana es esencialmente una hoja de cálculo mediante la cual todos los datos se almacenan en una sola tabla grande (Figura 5.4 “Base de datos plana”). Una base de datos jerárquica también es un modelo bastante simple que organiza los datos en una asociación “uno a muchos” a través de los niveles (Figura 5.5 “Base de datos jerárquica”). Ejemplos comunes de este modelo incluyen árboles filogenéticos para la clasificación de plantas y animales y árboles genealógicos familiares que muestran relaciones padre-hijo. Sin embargo, las bases de datos de red son similares a las bases de datos jerárquicas porque también admiten relaciones de “muchos a muchos” (Figura 5.6 “Base de datos de red”). Esta capacidad ampliada permite una mayor flexibilidad de búsqueda dentro del conjunto de datos y reduce la redundancia potencial de información. Alternativamente, tanto los modelos jerárquicos como los de red pueden llegar a ser increíblemente complejos dependiendo del tamaño de las bases de datos y el número de interacciones entre los puntos de datos. El software moderno del sistema de información geográfica (SIG) emplea típicamente un cuarto modelo denominado base de datos relacional (Codd 1970) .Codd, E. 1970. “Un Modelo Relacional de Datos para Grandes Bancos de Datos Compartidos”. Comunicaciones de la Asociación para la Maquinaria Informática 13 (6): 377—87.

    Figura 5.4 Base de datos plana

    Figura 5.5 Base de datos jerárquica

    Figura 5.6 Base de datos de red

    Sistemas de Gestión de Bases de Datos Relacionales

    Un sistema de gestión de bases de datos relacionales (RDBMS) es una colección de tablas que están conectadas de tal manera que se puede acceder a esos datos sin reorganización de las tablas. Las tablas se crean de tal manera que cada columna representa un atributo particular (por ejemplo, tipo de suelo, número PIN, apellido, superficie) y cada fila contiene una instancia única de datos para ese atributo columnar (por ejemplo, Delhi Sands Soils, 5555, Smith, 412.3 acres)

    En el modelo relacional, cada tabla (no sorprendentemente llamada relación) se vincula entre sí a través de claves predeterminadas (Date 1995) .Date, C. 1995. Una introducción a los sistemas de bases de datos. Lectura, MA: Addison-Wesley. La clave primaria representa el atributo (columna) cuyo valor identifica de manera única un registro particular (fila) en la relación (tabla). Es posible que la clave primaria no contenga valores faltantes, ya que varios valores faltantes representarían entidades no únicas que violan la regla básica de la clave primaria. La clave primaria corresponde a un atributo idéntico en una tabla secundaria (y posiblemente tercera, cuarta, quinta, etc.) llamada clave externa. Esto da como resultado que toda la información de la primera tabla esté directamente relacionada con la información de la segunda tabla a través de las claves primaria y externa, de ahí el término DBMS “relacional”. Con estos enlaces en su lugar, las tablas dentro de la base de datos se pueden mantener muy simples, lo que resulta en un tiempo de cálculo mínimo y complejidad de archivos. Este proceso se puede repetir en muchas tablas siempre que cada una contenga una clave externa que corresponda a la clave principal de otra tabla.

    El modelo relacional tiene dos ventajas principales sobre los otros modelos de bases de datos descritos anteriormente. Primero, cada mesa ahora se puede preparar, mantener y editar por separado. Esto es particularmente útil cuando se considera el tamaño potencialmente enorme de muchas de las bases de datos modernas actuales. En segundo lugar, las tablas pueden mantenerse por separado hasta que la necesidad de una consulta o análisis en particular requiera que las tablas se relacionen. Esto crea un gran grado de eficiencia para el procesamiento de la información dentro de una base de datos determinada.

    Puede llegar a ser evidente para el lector que existe un gran potencial de redundancia en este modelo ya que cada tabla debe contener un atributo que corresponda a un atributo en todas las demás tablas relacionadas. Por lo tanto, la redundancia debe ser monitoreada y administrada activamente en un RDBMS. Para lograrlo, se han desarrollado un conjunto de reglas llamadas formas normales (Codd 1970) .Codd, E. 1970. “Un Modelo Relacional de Datos para Grandes Bancos de Datos Compartidos”. Comunicaciones de la Asociación para la Maquinaria Informática 13 (6): 377—87. Hay tres formas normales básicas. La primera forma normal (Figura 5.7 “Primera Violación de Forma Normal (arriba) y Fijo (abajo)”) se refiere a cinco condiciones que deben cumplirse (Fecha 1995) .Fecha, C. 1995. Una introducción a los sistemas de bases de datos. Lectura, MA: Addison-Wesley. Son los siguientes:

    1. No hay secuencia para el orden de las filas.
    2. No hay secuencia para el orden de las columnas.
    3. Cada fila es única.
    4. Cada celda contiene uno y solo un valor.
    5. Todos los valores de una columna pertenecen al mismo tema.

    Figura 5.7 Primera violación de forma normal (arriba) y Corrección (abajo)

    La segunda forma normal establece que cualquier columna que no sea una clave primaria debe ser dependiente de la clave primaria. Esto reduce la redundancia al eliminar el potencial de múltiples claves primarias en varias tablas. Este paso suele implicar la creación de nuevas tablas para mantener la normalización.

    Figura 5.8 Violación de la segunda forma normal (arriba) y Fix (abajo)

    La tercera forma normal establece que todas las claves no primarias deben depender de la clave primaria, mientras que la clave primaria permanece independiente de todas las claves no primarias. Esta forma fue ingeniosamente resumida por Kent (1983) Kent, W. 1983. “Una Guía Simple de Cinco Formas Formales en la Teoría de Bases de Datos Relacionales”. Comunicaciones de la Asociación para la Computación y la Maquinaria. 26 (2): 120—25. quien bromeó que todas las claves no primarias “deben proporcionar un hecho sobre la clave, toda la clave, y nada más que la clave”. Haciéndose eco de esta cita se hace eco de la oposición: “así que ayúdame Codd” (comunicación personal con Foresman 1989).

    Figura 5.9 Tercera Violación de Forma Normal (arriba) y Corrección (abajo)

    Se une y se relaciona

    Una ventaja adicional de un RDBMS es que permite que los datos de atributos en tablas separadas se vinculen de manera post hoc. Las dos operaciones comúnmente utilizadas para lograr esto son la unión y la relación. La operación de unión agrega los campos de una tabla a una segunda tabla mediante el uso de un atributo o campo que es común a ambas tablas. Esto se utiliza comúnmente para combinar información de atributos de una o más tablas de datos no espaciales (es decir, información tomada de informes o documentos) con una capa de entidades SIG espacialmente explícita. Un segundo tipo de unión combina información de entidades basada en la ubicación espacial y la asociación en lugar de en atributos comunes. En ArcGIS, hay disponibles tres tipos de combinaciones espaciales. Los usuarios pueden (1) hacer coincidir cada característica con la característica más cercana, (2) hacer coincidir cada característica con la característica de la que forma parte, o (3) hacer coincidir cada característica con la característica que interseca.

    Alternativamente, la operación de relacionar asocia temporalmente dos capas o tablas de mapa mientras las mantiene físicamente separadas. Las relaciones son bidireccionales, por lo que se puede acceder a los datos desde una de las tablas seleccionando registros en la otra tabla. La operación de relacionar también permite la asociación de tres o más tablas, si es necesario.

    A veces puede no estar claro en cuanto a qué operación se debe usar. Como regla general, las uniones son más adecuadas para instancias que involucran relaciones uno a uno o muchos a uno. Las uniones también son ventajosas debido a que los datos de las dos tablas son fácilmente observables en la tabla de salida única. El uso de relatos, por otro lado, son adecuados para todas las relaciones de mesa (uno a uno, uno a muchos, muchos a uno y muchos a muchos); sin embargo, pueden ralentizar el tiempo de acceso a la computadora si las mesas son particularmente grandes o están distribuidas en ubicaciones remotas.

    Claves para llevar

    • Los sistemas de gestión de bases de datos pueden ser planos, jerárquicos, de red o relacionales.
    • Los sistemas de administración de bases de datos relacionales (RDBMS) utilizan claves primarias y claves externas para vincular tablas de datos.
    • El modelo RDBMS reduce la redundancia de datos al emplear tres “formas normales” básicas.

    Ejercicio

    1. Identificar las tres violaciones de las formas normales en la siguiente tabla.
    Instructor Clase Número de Clase Matrícula
    Lennon Cálculo Avanzado 10073 34
    McCartney Educación Física Introductoria 10045 23
    Harrison Reparación de automóviles y feminismo 10045 54
    Starr, Mejor Física cuántica 10023 39

    This page titled 5.2: Gestión de Bases de Datos Geoespaciales is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Anonymous.