Saltar al contenido principal
LibreTexts Español

6.2: Búsquedas y Consultas

  • Page ID
    88803
    • Anonymous
    • LibreTexts

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • El objetivo de esta sección es delinear los conceptos básicos del lenguaje SQL y comprender las diversas técnicas de consulta disponibles en un SIG.

    El acceso a herramientas sólidas de búsqueda y consulta es esencial para examinar las tendencias generales de un conjunto de datos. Las consultas son esencialmente preguntas planteadas a una base de datos. La visualización y recuperación selectiva de información basada en estas consultas son componentes esenciales de cualquier sistema de información geográfica (SIG). Existen tres métodos básicos para buscar y consultar datos de atributos: (1) selección, (2) consulta por atributo y (3) consulta por geografía.

    Selección

    La selección representa la forma más fácil de buscar y consultar datos espaciales en un SIG. Al seleccionar entidades se resaltan aquellos atributos de interés, tanto en pantalla como en la tabla de atributos, para su posterior visualización o análisis. Para lograr esto, se seleccionan puntos, líneas y polígonos simplemente usando el cursor para “apuntar y hacer clic” en la característica de interés o usando el cursor para arrastrar un cuadro alrededor de esas entidades. Alternativamente, se pueden seleccionar entidades utilizando un objeto gráfico, como un círculo, una línea o un polígono, para resaltar todas las entidades que se encuentran dentro del objeto. Las opciones avanzadas para seleccionar subconjuntos de datos del dataset más grande incluyen la creación de una nueva selección, la selección de las entidades seleccionadas actualmente, la adición a la selección actual y la eliminación de la selección actual.

    Consulta por Atributo

    Las entidades del mapa y sus datos asociados se pueden recuperar a través de la consulta de información de atributos dentro de las tablas de datos. Por ejemplo, las herramientas de búsqueda y consulta permiten al usuario mostrar todas las secciones censales que tienen una densidad de población de 500 o mayor, mostrar todos los condados que son menores o iguales a 100 kilómetros cuadrados, o mostrar todas las tiendas de conveniencia dentro de una milla de una carretera interestatal.

    Específicamente, SQL (Structured Query Language) es un lenguaje informático de uso común desarrollado para consultar datos de atributos dentro de un sistema de gestión de bases de datos relacionales. Creado por IBM en la década de 1970, SQL permite la recuperación de un subconjunto de información de atributos basado en criterios específicos definidos por el usuario a través de la implementación de elementos de lenguaje particulares. Más recientemente, el uso de SQL se ha extendido para su uso en un SIG (Shekhar y Chawla 2003) .Shekhar, S., y S. Chawla. 2003. Bases de Datos Espaciales: Un Tour. Upper Saddle River, NJ: Prentice Hall. Una nota importante relacionada con el uso de SQL es que la expresión exacta utilizada para consultar un conjunto de datos depende del formato de archivo SIG que se esté examinando. Por ejemplo, ANSI SQL es una versión particular que se utiliza para consultar geodatabases de ArcSDE, mientras que Jet SQL se utiliza para acceder a geodatabases personales. Del mismo modo, los shapefiles, las coberturas y las tablas dBase utilizan una versión restringida de SQL que no admite todas las características de ANSI SQL o Jet SQL.

    Como se discute en la Sección 5.2 “Administración de bases de datos geoespaciales”, todas las tablas de atributos en un sistema de gestión de bases de datos relacionales (RDBMS) utilizadas para una consulta SQL deben contener claves primarias y/o foráneas para su uso adecuado. Además de estas claves, SQL implementa cláusulas para estructurar consultas de bases de datos. Una cláusula es un elemento de lenguaje que incluye las instrucciones de consulta SELECT, FROM, WHERE, ORDER BY y HAVING.

    • SELECT denota qué campos de tabla de atributos desea ver.
    • FROM denota la tabla de atributos en la que reside la información.
    • WHERE denota los criterios definidos por el usuario para la información de atributo que debe cumplirse para que se incluya en el conjunto de salida.
    • ORDER BY denota la secuencia en la que se mostrará el conjunto de salida.
    • HAVING denota el predicado utilizado para filtrar la salida de la cláusula ORDER BY.

    Mientras que las cláusulas SELECT y FROM son ambas declaraciones obligatorias en una consulta SQL, la WHERE es una cláusula opcional utilizada para limitar el conjunto de salida. El ORDER BY y HAVING son cláusulas optativas utilizadas para presentar la información de manera interpretable.

    Figura 6.6 Direcciones personales en la tabla de atributos “ExampleTable”

    La siguiente es una serie de expresiones SQL y resultados cuando se aplican a la Figura 6.6 “Direcciones personales en la tabla de atributos “ExampleTable”. El título de la tabla de atributos es “ExampleTable”. Tenga en cuenta que el asterisco (*) denota un caso especial de SELECT en el que se seleccionan todas las columnas para un registro dado:

    SELECCIONAR * DE EjemploTabla DONDE Ciudad = “Upland”

    Esta declaración devuelve lo siguiente:

    Considera la siguiente declaración:

    SELECCIONAR Apellido DE EjemploTabla DONDE Estado = “CA” ORDER BY FirstName

    Esta instrucción da como resultado la siguiente tabla ordenada en orden ascendente por la columna FirstName (no incluida en la tabla de salida según lo indica la cláusula SELECT):

    Además de las cláusulas, SQL permite la inclusión de operadores específicos para delimitar aún más el resultado de la consulta. Estos operadores pueden ser relacionales, aritméticos o booleanos y normalmente aparecerán dentro de las declaraciones condicionales en la cláusula WHERE. Un operador relacional emplea las sentencias iguales a (=), menores que (<), menores o iguales a (< =), greater than (>), o mayores o iguales a (> =). Los operadores aritméticos son aquellas funciones matemáticas que incluyen suma (+), resta (−), multiplicación (*) y división (/). Los operadores booleanos (también llamados conectores booleanos) incluyen las instrucciones AND, OR, XOR y NOT. El conector AND se utiliza para seleccionar registros de la tabla de atributos que satisfagan ambas expresiones. El conector OR selecciona registros que satisfacen una o ambas expresiones. El conector XOR selecciona registros que satisfacen una y sólo una de las expresiones (el opuesto funcional del conector AND). Por último, el conector NOT se utiliza para negar (o deseleccionar) una expresión que de otro modo sería verdadera. Puesto en el lenguaje de probabilidad, el conector AND se utiliza para representar una intersección, OR representa una unión y NO representa un complemento. La Figura 6.7 “Diagrama de Venn de Operadores SQL” ilustra la lógica de estos conectores, donde los círculos A y B representan dos conjuntos de datos que se cruzan. Tenga en cuenta que SQL es un lenguaje muy exigente y las inconsistencias menores en la sentencia, como espacios adicionales, pueden resultar en una consulta fallida.

    Figura 6.7 Diagrama de Venn de Operadores SQL

    Utilizados juntos, estos operadores se combinan para proporcionar al usuario SIG opciones de búsqueda y consulta potentes y flexibles. Con esto en mente, ¿se puede determinar el conjunto de salida de la siguiente consulta SQL tal como se aplica a la Figura 6.1 “Histograma que muestra la distribución de frecuencias de las puntuaciones de los exámenes”?

    SELECCIONAR Apellidos, FirstName, StreetNumber DESDE EjemploTabla DONDE StreetNumber >= 10000 Y StreetNumber < 100 ORDEN POR Apellido

    Los siguientes son los resultados:

    Consulta por Geografía

    La consulta por geografía, también conocida como “consulta espacial”, permite resaltar características particulares al examinar su posición en relación con otras características. Por ejemplo, un SIG proporciona herramientas robustas que permiten determinar el número de escuelas dentro de 10 millas de un hogar. Varias opciones de consulta espacial están disponibles, como se describe aquí. A lo largo de esta discusión, la “capa objetivo” se refiere al dataset de entidades cuyos atributos están seleccionados, mientras que la “capa de origen” se refiere al dataset de entidades en el que se aplica la consulta espacial. Por ejemplo, si tuviéramos que usar un dataset de entidades poligonales de límite de estado para seleccionar autopistas de un dataset de entidades de línea (por ejemplo, seleccionar todas las autopistas que atraviesan el estado de Arkansas), la capa de estado es la fuente, mientras que la capa de carretera es el destino.

    • INTERSECT. Esta técnica de consulta espacial utilizada a menudo selecciona todas las entidades de la capa de destino que comparten una configuración regional común con la capa de origen. La consulta “intersectar” permite que las capas de puntos, líneas o polígonos se usen como capas de origen y de destino (Figura 6.8).

    Figura 6.8

    Las entidades azules y amarillas resaltadas se seleccionan porque se cruzan con las entidades rojas.

    • ESTAN A UNA DISTANCIA DE. Esta técnica requiere que el usuario especifique algún valor de distancia, que luego se usa para búfer (Figura 6.9).

    Figura 6.9

    Las entidades azules y amarillas resaltadas se seleccionan porque están dentro de la distancia seleccionada de las entidades rojas; las áreas de bronceado representan zonas de influencia alrededor de las diversas entidades.

    • CONTENER COMPLETAMENTE. Esta técnica de consulta espacial devuelve aquellas entidades que están completamente dentro de la capa de origen. Este tipo de consulta no selecciona entidades con límites coincidentes. La consulta “completamente contener” permite puntos, líneas o polígonos como capa de origen, pero solo se pueden usar polígonos como capa de destino (Figura 6.10).

    Figura 6.10

    Las características azules y amarillas resaltadas se seleccionan porque contienen completamente las características rojas.

    • ESTÁN COMPLETAMENTE DENTRO. Esta consulta selecciona aquellas entidades de la capa de destino cuya extensión espacial completa se produce dentro de la geometría de la capa de origen. La consulta “están completamente dentro” permite puntos, líneas o polígonos como capa de destino, pero solo se pueden usar polígonos como capa fuente (Figura 6.11).

    Figura 6.11

    Las características azules y amarillas resaltadas se seleccionan porque están completamente dentro de las características rojas.

    • TENER SU CENTRO EN. Esta técnica selecciona entidades de destino cuyo centro, o centroide, se encuentra dentro del límite del dataset de entidades de origen. La consulta “tener su centro en” permite que las capas de puntos, líneas o polígonos se usen como capas de origen y de destino (Figura 6.12).

    Figura 6.12

    Se seleccionan los rasgos azules y amarillos resaltados porque tienen sus centros en los rasgos rojos.

    • COMPARTE UN SEGMENTO DE LÍNEA Esta consulta espacial selecciona entidades de destino cuyas geometrías de contorno comparten un mínimo de dos vértices adyacentes con la capa de origen. La consulta “compartir un segmento de línea” permite que las capas de línea o polígono se usen para cualquiera de las capas de origen y de destino (Figura 6.13).

    Figura 6.13

    Las entidades azules y amarillas resaltadas se seleccionan porque comparten un segmento de línea con las entidades rojas.

    • TOCAR EL LÍMITE DE. Esta metodología es similar a la consulta espacial INTERSECT; sin embargo, selecciona entidades de línea y polígono que comparten un límite común con la capa de destino. La consulta “tocar el límite de” permite que las capas de línea o polígono se usen como capas de origen y de destino (Figura 6.14).

    Figura 6.14

    Las entidades azules y amarillas resaltadas se seleccionan porque tocan el límite de las entidades rojas.

    • SON IDÉGENOS A. Esta consulta espacial devuelve entidades que tienen exactamente la misma ubicación geográfica. La consulta “son idénticos a” se puede utilizar en puntos, líneas o polígonos, pero el tipo de capa de destino debe ser el mismo que el tipo de capa de origen (Figura 6.15).

    Figura 6.15

    Las características resaltadas en azul y amarillo se seleccionan porque son idénticas a las características rojas.

    • SE CRUZAN POR EL PERFORO DE. Este criterio de selección devuelve entidades que comparten un solo vértice pero no un segmento de línea completo. La consulta “están cruzados por el contorno de” permite que las capas de línea o polígono se usen como capas de origen y de destino (Figura 6.16).

    Figura 6.16

    Los rasgos azules y amarillos resaltados se seleccionan porque están cruzados por el contorno de los rasgos rojos.

    • CONTIENEN. Este método es similar a la consulta espacial COMPLETAMENTE CONTENER; sin embargo, las entidades en la capa de destino se seleccionarán incluso si los límites se superponen. La consulta “contener” permite entidades de punto, línea o polígono en la capa de destino cuando los puntos se utilizan como fuente; cuando las capas de destino de línea y polígono tienen una fuente de línea; y cuando solo las capas de destino de polígono con una fuente de polígono (Figura 6.17).

    Figura 6.17

    Las características resaltadas en azul y amarillo se seleccionan porque contienen las características rojas.

    • ESTÁN CONTENIDOS POR. Este método es similar a la consulta espacial ARE COMPLETAMENTE DENTRO; sin embargo, las entidades en la capa de destino se seleccionarán incluso si los límites se superponen. La consulta “están contenidos por” permite entidades de punto, línea o polígono en la capa de destino cuando se utilizan polígonos como origen; cuando las capas de destino de punto y línea tienen un origen de línea; y cuando solo las capas de destino de punto con una fuente de punto (Figura 6.18).

    Figura 6.18

    Las características azules y amarillas resaltadas se seleccionan porque están contenidas en las características rojas.

    Claves para llevar

    • Los tres métodos básicos para buscar y consultar datos de atributos son selección, consulta por atributo y consulta por geografía.
    • SQL es un lenguaje informático de uso común desarrollado para consultar datos por atributos dentro de un sistema de gestión de bases de datos relacionales.
    • Las consultas por geografía permiten al usuario resaltar las características deseadas examinando su posición en relación con otras características. Las once opciones diferentes de consulta por geografía enumeradas aquí están disponibles en la mayoría de los paquetes de software GIS.

    Ejercicios

    1. Utilizando la Figura 6.1 “Histograma que muestra la distribución de frecuencias de las puntuaciones de los exámenes”, desarrolle la declaración SQL que da como resultado la salida de todos los nombres de calles de personas que viven en Los Ángeles, ordenados por número de calle.
    2. Al consultar por geografía, ¿cuál es la diferencia entre una capa de origen y una capa de destino?
    3. ¿Cuál es la diferencia entre las consultas CONTIENEN, COMPLETAMENTE CONTIENEN y SON CONTENIDOS POR?

    This page titled 6.2: Búsquedas y Consultas is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Anonymous.