Saltar al contenido principal
LibreTexts Español

5.1: Adquisición de datos geográficos

  • Page ID
    88789
    • Anonymous
    • LibreTexts

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • El objetivo de esta sección es introducir diferentes tipos de datos, escalas de medición y métodos de captura de datos.

    La adquisición de datos geográficos es un factor importante en cualquier esfuerzo del Sistema de Información Geográfica (SIG). Se ha estimado que la adquisición de datos suele consumir del 60 al 80 por ciento del tiempo y dinero gastado en cualquier proyecto dado. Por lo tanto, se debe tener cuidado para que los proyectos SIG sigan siendo conscientes de sus metas declaradas para que la recolección de datos espaciales proceda de manera eficiente y efectiva como sea posible. Este capítulo describe las muchas formas y fuentes de datos geoespaciales disponibles para su uso en un SIG.

    Tipos de datos

    El tipo de datos que empleamos para ayudarnos a entender una entidad determinada viene determinado por (1) lo que estamos examinando, (2) lo que queremos saber sobre esa entidad, y (3) nuestra capacidad para medir esa entidad a una escala deseada. Los tipos más comunes de datos disponibles para su uso en un SIG son cadenas alfanuméricas, números, valores booleanos, fechas y binarios.

    Una cadena alfanumérica, o texto, tipo de datos es cualquier combinación simple de letras y números que pueden o no formar palabras coherentes. El tipo de datos numéricos se puede subcategorizar como coma flotante o entero. Un punto flotante es cualquier valor de datos que contiene dígitos decimales, mientras que un entero es cualquier valor de datos que no contenga dígitos decimales. Los enteros pueden ser cortos o largos dependiendo de la cantidad de dígitos significativos en ese número. También, se basan en el concepto del “bit” en una computadora. Como recordarás, un bit es la unidad de información más básica en una computadora y almacena valores en uno de dos estados: 1 o 0. Por lo tanto, un atributo de 8 bits consistiría en ocho 1s o 0s en cualquier combinación (por ejemplo, 10010011, 00011011, 11100111).

    Los enteros cortos son valores de 16 bits y, por lo tanto, se pueden usar para caracterizar números que van de −32.768 a 32.767 o de 0 a 65.535 dependiendo de si el número está firmado o sin signo (es decir, contiene un signo + o −). Los enteros largos, alternativamente, son valores de 32 bits y por lo tanto pueden caracterizar números que van de −2,147,483,648 a 2,147,483,647 o de 0 a 4,294,967.295.

    Un único valor de coma flotante de precisión ocupa 32 bits, como el entero largo. Sin embargo, este tipo de datos proporciona un valor de hasta 7 bits a la izquierda del decimal (un valor máximo de 128, o 127 si está firmado) y valores de hasta 23 bits a la derecha del punto decimal (aproximadamente 7 dígitos decimales). Un valor de coma flotante de doble precisión almacena esencialmente dos valores de 32 bits como un solo valor. Los flotadores de doble precisión, entonces, pueden representar un valor con hasta 11 bits a la izquierda del punto decimal y valores con hasta 52 bits a la derecha del decimal (aproximadamente 16 dígitos decimales) (Figura 5.1 “Punto flotante de doble precisión (Valor de 64 bits), como Almacenado en una Computadora”).

    Figura 5.1 Punto flotante de precisión doble (valor de 64 bits), tal como se almacena en una computadora

    Los valores booleanos, de fecha y binarios son menos complejos. Los valores booleanos son simplemente aquellos valores que se consideran verdaderos o falsos en función de la aplicación de un operador booleano como AND, OR y NOT. El tipo de datos de fecha es presumiblemente autoexplicativo, mientras que el tipo de datos binarios representa atributos cuyos valores son 1 o 0.

    Escala de medición

    Además de definir datos por tipo, una escala de medición actúa para agrupar datos según el nivel de complejidad (Stevens 1946) .Stevens, S. S. 1946. “Sobre la Teoría de las Escalas de Medición”. Ciencia 103 (2684): 677—80. Para fines de análisis SIG, las escalas de medición pueden agruparse en dos categorías generales. Los datos nominales y ordinales representan datos categóricos; los datos de intervalo y relación representan datos numéricos.

    La escala de medición de datos más simple es la escala nominal o nombrada. La escala nominal hace declaraciones sobre cómo llamar puntos de datos pero no permite comparaciones escalares entre un objeto y otro. Por ejemplo, la atribución de información nominal a un conjunto de puntos que representan ciudades describirá si el lugar dado es “Los Ángeles” o “Nueva York”. Sin embargo, no se pueden hacer más denotaciones, como población o historial de votación, sobre esos locales. Otros ejemplos de datos nominales incluyen apellido, color de ojos, tipo de uso del suelo, etnia y género.

    Los datos ordinales colocan la información de atributos en rangos y por lo tanto producen información escalada con mayor precisión que los datos nominales. Los datos ordinales describen la posición en la que ocurren los datos, como primero, segundo, tercero, y así sucesivamente. Estas escalas también pueden tomar nombres, como “muy insatisfecho”, “insatisfecho”, “satisfecho” y “muy satisfecho”. Aunque esta escala de medición indica la clasificación de cada punto de datos en relación con otros puntos de datos, la escala ordinal no denota explícitamente la diferencia cuantitativa exacta entre estas clasificaciones. Por ejemplo, si un atributo ordinal representa qué corredor llegó en primer, segundo o tercer lugar, no indica por cuánto tiempo el corredor ganador venció al corredor del segundo lugar. Por lo tanto, no se pueden realizar operaciones aritméticas con datos ordinales. Sólo la secuencia es explícita.

    Una escala de medición que permite hacer declaraciones cuantitativas precisas sobre los atributos son los datos de intervalo. Los datos de intervalo se miden a lo largo de una escala en la que cada posición es equidistante entre sí. Las lecturas de elevación y temperatura son representaciones comunes de los datos de intervalos. Por ejemplo, se puede determinar a través de esta escala que 30 ºF es 5 ºF más cálido que 25 ºF. Una propiedad notable de la escala de intervalo es que cero no es un valor significativo en el sentido de que cero no representa la nada, o la ausencia de un valor. En efecto, 0 ºF no indica que no exista temperatura. De igual manera, una elevación de 0 pies no indica falta de elevación; más bien, indica el nivel medio del mar.

    Los datos de relación son similares a la escala de medición de intervalos; sin embargo, se basan en un valor cero significativo. La densidad poblacional es un ejemplo de datos de ratio donde una densidad de población 0 indica que ninguna gente vive en la zona de interés. De manera similar, la escala de temperatura Kelvin es una escala de relación ya que 0 K implica que ningún calor (temperatura) es medible dentro del atributo dado.

    Específicos para conjuntos de datos numéricos, los valores de datos también pueden considerarse discretos o continuos. Los datos discretos son aquellos que mantienen un número finito de valores posibles, mientras que los datos continuos pueden ser representados por un número infinito de valores. Por ejemplo, el número de árboles maduros en una pequeña propiedad necesariamente estará entre uno y cien (por el bien del argumento). Sin embargo, la altura de esos árboles representa un valor de datos continuo ya que hay un número infinito de valores potenciales (por ejemplo, un árbol puede tener 20 pies de altura, 20.1 pies o 20.15 pies, 20.157 pies, etc.).

    Captura de Datos Primarios

    Ahora que tenemos una idea de los diferentes tipos de datos y escalas de medición disponibles para su uso en un SIG, debemos dirigir nuestros pensamientos sobre cómo se pueden adquirir estos datos. La captura primaria de datos es una metodología de adquisición directa de datos que generalmente se asocia con algún tipo de esfuerzo en el campo. En el caso de los datos vectoriales, los datos capturados directamente comúnmente provienen de un sistema de posicionamiento global (GPS) u otro tipo de equipos de topografía como una estación total (Figura 5.2 “Unidad GPS (izquierda) y Estación Total (derecha)”). Las estaciones totales son instrumentos especializados, primarios de captura de datos que combinan un teodolito (o tránsito), que mide ángulos horizontales y verticales, con una herramienta para medir la distancia de pendiente desde la unidad hasta un punto observado. El uso de una estación total permite que los equipos de campo deriven de forma rápida y precisa la topografía de un paisaje en particular.

    Figura 5.2 Unidad GPS (izquierda) y Estación Total (derecha)

    En el caso del GPS, las unidades portátiles acceden a los datos posicionales de los satélites y registran la información para su posterior recuperación. Una red de veinticuatro satélites de navegación se encuentra en todo el mundo y proporciona información precisa de coordenadas para cualquier punto de la superficie terrestre (Figura 5.3 “Satélite de imágenes de la Tierra que captura datos primarios”). Mantener una línea de visión a cuatro o más de estos satélites proporciona al usuario información de ubicación razonablemente precisa. Estas ubicaciones se pueden recopilar como puntos individuales o se pueden vincular entre sí para formar líneas o polígonos dependiendo de las preferencias del usuario. Los datos de atributos como el tipo de uso del suelo, el número de polo telefónico y el nombre del río pueden ser ingresados simultáneamente por el usuario. Estos datos de ubicación y atributos se pueden cargar en el SIG para su visualización. Dependiendo de la marca y modelo del GPS, esta carga suele requerir algún tipo de conversión intermedia de archivos a través del software proporcionado por el fabricante de la unidad GPS. Sin embargo, hay algunos recursos gratuitos en línea que pueden convertir datos GPS de un formato a otro. GPSBabel es un ejemplo de tal recurso en línea (http://www.gpsvisualizer.com/gpsbabel).

    Además de la típica unidad GPS que se muestra en la Figura 5.2 “Unidad GPS (izquierda) y Estación Total (derecha)”, el GPS se está incorporando cada vez más a otras nuevas tecnologías. Por ejemplo, los teléfonos inteligentes ahora incorporan capacidades GPS como un componente tecnológico estándar. Estas unidades de teléfono/GPS mantienen una precisión comparable a las unidades GPS independientes de precios similares y son en gran parte responsables de un renacimiento para facilitar la captura de datos portátiles y en tiempo real y el intercambio con las masas. La ubicuidad de esta tecnología condujo a una proliferación de alternativas de adquisición de datos de colaboración colectiva. Crowdsourcing es un método de recolección de datos mediante el cual los usuarios contribuyen libremente a construir bases de datos espaciales Esta metodología de rápida expansión se utiliza en aplicaciones como la aplicación MapShare de TomTom, Google Earth, Bing Maps y ArcGIS.

    Los datos ráster obtenidos a través de la captura directa provienen más comúnmente de fuentes de detección remota (Figura 5.3 “Earth Imaging Satellite Capturando datos primarios”). Los datos de detección remota ofrecen la ventaja de obviar la necesidad de acceso físico al área que se está fotografiando. Además, enormes extensiones de tierra se pueden caracterizar con poco o ningún tiempo adicional y mano de obra por parte del investigador. Por otro lado, se requiere la validación de los datos detectados remotamente para asegurar que el sensor no solo esté funcionando correctamente sino que esté correctamente calibrado para recopilar la información deseada. Los satélites y las cámaras aéreas proporcionan las fuentes más ubicuas de datos ráster de captura directa (Sección 4.3.1 “Imágenes de satélite”).

    Figura 5.3 Satélite de imágenes terrestres que captura datos primarios

    Captura de datos secundarios

    La captura de datos secundarios es una metodología indirecta que utiliza la gran cantidad de datos geoespaciales existentes disponibles tanto en formato digital como impreso. Antes de iniciar cualquier esfuerzo de SIG, siempre es aconsejable minar recursos en línea para los datos SIG existentes que puedan satisfacer sus necesidades de mapeo sin el paso potencialmente intensivo de crear los datos desde cero. Dichos datos digitales de SIG están disponibles de diversas fuentes incluyendo agencias internacionales (CGIAR, CIESIN, Naciones Unidas, Banco Mundial, etc.); gobiernos federales (USGS, USDA, NOAA, USFWS, NASA, EPA, US Census, etc.); gobiernos estatales (CDFG, Teale Data Center, INGIS, MARIS, NH GIS Resources, etc.); locales gobiernos (SANDAG, RCLIS, etc.); sitios web universitarios (UCLA, Duke, Stanford, University of Chicago, Indiana Spatial Data Portal, etc.); y sitios web comerciales (ESRI, GeoEye, Geocomm, etc.). Estos datos secundarios están disponibles en una amplia variedad de tipos de archivos, extensiones y tamaños, pero están listos para ser utilizados en la mayoría de los paquetes de software SIG. A menudo estos datos son gratuitos, pero muchos sitios cobrarán una tarifa por el acceso a la información propietaria que hayan desarrollado.

    Si bien estas fuentes de datos son todos casos en los que la información se ha convertido a formato digital y se ha proyectado adecuadamente para su uso en un SIG, también existe una gran cantidad de información espacial que se puede obtener de fuentes no digitales existentes. Los mapas en papel, por ejemplo, pueden contener información actual o histórica sobre una localidad que no se puede encontrar en formato digital. En este caso, el proceso de digitalización se puede utilizar para crear archivos digitales a partir de la copia original en papel. Existen tres métodos principales para digitalizar la información espacial: dos son manuales y uno automatizado.

    La digitalización de tabletas es un método manual de captura de datos mediante el cual un usuario ingresa información de coordenadas en una computadora mediante el uso de una tableta digitalizadora y un disco de digitalización. Para comenzar, se asegura un mapa en papel a una tableta digitalizadora retroiluminada. La luz de fondo permite que todas las características del mapa se observen fácilmente, lo que reduce la fatiga visual. Las coordenadas de las entidades de punto, línea y/o polígono en el mapa de papel se ingresan luego en un archivo digital, ya que el usuario emplea un disco, que es similar a un mouse multibotón con un punto de mira, para “hacer clic” alrededor de los vértices de cada entidad deseada. El archivo digital resultante deberá ser georreferenciado correctamente después de completar la tarea de digitalización para garantizar que esta información se alinee correctamente con los conjuntos de datos existentes.

    La digitalización frontal, el segundo método manual de captura de datos, se conoce como digitalización “en pantalla”. La digitalización heads-up se puede utilizar en mapas en papel o en archivos digitales existentes. En el caso de un mapa en papel, el mapa primero debe escanearse en la computadora a una resolución lo suficientemente alta que permita resolver todas las características pertinentes. Segundo, la imagen ahora digital debe ser registrada para que el mapa se ajuste a un sistema de coordenadas existente. Para ello, el usuario puede ingresar puntos de control en la pantalla y transformar, o “hoja de goma”, la imagen escaneada en coordenadas del mundo real. Finalmente, el usuario simplemente hace zoom a áreas específicas en el mapa y rastrea los puntos, líneas y/o polígonos, similar al ejemplo de digitalización de tabletas. La digitalización frontal es particularmente simple cuando se utilizan archivos SIG existentes, imágenes de satélite o fotografías aéreas como línea de base. Por ejemplo, si un usuario planea digitalizar el límite de un lago tal como se ve desde una imagen de satélite georreferenciada, se pueden omitir los pasos de escaneo y registro, y la información de proyección de la imagen de origen puede simplemente copiarse en el archivo digitalizado.

    El tercer método automatizado de captura de datos secundarios requiere que el usuario escanee un mapa en papel y vectorice la información en él. Este método de vectorización normalmente requiere un paquete de software específico que pueda convertir un escaneo ráster en líneas vectoriales. Esto requiere un escaneo limpio y de muy alta resolución. Si la imagen no está limpia, todas las imperfecciones del mapa probablemente se convertirán en puntos falsos/líneas/polígonos en la versión digital. Si un escaneo limpio no está disponible, a menudo es más rápido usar una metodología de digitalización manual. Independientemente, este método es mucho más rápido que los métodos manuales mencionados anteriormente y puede ser la mejor opción si se deben digitalizar múltiples mapas y/o si el tiempo es un factor limitante. A menudo, se emplea un enfoque semiautomático mediante el cual se escanea y vectoriza un mapa, seguido de una sesión de digitalización heads-up para editar y reparar cualquier error ocurrido durante la automatización.

    El método final de captura secundaria de datos que vale la pena señalar es el uso de información de informes y documentos. Mediante este método, se ingresa información de informes y documentos en la tabla de atributos de un archivo SIG digital existente que contiene todos los puntos, líneas y polígonos pertinentes. Por ejemplo, la nueva información específica de las secciones censales puede estar disponible después de un estudio científico. El usuario SIG simplemente necesita descargar el archivo SIG existente de las secciones censales y comenzar a ingresar la información del informe del estudio directamente en la tabla de atributos. Si las tablas de datos están disponibles digitalmente, el uso de las funciones “unir” y “relacionar” en un SIG (Sección 5.2.2 “Se une y relaciona”) suele ser extremadamente útil ya que automatizarán gran parte del esfuerzo de entrada de datos.

    Claves para llevar

    • Los tipos más comunes de datos disponibles para su uso en un SIG son cadenas alfanuméricas, números, valores booleanos, fechas y binarios.
    • Los datos nominales y ordinales representan datos categóricos, mientras que los datos de intervalo y relación representan datos numéricos.
    • Las metodologías de captura de datos se derivan de fuentes primarias o secundarias.

    Ejercicios

    1. Los siguientes datos se derivan de qué escala de medición?
      1. Mi puntaje de felicidad en una escala de 1 a 10 = 7
      2. Mi peso = 192 lbs.
      3. La ciudad en la que vivo = Culver City
      4. Mi temperatura corporal actual = 99.8 ºF
      5. El número de hamburguesas con queso que puedo comer antes de desmayarme = 12
      6. Mi número de placa = 1LUVG1S
    2. Describa al menos dos métodos diferentes para agregar la información de un mapa topográfico del USGS a su dataset SIG.

    This page titled 5.1: Adquisición de datos geográficos is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Anonymous.