Saltar al contenido principal
LibreTexts Español

5.3: Formatos de archivo

  • Page ID
    88786
    • Anonymous
    • LibreTexts

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • El objetivo de esta sección es ver una muestra de los tipos más comunes de formatos de archivo vectoriales, ráster e híbridos.

    Los datos geoespaciales se almacenan en muchos formatos de archivo diferentes. Cada paquete de software del sistema de información geográfica (SIG) y cada versión de estos paquetes de software, soporta diferentes formatos. Esto es cierto tanto para los datos vectoriales como ráster. Aunque aquí se resumen varios de los formatos de archivo más comunes, existen muchos otros formatos para su uso en diversos programas SIG.

    Formatos de archivo vectoriales

    El formato de archivo vectorial más común es el shapefile. Los shapefiles, desarrollados por ESRI a principios de la década de 1990 para su uso con el paquete de software de administración de bases de datos dBase III en ArcView 2, son archivos simples y no topológicos desarrollados para almacenar la ubicación geométrica y la información de atributos de las características geográficas. Los shapefiles son incapaces de almacenar valores nulos, así como anotaciones o entidades de red. Los nombres de campo dentro de la tabla de atributos están limitados a diez caracteres, y cada shapefile puede representar solo conjuntos de entidades de punto, línea o polígono. Los tipos de datos admitidos están limitados a punto flotante, entero, fecha y texto. Los shapefiles son compatibles con casi todo el software GIS comercial y de código abierto.

    A pesar de ser llamado “shapefile”, este formato es en realidad una compilación de muchos archivos diferentes. La Tabla 5.1 “Tipos de archivos Shapefile” enumera y describe los diferentes formatos de archivo asociados con el shapefile. Entre los enumerados, solo los formatos de archivo SHP, SHX y DBF son obligatorios para crear un shapefile que funcione, mientras que todos los demás son condicionalmente requeridos. Como regla general, los nombres de cada archivo deben ajustarse a la convención MS-DOS 8.3 cuando se utilizan versiones anteriores de paquetes de software GIS. Según esta convención, el prefijo de nombre de archivo puede contener hasta ocho caracteres, y el sufijo de nombre de archivo contiene tres caracteres. Los paquetes de software GIS más recientes han relajado este requisito y aceptarán prefijos de nombre de archivo más largos.

    Tabla 5.1 Tipos de archivos Shapefile

    Extensión de archivo Propósito
    SHP* Geometría de operación
    SHX* Formato de índice para la geometría de la entidad
    DBF* Información de atributos de entidad en formato dBASE IV
    PRJ Información de proyección
    SBN y SBX Índice espacial de las entidades
    FBN y FBX Índice espacial de solo lectura de las entidades
    AIN y AIH Información de atributos para campos activos en la tabla
    IXS Índice de geocodificación para shapefiles de lectura-escritura
    MXS Índice de geocodificación para shapefiles de lectura-escritura con formato ODB
    ATX Índice de atributos utilizado en ArcGIS 8 y versiones posteriores
    SHP.XML Metadatos en formato XML
    CPG Especificaciones de página de códigos para identificar la codificación de caracteres
    * Indica archivos obligatorios

    El archivo de formato vectorial más antiguo para su uso en paquetes de software SIG, que todavía se usa hoy en día, es la cobertura de ArcInfo. Este formato de archivo georelacional admite múltiples tipos de entidades (p. ej., puntos, líneas, polígonos, anotaciones) al tiempo que almacena la información topológica asociada con esas entidades. Los datos de atributos se almacenan como múltiples archivos en un directorio separado etiquetado como “Info”. Debido a su creación en un entorno MS-DOS, estos archivos mantienen estrictas convenciones de nomenclatura. Los nombres de archivo no pueden tener más de trece caracteres, no pueden contener espacios, no pueden comenzar con un número y deben estar completamente en minúsculas. Las coberturas no se pueden editar en ArcGIS 9.x o versiones posteriores del paquete de software de ESRI.

    La Oficina del Censo de Estados Unidos mantiene un tipo específico de shapefile denominado TIGER o TIGER/LINE (Sistema de Codificación y Referencia Geográfica Topologicamente Integrada). A pesar de que estos archivos de código abierto no contienen información censal real, mapean características como tractos censales, carreteras, ferrocarriles, edificios, ríos y otras características que apoyan y mejoran la oficina y mejoran la capacidad de #8217; s de recopilar información censal. Los shapefiles tiger/line, publicados por primera vez en 1990, son topológicamente explícitos y están vinculados al Archivo Maestro de Direcciones (MAF) de la Oficina del Censo, permitiendo así la geocodificación de las direcciones de calles. Estos archivos son gratuitos para el público y pueden descargarse libremente de proveedores privados que admitan el formato.

    El AutoCAD DXF (Drawing Interchange Format o Drawing Exchange Format) es un formato de archivo vectorial patentado desarrollado por Autodesk para permitir el intercambio entre software CAD (diseño asistido por computadora) basado en ingeniería y otros paquetes de software de mapeo. Los archivos DXF se lanzaron originalmente en 1982 con el propósito de proporcionar una representación exacta del formato DWG nativo de AutoCAD. Aunque el DXF todavía se usa comúnmente, las versiones más recientes de AutoCAD han incorporado tipos de datos más complejos (por ejemplo, regiones, bloques dinámicos) que no son compatibles con el formato DXF. Por lo tanto, se puede presumir que el formato DXF puede llegar a ser menos popular en el análisis geoespacial a lo largo del tiempo.

    Finalmente, el Servicio Geológico de Estados Unidos (USGS) mantiene un formato de archivo vectorial de código abierto que detalla las características físicas y culturales en todo Estados Unidos. Estos DLG topológicamente explícitos (Digital Line Graphics) vienen en escala grande, intermedia y pequeña dependiendo de si se derivan de mapas topográficos de cuadrilátero USGS a escala 1:24 ,000; 1:100 ,000 o 1:2 ,000,000. Las características disponibles en los diferentes tipos de DLG dependen de la escala del DLG pero generalmente incluyen datos como límites administrativos y políticos, hidrografía, sistemas de transporte, hipsografía y cobertura terrestre.

    Los archivos de datos vectoriales también se pueden estructurar para representar información de elevación de superficie. Una TIN (Red Irregular Triangulada) es una estructura de datos vectoriales de código abierto que utiliza triángulos contiguos y no superpuestos para representar superficies geográficas (Figura 5.10 “Red Irregular Triangulada (TIN)”). Mientras que la representación ráster de una superficie representa la elevación como un valor promedio sobre la extensión espacial del píxel individual (consulte la Sección 5.3.2 “Formatos de archivo ráster”), la estructura de datos TIN modela cada vértice del triángulo como un valor de elevación exacto en un punto específico de la tierra. Los arcos entre cada vértice son una aproximación de la elevación entre dos vértices. Estos arcos se agregan luego en triángulos a partir de los cuales la información sobre elevación, pendiente, aspecto y área de superficie se puede derivar en toda la extensión del espacio del modelo. Obsérvese que el término “irregular” en el nombre del modelo de datos se refiere al hecho de que los vértices suelen estar dispuestos de manera dispersa.

    Figura 5.10 Red Irregular Triangulada (TIN)

    El uso de TIN confiere ciertas ventajas sobre los modelos de elevación basados en ráster (consulte la Sección 5.3.2 “Formatos de archivo ráster”). Primero, las entidades topográficas lineales se representan con mucha precisión en relación con su contraparte ráster. En segundo lugar, se necesita un número comparativamente pequeño de puntos de datos para representar una superficie, por lo que los tamaños de archivo suelen ser mucho más pequeños. Esto es particularmente cierto ya que los vértices pueden agruparse en áreas donde el relieve es complejo y puede ser escaso en áreas donde el relieve es simple. En tercer lugar, los datos de elevación específicos pueden incorporarse al modelo de datos de manera post hoc mediante la colocación de vértices adicionales si el original se considera insuficiente o inadecuado. Finalmente, se pueden calcular ciertas estadísticas espaciales que no se pueden obtener cuando se utiliza un modelo de elevación basado en ráster, como delineación de llanuras de inundación, curvas de capacidad de almacenamiento para embalses y curvas de área de tiempo para hidrogramas.

    Formatos de archivo ráster

    Una multitud de tipos de formato de archivo ráster están disponibles para su uso en SIG. La selección de formatos ráster ha aumentado drásticamente con la amplia disponibilidad de imágenes de cámaras digitales, grabadoras de video, satélites, etc. Las imágenes ráster suelen ser de 8 bits (256 colores) o 24 bits (16 millones de colores). Debido a los continuos avances tecnológicos, los tamaños de los archivos de imágenes ráster se han vuelto cada vez más grandes. Para hacer frente a esta posible restricción, se utilizan comúnmente dos tipos de compresión de archivos: sin pérdida y con pérdida. La compresión sin pérdidas reduce el tamaño del archivo sin disminuir la calidad de la imagen. La compresión con pérdida intenta explotar las limitaciones del ojo humano al eliminar información de la imagen que no se puede detectar. Como puede adivinar, la compresión con pérdida da como resultado tamaños de archivo más pequeños que la compresión sin pérdidas.

    Entre los archivos raster más comunes utilizados en la web se encuentran los formatos JPEG, TIFF y PNG, todos los cuales son de código abierto y se pueden usar con la mayoría de los paquetes de software GIS. Los formatos raster JPEG (Joint Photographic Experts Group) y TIFF (Tagged Image File Format) son los más utilizados por las cámaras digitales para almacenar valores de 8 bits para cada uno de los espacios de colores rojo, azul y verde (y a veces colores de 16 bits, en el caso de las imágenes TIFF). Los JPEG admiten compresión con pérdidas, mientras que los TIFF pueden ser con pérdida o sin pérdidas. A diferencia de JPEG, las imágenes TIFF se pueden guardar en espacios de color RGB o CMYK. Los archivos PNG (Portable Network Graphics) son imágenes de 24 bits que admiten compresión con pérdida o sin pérdida. Los archivos PNG están diseñados para una visualización eficiente en navegadores basados en la web como Internet Explorer, Mozilla Firefox, Netscape y Safari.

    Los archivos JPEG, TIFF y PNG nativos no tienen información georreferenciada asociada a ellos y, por lo tanto, no se pueden usar en ningún esfuerzo de mapeo geoespacial. Para emplear estos archivos en un SIG, primero se debe crear un archivo mundial. Un archivo de mundo es un archivo de datos de texto sin formato separado que especifica las ubicaciones y transformaciones que permiten que la imagen se proyecte en un sistema de coordenadas estándar (por ejemplo, Universal Transverse Mercator [UTM] o State Plane). El nombre de archivo del archivo mundial se basa en el nombre del archivo ráster, mientras que normalmente se agrega una w a la extensión del archivo. El nombre de extensión de archivo mundial para un JPEG es JPW; para un TIFF, es TFW; y para un PNG, PGW.

    Un ejemplo de un formato de archivo ráster con información de georreferenciación explícita es el formato propietario MrSID (Multiresolution Seamless Image Database). Este formato de compresión sin pérdidas fue desarrollado por LizardTech, Inc., para su uso con grandes fotografías aéreas o imágenes de satélite, por lo que porciones de una imagen comprimida se pueden ver rápidamente sin tener que descomprimir todo el archivo. El formato MrSID se utiliza frecuentemente para visualizar ortofotos.

    Al igual que MrSid, el formato propietario ECW (Enhanced Compression Wavelet) también incluye información de georreferenciación dentro de la estructura de archivos Este formato de compresión con pérdidas fue desarrollado por Earth Resource Mapping y admite hasta 255 capas de información de imagen. Debido a los tamaños de archivo potencialmente enormes asociados con una imagen que soporta tantas capas, los archivos ECW representan una excelente opción para realizar análisis rápidos en imágenes grandes mientras se usa una cantidad relativamente pequeña de la RAM (Random Access Memory) de la computadora, acelerando así la velocidad de cálculo.

    Al igual que el DLG de código abierto basado en vectores, los DRG (Digital Raster Graphics) son versiones escaneadas de mapas topográficos del USGS e incluyen todo el material del collar de los originales. La información geoespacial que se encuentra dentro de la línea de contacto de la imagen es georeferenciada, específicamente al sistema de coordenadas UTM. Estos gráficos son escaneados a un mínimo de 250 dpi (puntos por pulgada) y por lo tanto tienen una resolución espacial de aproximadamente 2.4 metros. Los DRG contienen hasta trece colores y, por lo tanto, pueden verse ligeramente diferentes de los originales. Además, incluyen todo el material del collar de la versión impresa original, están georreferenciados a la superficie de la tierra, se ajustan a la proyección Universal Transverse Mercator (UTM) y probablemente se basan en los puntos de datos NAD27 (NAD significa North American Datum).

    Al igual que el formato vectorial TIN, algunos formatos de archivo ráster se desarrollan explícitamente para modelar la elevación. Estos incluyen los formatos de archivo USGS DEM, USGS SDTS y DTED. El USGS DEM (US Geological Survey Digital Elevation Model) es un formato de archivo popular debido a la amplia disponibilidad, la simplicidad del modelo y el amplio soporte de software para el formato. Cada valor de píxel en estos DEM basados en cuadrícula denota elevaciones de puntos en el suelo, generalmente en pies o metros. Se debe tener cuidado al usar DEM basados en cuadrícula debido al enorme volumen de datos que acompaña a estos archivos a medida que la extensión espacial cubierta en la imagen comienza a aumentar. Los DEM se conocen como modelos digitales de terreno (DTM) cuando representan un modelo simple de tierra descubierta y como modelos digitales de superficie (DDM) cuando incluyen las alturas de las características del paisaje como edificios y árboles (Figura 5.11 “Modelo Digital de Superficie (izquierda) y Modelo Digital de Terreno (derecha)”).

    Figura 5.11 Modelo Digital de Superficie (izquierda) y Modelo Digital de Terreno (derecha)

    Los DEM de USGS se pueden clasificar en uno de los cuatro niveles de calidad (etiquetados 1 a 4) dependiendo de sus datos de origen y resolución. Estos datos de origen pueden ser cuadriláteros topográficos a escala 1:24 ,000-; 1:63 ,360-; o 1:250 .000. El formato DEM es un único archivo de texto ASCII compuesto por tres bloques de datos; A, B y C. El bloque A contiene información de encabezado como origen de datos, tipo y sistemas de medición. El bloque B contiene datos de elevación contiguos descritos como un entero de seis caracteres. El bloque C contiene información de tráiler como error cuadrático medio (RMS) de la escena. El formato USGS DEM ha sido recientemente sucedido por el formato DEM de USGS SDTS (Spatial Data Transfer Standard). El formato SDTsGS. 2010. “¿Qué es SDTS?” USGS, http://mcmcweb.er.usgs.gov/sdts/whatsdts.html. fue desarrollado específicamente como un formato de distribución para transferir datos de una computadora a otra con cero pérdida de datos.

    El formato DTED (Digital Terrain Elevation Data) es otro formato de archivo ráster específico de elevación. Fue desarrollado en la década de 1970 con fines militares como análisis de línea de visión, visualización 3D y planeación de misiones. El formato DTED mantiene tres niveles de datos en cinco zonas latitudinales diferentes. Los datos de nivel 0 tienen una resolución de aproximadamente 900 metros; los datos de Nivel 1 tienen una resolución de aproximadamente 90 metros; y los datos de Nivel 2 tienen una resolución de aproximadamente 30 metros.

    Formatos de archivo híbridos

    Una geodatabase es un formato de archivo ESRI patentado recientemente desarrollado que admite datasets de entidades vectoriales y ráster (por ejemplo, puntos, líneas, polígonos, anotaciones, JPEG, TIFF) dentro de un solo archivo. Este formato mantiene relaciones topológicas y se almacena como un archivo MDB. La geodatabase fue desarrollada para ser un modelo integral para representar y modelar información geoespacial.

    Existen tres tipos diferentes de geodatabases. La geodatabase personal se desarrolló para la edición de un solo usuario, por lo que dos editores no pueden trabajar en la misma geodatabase en un momento dado. La geodatabase personal emplea el formato de archivo DBMS de Microsoft Access y mantiene un límite de tamaño de 2 gigabytes por archivo, aunque se ha observado que el rendimiento comienza a degradarse después de que el tamaño del archivo se acerca a los 250 megabytes. La geodatabase personal está siendo eliminada por ESRI y, por lo tanto, no se utiliza para la creación de nuevos datos.

    La geodatabase de archivos permite de manera similar solo la edición de un solo usuario, pero esta restricción se aplica solo a datasets de entidades únicos dentro de una geodatabase. La geodatabase de archivos incorpora nuevas herramientas como dominios (reglas aplicadas a atributos), subtipos (grupos de objetos con una clase de entidad o tabla) y políticas de dividir/fusionar (reglas para controlar y definir la salida de operaciones de división y fusión). Este formato almacena la información como archivos binarios con un límite de tamaño de 1 terabyte y se ha observado que funciona y escala de manera mucho más eficiente que la geodatabase personal (aproximadamente un tercio del almacenamiento de geometría de entidades requerido por shapefiles y geodatabases personales). Las bases de datos de archivos no están vinculadas a ningún sistema específico de administración de bases de datos relacionales y se pueden emplear en plataformas Windows y UNIX. Por último, las geodatabases de archivos se pueden comprimir en formatos de solo lectura que reducen aún más el tamaño del archivo sin reducir posteriormente el rendimiento.

    El tercer formato híbrido de ESRI es la geodatabase de ArcSDE, que permite que varios editores trabajen simultáneamente en datasets de entidades dentro de una sola geodatabase (también conocida como versionado). Al igual que la geodatabase de archivos, este formato se puede emplear tanto en plataformas Windows como en UNIX. El tamaño del archivo está limitado a 4 gigabytes y su naturaleza propietaria requiere una licencia de ArcInfo o ArcEditor para su uso. La geodatabase ArcSDE se implementa en el paquete de software SQL Server Express, que es una plataforma DBMS gratuita desarrollada por Microsoft.

    Además de la geodatabase, el PDF geoespacial (Portable Document Format) de Adobe Systems Incorporated es un formato de código abierto que permite la representación de entidades geométricas como puntos, líneas y polígonos. Los archivos PDF geoespaciales se pueden utilizar para buscar y marcar pares de coordenadas, medir distancias, reproyectar archivos y georegistrar imágenes ráster. Este formato es particularmente útil ya que el PDF es ampliamente aceptado como el estándar preferido para documentos web imprimibles. Aunque funcionalmente similar, el PDF geoespacial no debe confundirse con el formato GeoPDF desarrollado por TerraGo Technologies. Más bien, GeoPDF es una versión de marca del PDF geoespacial.

    Por último, Google Earth admite un nuevo formato de archivo híbrido de código abierto denominado KML (Keyhole Markup Language). Los archivos KML asocian puntos, líneas, polígonos, imágenes, modelos 3D, etc., con un valor de longitud y latitud, así como otra información de visualización como inclinación, rumbo, altitud, etc. Los archivos KMZ se encuentran comúnmente, y son versiones comprimidas archivos KML.

    Claves para llevar

    • Los formatos de archivo vectoriales comunes utilizados en aplicaciones geoespaciales incluyen shapefiles, coberturas, Tiger/lines, AutoCAD DXFs y DLG.
    • Los formatos de archivo ráster comunes utilizados en aplicaciones geoespaciales incluyen JPG, TIFF, PNG, MRSID, ECW, DRG, DEM de USGS y DTED.
    • Los formatos de archivo híbridos comunes utilizados en aplicaciones geoespaciales incluyen geodatabases (personales, de archivos y ArcSDE) y archivos PDF geoespaciales.

    Ejercicios

    1. Si fueras un urbanista encargado de crear una base de datos SIG para mapear entidades en toda la ciudad, ¿preferirías usar un DLG o un DRG? ¿Cuáles son las ventajas y desventajas de usar cualquiera de estos formatos?
    2. Busque en la web y cree una lista de URLs que contengan archivos de trabajo para cada uno de los formatos ráster y vector discutidos en esta sección.

    This page titled 5.3: Formatos de archivo is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Anonymous.