Saltar al contenido principal
LibreTexts Español

3.1: Datos e Información

  • Page ID
    88778
    • Anonymous
    • LibreTexts

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • El objetivo de esta sección es definir y describir los datos y la información y cómo se organiza en archivos para su uso en un entorno de cómputos y sistemas de información geográfica (SIG).

    Para entender cómo pasamos de los mapas analógicos a los digitales, comencemos con los bloques de construcción y las bases del sistema de información geográfica (SIG), es decir, los datos y la información. Como ya se señaló en varias ocasiones, GIS almacena, edita, procesa, y presenta datos e información. Pero, ¿qué son exactamente los datos? ¿Y qué es exactamente la información? Para muchos, los términos “datos” e “información” se refieren a lo mismo. Para nuestros fines, es útil hacer una distinción entre ambos. Generalmente, los datos se refieren a hechos, mediciones, características o rasgos de un objeto de interés. Para ustedes, los sticklers gramaticales por ahí, tenga en cuenta que “data” es la forma plural de “datum”. Por ejemplo, podemos recopilar todo tipo de datos sobre todo tipo de cosas, como la longitud de la trucha arco iris en un arroyo de Colorado, el número de vegetarianos en Alaska, el diámetro de los troncos de caoba en la selva brasileña, las puntuaciones de los estudiantes en el último semestre de SIG, la altitud de los picos de las montañas en Nepal, la profundidad de la nieve en los Alpes austríacos, o el número de personas que utilizan el transporte público para llegar a trabajar en Londres.

    Una vez que los datos se ponen en contexto, se utilizan para responder preguntas, se sitúan dentro de marcos analíticos o se utilizan para obtener insights, se convierten en información. Para nuestros fines, la información se refiere simplemente al conocimiento de valor obtenido a través de la recolección, interpretación y/o análisis de datos. Aunque una computadora no es necesaria para recopilar, grabar, manipular, procesar o visualizar datos, o para procesarlos en información, la tecnología de la información puede ser de gran ayuda. Por ejemplo, las computadoras pueden automatizar tareas repetitivas, almacenar datos de manera eficiente en términos de espacio y costo, y proporcionar una gama de herramientas para analizar datos desde hojas de cálculo hasta SIG, por supuesto. Además, es el hecho de que la increíble cantidad de datos recopilados todos y cada uno de los días por satélites, escáneres de productos de tiendas de abarrotes, sensores de tráfico, medidores de temperatura y tu operador de telefonía móvil, por nombrar solo algunos, no sería posible sin la ayuda e innovación de la tecnología de la información.

    Dado que se trata de un texto sobre SIG, es útil definir también datos geográficos. Al igual que los datos genéricos, los datos geográficos o espaciales se refieren a hechos geográficos, mediciones o características de un objeto que nos permiten definir su ubicación en la superficie de la tierra. Dichos datos incluyen pero no se limitan a las coordenadas de latitud y longitud de los puntos de interés, direcciones de calles, códigos postales, límites políticos, e incluso los nombres de los lugares de interés. También es importante señalar y reenfatizar la diferencia entre los datos geográficos y los datos de atributos, lo cual se discutió en el Capítulo 2 “Anatomía del Mapa”. Cuando los datos geográficos se refieren a definir la ubicación de un objeto de interés, los datos de atributos se refieren a sus rasgos y características no geográficos.

    Para ilustrar la distinción entre datos geográficos y de atributos, piensa en tu hogar donde creciste o donde vives actualmente. En el contexto de esta discusión, podemos asociar datos geográficos y de atributos a la misma. Por ejemplo, podemos definir la ubicación de tu hogar de muchas maneras, como con una dirección de calle, los nombres de las calles de la intersección más cercana, el código postal donde se encuentra tu casa, o podríamos usar un dispositivo habilitado para el sistema de posicionamiento global para obtener coordenadas de latitud y longitud. Lo importante es que los datos geográficos nos permitan definir la ubicación de un objeto (es decir, su hogar) en la superficie de la tierra.

    Además de los datos geográficos que definen la ubicación de tu hogar se encuentran los datos de atributos que describen las diversas cualidades de tu hogar. Dichos datos incluyen, pero no se limitan a, el número de habitaciones y baños en su hogar, ya sea que su hogar tenga o no calefacción central, el año en que se construyó su casa, el número de ocupantes y si hay o no una piscina. Estos datos de atributos nos dicen mucho sobre tu casa pero relativamente poco sobre dónde está.

    No sólo es útil reconocer y comprender cómo los datos geográficos y de atributos difieren y se complementan entre sí, sino que también es de importancia central a la hora de aprender y utilizar los SIG. Debido a que un SIG requiere e integra estos dos tipos distintos de datos, poder diferenciar entre datos geográficos y datos de atributos es el primer paso en la organización de su SIG. Además, poder determinar qué tipo de datos necesita, en última instancia, ayudará en su implementación y uso de un SIG. La mayoría de las veces, y en la era y contexto de la tecnología de la información, los datos y la información discutidos hasta ahora son materia de archivos informáticos, que son el foco de la siguiente sección.

    De Archivos y Formatos...

    Cuando recopilamos datos sobre tu hogar, selvas tropicales, o cualquier cosa, en realidad, generalmente necesitamos ponerlos en algún lugar. Aunque podemos garabatear números y medidas en la parte posterior de un sobre o escribirlos en un bloc de papel, si queremos actualizarlos, compartirlos, analizarlos o mapearlos en el futuro, a menudo es útil grabarlos en forma digital para que una computadora pueda leerlos. Aunque no nos molestemos con los bits y bytes de la computación, es necesario discutir algunos elementos básicos de la computación que son relevantes y requeridos al aprender y trabajar con un SIG.

    Uno de los elementos más comunes de trabajar con computadoras y la propia computación es el archivo. Los archivos en una computadora pueden contener cualquier cantidad de cosas, desde un conjunto complejo de instrucciones (por ejemplo, un programa de computadora) hasta una lista de números y letras (por ejemplo, libreta de direcciones). Además, los archivos de computadora vienen en todos los tamaños y tipos diferentes. Una de las pistas que podemos usar para distinguir un archivo de otro es la extensión del archivo. La extensión del expediente se refiere a las letras que siguen al periodo (“.”) después del nombre del expediente. La Tabla 3.1 contiene algunas de las extensiones de archivo más comunes y los tipos de archivos con los que están asociadas.

    Cuadro 3.1

    nombre de archivo.txt Archivo de texto simple
    nombre de archivo.doc Documento de Microsoft Word
    nombre de archivo.pdf Formato de documento portátil de Adobe
    nombre_archivo.jpg Archivo de imagen comprimido
    nombre de archivo.tif Formato de imagen etiquetada
    nombre de archivo.html Lenguaje de marcado de hipertexto (utilizado para crear páginas web)
    nombre.xml Lenguaje de marcado extensible
    nombre de archivo.zip Archivo comprimido/comprimido

    Algunos programas de computadora pueden ser capaces de leer o trabajar solo con ciertos tipos de archivos, mientras que otros son más expertos en leer múltiples formatos de archivo. Lo que te darás cuenta a medida que comiences a trabajar más con la tecnología de la información, y los SIG en particular, es que la familiaridad con los diferentes tipos de archivos es importante. Aprender a convertir o exportar un tipo de archivo a otro también es una habilidad muy útil y valiosa de obtener. En este sentido, ser capaz de reconocer y saber identificar diferentes y desconocidos tipos de archivos sin duda aumentará tu dominio con computadoras y SIG.

    De los numerosos tipos de archivos que existen, uno de los archivos más comunes y de acceso amplio es el archivo de texto simple, texto plano o simplemente archivo de texto. Los archivos de texto simples pueden ser leídos ampliamente por programas de procesamiento de textos, programas de hojas de cálculo y bases de datos, y navegadores web. A menudo terminan con la extensión “.txt” (es decir, filename.txt), los archivos de texto no contienen ningún formato especial (por ejemplo, negrita, cursiva, subrayado) y contienen solo caracteres alfanuméricos. En otras palabras, las imágenes o gráficos complejos no son adecuados para archivos de texto. Sin embargo, los archivos de texto son ideales para grabar, compartir e intercambiar datos porque la mayoría de las computadoras y sistemas operativos pueden reconocer y leer archivos de texto simples con programas llamados editores de texto.

    Cuando un archivo de texto contiene datos que están organizados o estructurados de alguna manera, a veces se le llama archivo plano (pero la extensión del archivo sigue siendo la misma, es decir, .txt). Generalmente, los archivos planos se organizan en formato tabular o línea por línea. Es decir, cada línea o fila del archivo contiene uno y sólo un registro. Entonces, si recolectamos medidas de altura en tres personas, Tim, Jake y Harry, el archivo podría verse así:

    Nombre Altura
    Tim 6'1”
    Jake 5'9”
    Harry 6'2”

    Cada fila corresponde a uno y sólo un registro, observación o caso. Hay otros dos elementos importantes que hay que conocer sobre este archivo. Primero, tenga en cuenta que la primera fila no contiene ningún dato; más bien, proporciona una descripción de los datos contenidos en cada columna. Cuando la primera fila de un archivo contiene dichos descriptores, se le denomina fila de encabezado o simplemente encabezado. Las columnas en un archivo plano también se denominan campos, variables o atributos. “Altura” es el atributo, campo o variable que nos interesa, y las observaciones o casos en nuestro conjunto de datos son “Tim”, “Jake” y “Harry”. En resumen, las filas son para registros; las columnas son para campos.

    El segundo elemento invisible pero crítico del archivo son los espacios entre cada columna o campo. En el ejemplo, aparece como si un espacio separara la columna “name” de la columna “height”. Sin embargo, después de una inspección más cercana, observe cómo se alinean los valores iniciales de la columna de “altura”. Si se utilizara un solo espacio para separar cada columna, la columna de altura no estaría alineada. En este caso se está utilizando una pestaña para separar las columnas de cada fila. El carácter que se utiliza para separar columnas dentro de un archivo plano se denomina delimitador o separador. Aunque cualquier carácter se puede usar como delimitador, los delimitadores más comunes son la tabulación, la coma y un solo espacio. Los siguientes son ejemplos de cada uno.

    Delimitado por tabuladores Delimitado por espacio único Delimitado por comas
    Nombre Altura Nombre Altura Nombre, Altura
    Tim 6.1 Tim 6.1 Tim, 6.1
    Jake 5.9 Jake 5.9 Jake, 5.9
    Harry 6.2 Harry 6.2 Harry, 6.2

    Conocer el delimitador a un archivo plano es importante porque nos permite distinguir y separar las columnas de manera eficiente y sin errores. A veces dichos archivos son referidos por su delimitador, como un archivo de “valores separados por comas” o un archivo “delimitado por tabuladores”.

    Al grabar y trabajar con datos geográficos, se aplica el mismo formato general. Las filas se reservan para los registros, o en el caso de los datos geográficos, se utilizan ubicaciones y columnas o campos para los atributos o variables asociadas a cada ubicación. Por ejemplo, el siguiente archivo plano delimitado por tabuladores contiene datos de tres lugares (es decir, países) y tres atributos o características de cada país (es decir, población, idioma, continente) como señala el encabezado.

    País Población Idioma Continente
    Francia 65.000.000 Francés Europa
    Brasil 192,000,000 Portugués América del Sur
    Australia 22,000,000 Inglés Australia

    Archivos como los que aquí se presentan son los bloques de construcción de las diversas tablas, tablas, informes, gráficas y otras visualizaciones que vemos todos los días en línea, en forma impresa y en televisión. También son componentes clave para los mapas y representaciones geográficas creadas por los SIG. Rara vez si alguna vez, sin embargo, trabajará con uno y solo un archivo o tipo de archivo. La mayoría de las veces, y especialmente cuando se trabaja con SIG, trabajarás con múltiples archivos. Tal agrupación de múltiples archivos se llama base de datos. Dado que los archivos dentro de una base de datos pueden ser de diferentes tamaños, formas e incluso formatos, necesitamos idear algún tipo de sistema que nos permita trabajar, actualizar, editar, integrar, compartir y mostrar los diversos datos dentro de la base de datos. Dicho sistema se conoce generalmente como un sistema de gestión de bases de datos (DBMS). Las bases de datos y los DBMS son tan importantes para los SIG que un capítulo posterior se les dedica. Por ahora basta recordar que los tipos de archivo son como helados, vienen en todo tipo de sabores diferentes. A la luz de tal variedad, la Sección 3.2 “Datos sobre Datos” detalla algunas de las cuestiones clave que deben considerarse al momento de adquirir y trabajar con datos e información para SIG.

    Claves para llevar

    • Los datos se refieren a hechos específicos, mediciones o características de objetos y fenómenos de interés.
    • La información se refiere al conocimiento de valor que se obtiene del análisis de datos.

    Ejercicios

    1. ¿Cuál es la diferencia entre data e information?
    2. ¿Cuáles son las diferencias entre los datos espaciales y los datos de atributos?
    3. Identificar cada uno de los archivos del Cuadro 3.1 de acuerdo a su extensión.
    4. Busca y descarga tres archivos de texto simple o planos diferentes. Ábrelos en un programa de procesador de textos y hojas de cálculo. Utilice la función de búsqueda y reemplazo para cambiar los delimitadores (p. ej., de comas a tabulaciones o viceversa).
    5. La Oficina del Censo de Estados Unidos distribuye datos geoespaciales como archivos TIGER. ¿Qué son?
    6. Identifica recursos y sitios web en Internet que puedan ayudarte a dar sentido a las extensiones de archivos.

    This page titled 3.1: Datos e Información is shared under a CC BY-NC-SA 3.0 license and was authored, remixed, and/or curated by Anonymous.