Saltar al contenido principal
LibreTexts Español

2: Datos

  • Page ID
    88560
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Al admirar un mapa bien diseñado, es fácil olvidar que está hecho de datos que vinieron de alguna parte. Un individuo o grupo de personas ha hecho una o más preguntas, ha recopilado datos en respuesta y procesado los números brutos antes de ponerlo todo en el mapa. Estos datos son necesariamente solo una pequeña porción de lo que se puede medir, porque es imposible medir todas las características para todos los lugares para todos los tiempos. En cambio, nos centramos en cómo y por qué se recopilaron datos para qué, dónde y cuándo.

    Este capítulo te presentará a:

    • Elementos y tipos comunes de datos espaciales.
    • Metadatos, o datos sobre datos.
    • Cómo se recopilan y agregan los datos del censo de Estados Unidos —una encuesta que subyace a muchos de los ejemplos y actividades de este libro—.

    Resolución, precisión e interoperabilidad: conceptos importantes que forman parte de los metadatos y que son importantes a tener en cuenta a la hora de elegir los datos adecuados para un proyecto.

    Al final de este capítulo, deberías poder hacer preguntas reflexivas sobre los datos utilizados en el mapeo.

    2.1 ¿Qué son los Datos Espaciales?

    Los datos del mapa tienen tres características clave:

    • Espacial: donde se encuentra un objeto o se ha producido un evento
    • Temporal: cuando la ubicación y los atributos eran precisos (es decir, cuando se recolectaron)
    • Atributo — qué características tiene el objeto o evento

    Imagina que tenemos datos sobre estados de Estados Unidos. Las características espaciales de los datos, es decir, la ubicación de los límites estatales, son necesarias para poner los datos en un mapa o usar. En términos más generales, la información espacial puede tomar la forma de dirección de calles, coordenadas de latitud-longitud o el área en la que se recopilaron los datos (por ejemplo, bloque residencial, ciudad, estado, país). Las características temporales se refieren a cómo los datos representan una “instantánea” de cómo eran las cosas en el momento en que se recolectaron los datos, como los datos censales del año 2000. Finalmente, las características de los atributos describen la naturaleza de una ubicación. En el caso de los estados, podríamos preocuparnos por la población o los ingresos o cualquiera de cientos de otras características.


    Tabla de datos y mapa. Esta tabla de atributos y mapa vinculado muestran los límites estatales con datos de la Oficina del Censo de Estados Unidos sobre densidad de población. La tabla y el mapa representan dos elementos clave de los datos espaciales: ubicación y atributos. Una tercera pieza importante, no mostrada, es el momento en que se recolectaron estos datos. [1]

    2.2 Recopilación de datos espaciales

    Dos métodos principales de recolección de datos espaciales, o recopilación de información sobre lugares, son la topografía terrestre y la teledetección. La topografía terrestre implica que una persona o mecanismo observa o interactúa con personas o con el medio ambiente en un lugar determinado. La teledetección se refiere a recopilar datos desde lejos, a menudo tomando fotografías desde un avión o satélite.

    2.2.1 Topografía Terrestre

    La topografía terrestre se realiza a través de un individuo o mecanismo que interactúa con un lugar en particular.. Esto puede incluir a una persona que recopila datos de ubicación con un teléfono que trabaja con un sistema de posicionamiento global (GPS), una constelación de satélites que emiten señales a la tierra donde pueden ser utilizadas para determinar la posición. Las encuestas implican hablar con personas o viajar a diferentes lugares para recopilar información. Otro tipo de topografía terrestre ocurre en estaciones meteorológicas que miden la temperatura y otra información climatológica en un lugar determinado. Esto es similar a un proceso llamado geocodificación, donde los datos con un elemento de localización como una dirección o código postal, se emparejan con sus respectivas coordenadas terrestres que ya se conocen.

    La topografía es uno de los métodos más longevos para determinar la ubicación. En esencia, los agrimensores utilizan una variedad de herramientas para determinar las posiciones precisas de las ubicaciones triangulando desde la posición de ubicaciones conocidas, o en otras palabras, usando matemáticas de ángulos y distancias para encontrar ubicaciones. La topografía existe desde hace miles de años, probablemente originándose como una forma de determinar los límites de los terrenos y ayudar a construir grandes edificios. Desde el siglo XIX en adelante, los agrimensores ayudaron a trazar un mapa de muchos países, trabajando hacia afuera de lugares conocidos a desconocidos.


    Topografía. Las bases para el mapeo moderno fueron sentadas por personas que caminaban y midieron el terreno con telescopios especializados (izquierda) y modernas estaciones totales habilitadas para GPS (derecha). [2] [3]

    Los sistemas de posicionamiento global (GPS) son constelaciones de satélites que orbitan la tierra. Estos satélites transmiten señales a la superficie terrestre que indican su posición en el espacio y una señal de tiempo muy precisa. Un dispositivo equipado con un receptor GPS apropiado puede interpretar estas señales y determinar la ubicación del dispositivo en la tierra. Consideramos que el uso de una unidad GPS para encontrar la ubicación es una forma de topografía terrestre porque los propios satélites no recopilan información; es el teléfono o unidad GPS la que está determinando la posición a partir de las señales del satélite.


    Constelación GPS. El Sistema de Posicionamiento Global es un sistema, o constelación, de satélites que orbitan la tierra que permiten a los teléfonos establecer la ubicación. [4]

    Durante décadas, la localización precisa de objetos con unidades GPS requirió equipos costosos y entrenamiento especializado. Fue emprendida principalmente por militares, científicos y organizaciones gubernamentales. Con desarrollos tecnológicos que hacen que los chips de computadora sean más pequeños y rápidos, los receptores GPS ahora son estándar en los teléfonos móviles. Es posible que cualquier persona registre, o etiquete, la ubicación donde se tomó una foto o rastree los movimientos diarios sin conocimientos especiales. Esta facilidad de uso amplía sustancialmente quién es capaz de crear datos espaciales y la cantidad de datos espaciales que existen y deben almacenarse.

    Los GPS tienen sus inconvenientes. Dado que los teléfonos deben recibir señales de satélites que orbitan la tierra, estas señales pueden ser bloqueadas por objetos sólidos, como árboles, edificios o características del paisaje como los lados de túneles o barrancos. Obtener una señal fuerte en un área moderadamente boscosa puede ser difícil, al igual que conseguir una en una ciudad con edificios altos. Hay un número limitado de satélites orbitando la tierra, y hay momentos en que el teléfono está en una posición no óptima en relación con estos satélites. Un microteléfono GPS debería recibir señales de al menos cuatro satélites, e idealmente más, que se distribuyan uniformemente en el cielo, pero hay momentos en que estas fuentes se agrupan en relación con la posición del auricular y las coordenadas que proporciona serán inexactas. Por último, dependiendo de la calidad del teléfono, las coordenadas GPS también pueden ser inexactas cuando el teléfono se mueve rápidamente, como en un automóvil o avión. Tenga en cuenta que, en términos generales, el clima intenso como la nieve, la lluvia o las nubes no interfieren con las señales del GPS.


    Teléfono GPS. Los teléfonos cuentan con radios y computadoras especializadas que reciben señales de satélites GPS y luego determinan la ubicación. [5]

    La geocodificación es el proceso de adjuntar una ubicación geográfica a algún tipo de información de dirección, como la dirección de una casa o código postal, o una descripción verbal como “la intersección de Elm Avenue y Main Street”. La geocodificación toma varias formas diferentes, pero la mayoría usa algún tipo de base de datos de direcciones cuyas ubicaciones se conocen con precisión. Las direcciones no localizadas coinciden con estas direcciones conocidas en la base de datos.


    La geocodificación implica hacer coincidir direcciones de calles con direcciones conocidas o mejores conjeturas basadas en rangos de direcciones de calles a lo largo de calles que ya están en un mapa. [6]

    Las encuestas recopilan información de atributos sobre individuos, hogares, negocios o áreas. No todas las encuestas recopilan información espacial, pero cuando lo hacen, los datos pueden vincularse a una ubicación en un mapa. Las encuestas pueden enviarse por correo a los hogares, recopilarse en persona o realizarse por teléfono. Por lo general, se centran en una subpoblación o actividad específica (por ejemplo, las percepciones de los estudiantes sobre la seguridad caminando a casa). Un censo es un tipo especial de encuesta que recopila datos sobre todos los miembros de una población (por ejemplo, con el objetivo de todos los habitantes de un país). Tenga en cuenta que la información de la encuesta suele ser información de atributos, y determinar la ubicación requiere geocodificación (como con una encuesta por correo que registra la dirección de la persona encuestada) o el uso de un teléfono GPS por parte de la persona que realiza una encuesta. Otro tipo de encuesta ocurre cuando empresas como Google equipan autos con receptores GPS y cámaras y conducen grabando imágenes de sus alrededores.

    Sensores. Hay un número creciente de sensores utilizados para medir una amplia gama de datos humanos y ambientales. Hace mucho tiempo que tenemos estaciones climáticas, por ejemplo, que miden muchas variables como la temperatura, la luz solar y la precipitación. Las ubicaciones de estos sensores están determinadas por GPS, topografía terrestre o geocodificación.


    Estación de observación climática. Las estaciones terrestres como estas recopilan información sobre el clima. [7]

    2.2.2 Teledetección

    Como su nombre indica, los datos de detección remota se recopilan a una distancia del objeto que están estudiando. Estos datos suelen ser recopilados por sensores montados en aviones, satélites o drones. Algunos sensores recopilan imágenes con cámaras que funcionan esencialmente sobre los mismos principios que encontrarías en una cámara de película portátil o una cámara digital de teléfono celular. Estas cámaras recogen luz visible que los ojos humanos pueden reconocer. Otros sensores detectan diferentes partes no visibles del espectro electromagnético, como infrarrojos (calor). Aún otros pueden escanear activamente la tierra con tecnología como el radar.


    Imágenes por satélite. Pintura del satélite Landsat 7 de teledetección. Tenga en cuenta que el satélite realmente no proyecta un haz de luz de cuatro lados sobre la superficie de la Tierra, esto es solo licencia artística. En cambio, los sensores del satélite registran la energía electromagnética reflejada o emitida por la Tierra. [8]

    Es probable que haya visto los datos de detección remota como un mapa base para los mapas de Google u otros mapas en línea. Estas imágenes también se utilizan para una amplia gama de propósitos, especialmente monitoreando los cambios en el ambiente en grandes áreas como la deforestación en la Amazonía o los derrames de petróleo.


    Imagen satelital de una marea negra. Una imagen desde el espacio de una marea negra del accidente de Deepwater Horizon en el Golfo de México (24 de mayo de 2010). [9]

    También se toman fotos por aviones y drones. Uno de los usos más comunes es tomar fotos de la superficie terrestre. Estas fotos son luego convertidas por los profesionales del mapeo en mapas del suelo.


    Fotogrametría aérea. La fotogrametría es el proceso de tomar medidas del suelo a partir de fotos de la tierra con el fin de hacer los datos necesarios para los mapas. [10]

    2.3 Metadatos

    Al trabajar con mapas, a menudo usará datos que no creó. Los metadatos te ayudan a determinar si los datos del mapa son apropiados para tu pregunta o proyecto. Los metadatos son datos sobre datos. Normalmente estamos más interesados en las características de datos espaciales, temporales y de atributos, pero los metadatos van más allá y proporcionan información que incluye:

    • ¿Quién recabó los datos?
    • ¿Cómo se recolectaron y clasificaron los datos?
    • ¿Cuándo se recolectaron los datos?
    • ¿Qué tan precisos son los datos?
    • ¿Cuál es la resolución de los datos? (¡Más sobre esto a continuación!)

    Sea cauteloso al usar un mapa si no puede encontrar metadatos. Esta precaución es particularmente importante porque los metadatos le permiten evaluar qué tan bien pueden funcionar los datos con otros datos. A continuación, analizamos los problemas de resolución, precisión e interoperabilidad entre conjuntos de datos. Los cartógrafos exploran estos temas y luego los agregan a los metadatos adjuntos a un mapa.

    2.4 Datos del Censo

    Una forma importante de datos de encuestas son los datos censales, o los recopilados por los gobiernos nacionales sobre sus poblaciones. Utilizamos el ejemplo de datos censales recopilados por la Oficina del Censo de los Estados Unidos porque el censo es la principal fuente de datos sociales utilizados por el gobierno, organizaciones sin fines de lucro y empresas. Estos datos se crean utilizando procedimientos bien documentados y están disponibles en una variedad de escalas para toda la nación. Finalmente, muchas herramientas gratuitas de mapeo en línea proporcionan datos censales, lo que permite explorar conceptos de mapeo sin una capacitación técnica rigurosa.

    2.4.1 Antecedentes del Censo

    El censo de Estados Unidos se realiza cada diez años con el objetivo de contar a todas las personas del país, aunque, como se describe a continuación, es casi imposible alcanzar esta meta. El censo recoge información sobre la raza, la edad y la situación de la vivienda de la población. El propósito primordial del censo, tal como lo establece la Constitución, es determinar el número de escaños que cada estado tendrá en la Cámara de Representantes de Estados Unidos, el poder legislativo de gobierno. Luego, los límites de los distritos electorales deben redibujarse en estados que hayan ganado o perdido escaños entre años censales (analizaremos más de cerca cómo se realiza la redistribución de distritos y los desafíos espaciales del proceso en capítulos posteriores). Los censos también determinan cómo se distribuyen cientos de miles de millones de dólares en fondos federales para muchos propósitos importantes, entre ellos la educación, el cuidado de la salud, la protección del medio ambiente, el transporte y otras formas de ayuda federal a estados y ciudades.

    El primer censo estadounidense, realizado en 1791 por dieciséis alguaciles estadounidenses y 650 asistentes, contó alrededor de 3.9 millones de personas. Solo hicieron algunas preguntas: el número de personas libres, el número de esclavos, y el sexo y raza de cada individuo.


    Modelo censal 1791. Este formulario para el primer censo en Estados Unidos fue llenado por un censista que hizo algunas preguntas. [11]

    Para 1960, con la población acercándose a los 180 millones, ya no era factible que un censista visitara cada hogar. En cambio, se enviaron cuestionarios por correo a todos los hogares, y los empleados temporales hicieron un seguimiento en persona con los hogares que no respondieron.


    Modelo censal 1960. Se trata de una copia en blanco del formulario del Censo de 1960 que se envió por correo a cada hogar para ser llenado. [12]

    Las preguntas que se hacen a todos los hogares ahora incluyen el número de personas por edad, género, etnia, propiedad de la vivienda y composición del hogar. Entre 1940 y 2000, uno de cada seis hogares también recibió una encuesta más detallada de “forma larga” que planteó preguntas sobre una gama mucho más amplia de temas, incluidos los ingresos, la ocupación, la duración del viaje y el servicio militar. Posteriormente, la Oficina del Censo utilizó esta muestra para estimar las características del resto de la población.

    La demanda de datos sociales más oportunos llevó al desarrollo de la Encuesta de la Comunidad Estadounidense (ACS), que reemplazó a la encuesta censal de formato largo en 2010. El ACS se realiza cada año con el fin de proporcionar “instantáneas” más frecuentes de las características demográficas, económicas y de vivienda de la población. Sin embargo, solo 2-3 millones de hogares reciben la encuesta por año (menos del 2% de la población), lo que introduce errores estadísticos sustanciales en las estimaciones para toda la población. Se recolectan datos para el censo y ACS de cada hogar, pero con el fin de preservar la privacidad y facilitar el uso de los datos, la Oficina del Censo agrega los datos a áreas geográficas más grandes.

    Si bien hay datos disponibles para un gran número de áreas geográficas diferentes, trabajaremos principalmente con las secciones censales y condados en este curso. Las secciones censales tienen un tamaño de población entre 1,200 y 8,000 personas, con un tamaño óptimo de 4,000 personas. Los límites de los distritos censales generalmente siguen características ambientales o políticas, pero el tamaño espacial de los distritos censales puede variar mucho dependiendo de la densidad de asentamiento y población. Los límites y formas de los distritos censales se dibujan con el objetivo de que permanezcan prácticamente iguales durante mucho tiempo para que se puedan hacer comparaciones estadísticas de censo a censo.

    2.4.2 Limitaciones de los Datos del Censo

    El censo es la fuente más completa de información demográfica disponible para Estados Unidos, pero aún tiene importantes limitaciones.

    El desafío principal es la precisión y el recuento insuficiente. El censo intenta tomar una instantánea de cuántas personas hay y dónde viven el 1 de abril del año censal. El método de recolección de datos supone que cada persona vive en una unidad habitacional con dirección postal y que responderá con precisión a las encuestas. La Oficina del Censo estimó que se perdieron aproximadamente 10 millones de personas en su conteo de 2010.


    Censo 2010. La primera enumeración del Censo 2010 tuvo lugar en Noorvik, Alaska. Un inicio temprano permite a los censistas llegar a aldeas remotas antes de que los residentes salgan a cazar y pescar o viajar para trabajos de clima cálido después del deshielo primaveral. [13]

    El recuento insuficiente no es aleatorio porque es más prevalente en ciertas áreas y subpoblaciones. A menudo se pasa por alto a quienes se encuentran sin hogar o que tienen viviendas inestables al momento del censo. Aquellos que residen en zonas rurales remotas pueden ser difíciles de contactar por correo o en persona. También es menos probable que el censo reciba respuestas de quienes desconfían del gobierno, como personas temerosas de que sus respuestas sean utilizadas por la policía migratoria para deportar a familiares indocumentados.

    Debido a que el censo solo se realiza cada diez años, los recuentos tienen consecuencias a largo plazo para estados y ciudades. La precisión de los recuentos puede ser muy polémica en las ciudades con problemas de efectivo. Por ejemplo, Detroit desafió los hallazgos del censo de 2010, habiendo llegado a 40,000 personas por debajo de un punto de corte poblacional para muchas fuentes importantes de financiamiento federal. Dado que las poblaciones pobres y marginadas se encuentran entre las más difíciles de contar, los distritos con mayor necesidad también son los que corren mayor riesgo de falta de financiamiento e infrarrepresentación.

    Más allá de los temas de precisión, mientras que el censo y ACS proporcionan un amplio conjunto de datos sociales, muchos temas no están cubiertos. Por ejemplo, no hay preguntas sobre religión, gasto del consumidor o afiliación a partidos políticos. La cantidad y redacción de las preguntas formuladas en el censo ha cambiado con el tiempo, y no siempre se dispone de datos para todos los lugares ni para todas las áreas geográficas.

    Recuerde que hay muchas otras encuestas sociales que recopilan información sobre diferentes atributos, áreas o periodos. Por ejemplo, la Asociación de Estadísticos de Cuerpos Religiosos Americanos realiza el “Estudio de Congregaciones Religiosas y Membresía” (RCMS) cada 10 años para rastrear patrones de afiliación religiosa. Los gobiernos locales recopilan datos para proyectos en su región específica. También hay censos realizados en países de todo el mundo con distintos niveles de detalle y precisión.

    2.5 Conceptos y problemas de datos

    Al elegir datos para analizar un problema específico, hay algunos conceptos clave a tener en cuenta: 1) resolución, 2) precisión y 3) interoperabilidad. Analizaremos cada uno de estos conceptos con respecto a los tres elementos de los datos espaciales (ubicación, atributos, tiempo). Cada uno de estos conceptos se puede enrollar bajo el término metadatos en el sentido de que son información sobre datos (o datos sobre datos). Desarrollar y comprender metadatos implica mirar más allá de los conceptos básicos de los 'datos' en términos de ubicación espacial, atributos medidos y tiempo recolectado.

    2.5.1 Resolución

    La resolución describe la amplitud o especificidad de los datos que está examinando. Hay tres tipos principales de resolución: espacial, de atributo y temporal. La resolución más alta corresponde con áreas más pequeñas sobre las que se agregan los datos, diferencias más estrechas entre categorías o tiempos más cortos entre la recolección de datos. Pero antes de entrar en ejemplos de resolución relacionados con el mapeo de datos sociales, piense en el concepto en relación con la tecnología cotidiana.

    Resolución espacial. Probablemente hayas visto el término “resolución” utilizado para describir la calidad de una pantalla de computadora o cámara de teléfono móvil. Cada imagen está compuesta por muchos cuadrados o píxeles más pequeños. Cuando los píxeles que componen la imagen más grande son pequeños, se pueden distinguir más detalles y se dice que la imagen tiene mayor resolución. A medida que aumenta el tamaño de los píxeles cuadrados, se hace más difícil distinguir pequeños detalles, como las gotas de agua en los pétalos de las flores. Esto puede ser importante si copia una imagen de un sitio web y luego redimensiona la imagen. Dependiendo de la resolución de la imagen original, es posible que de repente pueda ver píxeles que antes eran demasiado pequeños para ver.


    Resolución espacial. Comparando mayor resolución y menor resolución en una fotografía de hojas (arriba) o en una cuadrícula (abajo). [14]

    La resolución espacial también puede referirse a la pregunta, “¿Cuál es la unidad de área más pequeña medida?” Es similar a la resolución de píxeles, excepto que el mapa a menudo no se divide en cuadrados de igual tamaño. En cambio, el mapa podría dividirse entre límites administrativos (como distritos censales, condados o estados) que tienen diferentes formas y áreas de tierra. Cuanto mayor sea el área sobre la que se han agregado los datos, menor es la resolución y más difícil es distinguir pequeños detalles en los datos. En la siguiente figura, pequeñas áreas de alta densidad poblacional no son visibles con menor resolución espacial.


    Resolución de datos censales. Comparar datos de densidad poblacional agregados por condado (izquierda) con datos agregados por tramo censal (derecha). [15]

    Considera un ejemplo. Si estabas tratando de determinar si había habido ingresos medios crecientes en tu bloque en los últimos 4 años, pero los únicos datos que pudiste encontrar fue la resolución a nivel de código postal, sería difícil establecer el patrón. Los códigos postales son sustancialmente más grandes que los bloques. Los cambios en el ingreso medio en otras partes del código postal podrían oscurecer o mejorar falsamente lo que está sucediendo en tu cuadra.

    La resolución de atribución trata del grado en que se hacen distinciones entre categorías. Los datos divididos en muchas categorías proporcionan distinciones más detalladas y, por lo tanto, una mayor resolución de atributos. Por ejemplo, imagina que te interesan los datos sobre la edad de los individuos. Si los datos se agrupan en sólo dos categorías —individuos menores de 18 años y individuos mayores de 18 años— los datos tendrían baja resolución de atributos. En comparación, dividir las edades en más categorías (p. ej., 0-18, 18-34, 34-64, 65+) nos daría una mayor resolución de atribución. Si se necesita conocer el número de individuos que tienen la edad suficiente para votar en las elecciones nacionales, utilizar los datos de menor resolución sería suficiente. Pero si te interesa el número de personas mayores, necesitarías tener mayor resolución de datos.

    La resolución temporal es la frecuencia con la que se recogen los datos, y en esencia aborda la pregunta, ¿Con qué frecuencia o en qué periodo de tiempo se toma una medición? En la sección anterior, señalamos que la Oficina del Censo de Estados Unidos recopila datos cada diez años, mientras que la ACS realiza una encuesta cada año. El censo es más preciso que el ACS porque se basa en una mayor proporción de la población, pero a costa de tener una resolución temporal más tosca. No sería posible hacer una discusión sobre cómo su barrio había cambiado demográficamente en un periodo de cinco años dada la resolución temporal del censo, porque el censo solo le dará una instantánea de su vecindario cada diez años.

    En resumen, al mirar datos, hágase las siguientes preguntas: ¿Está mirando el área correcta para la pregunta que se hace? ¿Las categorías en los datos son lo suficientemente específicas para su argumento (o necesita ampliar sus afirmaciones)? ¿Los datos se recopilan con suficiente frecuencia para el periodo de tiempo que desea analizar?

    2.5.2 Precisión

    La precisión describe qué tan bien se alinean los datos de un mapa con los objetos del mundo. Hay tres tipos principales de precisión: espacial, de atributo y temporal.

    La precisión espacial responde a la pregunta de qué tan bien la ubicación de un objeto en el mapa coincide con su ubicación en el mundo. Hay muchas razones por las que las ubicaciones de algo en un mapa no corresponden exactamente a las del suelo en la realidad. Los límites entre países pueden trazarse incorrectamente. Los puntos marcados con GPS se pueden desviar de su ubicación real si la señal está bloqueada por árboles o edificios altos. La siguiente figura muestra el ejemplo de una persona cuyos movimientos están siendo rastreados con GPS en un vehículo. El mapa parece mostrar a la persona caminando por varios edificios y luego corriendo por una autopista de nueve carriles. Sólo aparece así en los mapas debido a un error en la forma en que se recolectaron las mediciones GPS.


    Precisión espacial. Los puntos azules marcan el camino tomado por un individuo que porta un dispositivo de rastreo GPS en un vehículo. [16]

    La precisión del atributo pregunta si las características reportadas sobre un objeto son ciertas sobre ese objeto en el mundo. Las inexactitudes de atributos pueden aparecer en los datos de la encuesta si los participantes no responden, malinterpretan las instrucciones o proporcionan información falsa a propósito. También pueden ocurrir imprecisiones al estimar valores para un área pequeña en función de un pequeño número de respuestas. Recuerde que la ACS sondea alrededor del 2% de la población cada año —4 de cada 200 personas— y luego estima las características del resto de la población a partir de sus respuestas. El ACS tiene mejor atributo y resolución temporal que el censo (más categorías que se recolectan con más frecuencia), pero el censo es más preciso en el sentido de que cuenta más personas.

    La precisión temporal se refiere a si los detalles sobre un objeto están actualizados con respecto a los cambios en el mundo. Si bien los datos pueden ser precisos y completos en el momento en que se recopilan, los detalles pronto pueden ser inexactos debido a cambios en el panorama social y físico. Por ejemplo, los objetos en un mapa de referencia impreso serán menos precisos con el tiempo a medida que se construyan nuevas carreteras, se eliminen o se den cambios de nombre.


    Precisión temporal. Los mapas de carreteras estáticos se actualizan con mucha menos frecuencia que los mapas de Google. [17]

    2.5.3 Interoperabilidad

    La interoperabilidad describe qué tan bien funcionan dos conjuntos de datos diferentes entre sí. Hay tres tipos principales de interoperabilidad: espacial, de atributo y temporal.

    Hágase las siguientes preguntas: ¿Están comparando la misma zona? ¿Utilizan las mismas categorías y las definen de la misma manera? Estas preguntas son especialmente relevantes cuando se utilizan datos recopilados por diferentes organizaciones o a través de múltiples períodos de tiempo.

    Interoperabilidad espacial. ¿Qué tan bien coinciden las unidades espaciales? Esta es la pregunta que concierne a la interoperabilidad espacial. Por ejemplo, los códigos postales y las secciones censales son unidades espaciales para las que frecuentemente se agregan datos, pero sus límites rara vez son los mismos. Un tramo censal puede estar dentro de múltiples códigos postales y viceversa. Los datos a nivel de código postal y los datos a nivel de tracto censal tienen poca interoperabilidad porque no muestran características para un mismo grupo de personas.


    Geografías censales. Geografías censales. Áreas geográficas para las que la Oficina del Censo de Estados Unidos pone a disposición datos, que van desde el nivel estatal hasta los bloques. [18]

    La interoperabilidad de atributos plantea la pregunta: ¿qué tan bien coinciden las categorías de dos conjuntos de datos? Por ejemplo, en el censo de 2010, los individuos podían elegir entre quince categorías raciales diferentes con la opción de seleccionar múltiples categorías. En comparación, en el censo de 1850 los individuos se dividieron en sólo tres categorías raciales: “blanco”, “negro” o “mulato”. Estos dos conjuntos de datos tienen poca interoperabilidad de atributos porque tienen una resolución de atributos muy diferente y no tienen categorías coincidentes.


    Censo modelo 2010 sobre raza. En el Censo de 2010, los individuos podían elegir entre quince categorías raciales diferentes con la opción de seleccionar múltiples categorías. [19]

    Incluso una categoría que tenga un nombre similar entre dos años censales puede medir atributos diferentes. La categoría “chino” utilizada en el censo de 1870 se aplicó a individuos de cualquier parte de Asia, en lugar de solo China. Por lo tanto, no es interoperable con los “chinos” como se utilizó en el censo de 2010.

    Interoperabilidad temporal. ¿Qué tan bien coinciden los tiempos reportados? La interoperabilidad temporal es de lo más preocupante si estás argumentando cómo son las cosas en un momento dado pero tus datos no son del mismo momento. Por ejemplo, imagina que estás trabajando en una organización sin fines de lucro que está tratando de comparar el número de niños de 0 a 5 años con el número y ubicación de centros de primera infancia en una zona. El recuento más preciso de niños es del censo de 2010, pero su organización cuenta con información sobre centros infantiles recopilada en 2015. Estos dos conjuntos de datos tienen poca interoperabilidad temporal porque ningún niño que tenía 0-5 años al momento del censo seguiría estando en ese tramo de edad en 2015. Sería difícil determinar si los centros infantiles están ubicados adecuadamente a partir de estos datos. Por debajo, ¡a veces tienes que preocuparte por la interoperabilidad espacial y temporal!


    Interoperabilidad espacial y temporal. Los límites para los diferentes años censales en Sudáfrica no se alinean entre años porque se agregaron nuevas regiones a lo largo del tiempo. Una solución es crear un nuevo mapa que agrupe regiones; esta geografía integrada permite comparar datos entre mapas. [20]

    En resumen, al mirar múltiples conjuntos de datos, pregúntese: ¿Tiene sentido comparar estos datos? ¿Los datos generados para la misma área utilizan las mismas unidades espaciales? ¿Las categorías de atributos son definidas de la misma manera por la (s) organización (es) que produjo los datos y a lo largo del tiempo? ¿Los datos se produjeron en un marco de tiempo comparable?

    2.6 Herramientas de mapeo

    Existen muchos programas de software para hacer mapas y la mayoría ofrecen una gama de datos a sus usuarios. Si bien estos programas se han desarrollado tradicionalmente para computadoras de escritorio, un número grande y creciente de sitios web y aplicaciones web están permitiendo a las personas ver y hacer mapas en línea. Estos mapas y herramientas han sido desarrollados con el objetivo de hacer que los datos sean más accesibles a investigadores, políticos y miembros del público.

    Social Explorer es un ejemplo de una herramienta de mapeo en línea, desarrollada para facilitar el acceso y uso de los datos generados por la Oficina del Censo de Estados Unidos. Tenga en cuenta que muchas organizaciones están enfocadas en obtener mapas en línea y no tuvieron ningún papel en la recopilación de los datos subyacentes. En cambio, los mapas en línea y las herramientas de mapeo actúan como bibliotecas al reunir información de múltiples fuentes. Tenga en cuenta que Social Explorer no es la fuente de los datos que se están mapeando; es nuestra herramienta para explorar los datos creados por la Oficina del Censo.

    2.7 Conclusión

    Siempre que miras un mapa, es importante pensar en cómo se generaron los datos que se han visualizado. ¿Quién creó el mapa? ¿Cómo se recolectaron los datos subyacentes? ¿Qué preguntas se hicieron a quién? ¿Qué tan preciso es el mapa? ¿Qué falta? Incluso los datos más cuidadosamente creados contienen errores y tienen un contexto dentro de un panorama social, político y cultural. Para ser un usuario responsable de mapas y creador de mapas, debe pensar en lo que puede y no puede mostrar dada la resolución, precisión e interoperabilidad de los datos disponibles. Es importante citar las fuentes de los datos que incluyes en tu mapa para que tu audiencia pueda encontrar información adicional.

    A medida que avanzamos para explorar cómo simbolizar y simplificar los datos, hacer un mapa atractivo y analizar las relaciones espaciales de los datos, recuerde: un mapa solo puede ser tan bueno como los datos que entran en él.

    Recursos

    Para más información sobre el historial de preguntas y procedimientos censales, y qué pregunta y qué no pide el censo:

    • Censo de Estados Unidos
    • Explorador Social

    Para más información sobre GPS:

    • Geografía 482 de la Universidad Estatal de Pensilvania: La naturaleza de la información geográfica
    • Adam Goetsch en la USC

    1. CC BY-NC-SA 3.0. Adaptado de Dibiase et al. (2012) Mapeando nuestro mundo cambiante. https://www.e-education.psu.edu/geog160/node/1930. Jennifer M. Smith, Departamento de Geografía, La Universidad Estatal de Pensilvania; Datos de la Oficina del Censo de Estados Unidos.
    2. CC BY-NC-SA 3.0. Adaptado de David Dibiase (1998) Naturaleza de la información geográfica. https://www.e-education.psu.edu/natu...nfo/c5_p8.html; originalmente Hodgson, C. V. Un equipo de nivelación en el trabajo en 1916. NOAA Colección de Fotos Históricas (2004). Recuperado el 20 de abril de 2006, de http://www.photolib.noaa.gov/.
    3. CC BY-NC-SA 4.0. Adaptado de J. Campbell y M. Shin (2012). https://2012books.lardbucket.org/boo...ics/index.html;
    4. CC BY-NC-SA 4.0. Adaptado de J. Campbell y M. Shin (2012) https://2012books.lardbucket.org/boo...ics/index.html
    5. CC BY-NC-SA 4.0. Adaptado de J. Campbell y M. Shin (2012) https://2012books.lardbucket.org/boo...ics/index.html
    6. CC BY-NC-SA 3.0. Adaptado de Dibiase et al. (2012) Mapeando nuestro mundo cambiante. https://www.e-education.psu.edu/geog160/node/1941. Datos de la Oficina del Censo de Estados Unidos.
    7. Dominio Público. Centros Nacionales de Información Ambiental de la NOAA (nd) Instrumentos de medición utilizados para las observaciones actuales y el reporte de datos. www.ncdc.noaa.gov/data-acces... d-based-statio n-data
    8. CC BY-NC-SA 3.0. Adaptado de David Dibiase (1998). Naturaleza de la Información Geográfica. https://www.e-education.psu.edu/natu...nfo/c5_p8.html
    9. Dominio Público. Por NASA/GSFC, MODIS Rapid Response Y demis.nl Y FT2 - 1/ Archivo:Derrame de petróleo Deepwater Horizon - 24 de mayo, 2010.jpg (basado en Imagen original con recorte) 2/ Localizador por FT2 de Archivo:Mapa de USA topological.png (Dominio público por autor demis.nl)., Dominio público, https://commons.wikimedia.org/w/inde... curid=10671450.
    10. CC BY-NC-SA 3.0. Adaptado de David Dibiase (1998) Naturaleza de la Información Geográfica https://www.e-education.psu.edu/natu...nfo/c5_p8.html.
    11. Dominio Público. Oficina del Censo de Estados Unidos. www.census.gov/history/www/s... 790_fotos.php
    12. Dominio Público. Oficina del Censo de EU. https://broadcast.census.gov/pio/pho...0/1960a_hi.jpg
    13. Dominio Público. www.census.gov/history/www/s... sonidos/fotos/ 2010_fotos.php#
    14. Licencia GNU Free Documentation, Versión 1.2. Adaptado de Sutton, O. Dassau, M. Sutton (2009). Una introducción suave a los SIG. Dirección Principal: Planeación e Información Territorial, Departamento de Asuntos Territorios, Cabo Oriental. http://docs.qgis.org/2.14/en/docs/ge...ucing_gis.html
    15. CC BY-NC-SA 4.0. Steven M. Manson (2015)
    16. CC BY-NC-SA 4.0. Steven M. Manson (2015)
    17. Licencia Unsplash. https://unsplash.com/search/map?photo=gtCWBwbZNpM, John-Mark Kuznietsov
    18. Dominio Público. Censo de EU. http://factfinder.census.gov/faces/n...ges/using_fact finder.xhtml? pagina=census_geografía
    19. Dominio Público. Sitio web de la Oficina del Censo de Estados Unidos - www.census.gov/prod/cen2010/b... c2010br-02.pdf
    20. CC BY-NC-SA 4.0. Adaptado de IPUMSI, creado por Sula Sarka y Ding Fei. https://international.ipums.org/international/

    This page titled 2: Datos is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Steven Manson (University of Minnesota Libraries) .