Saltar al contenido principal
LibreTexts Español

3.5: Construcción de bases de datos

  • Page ID
    105018
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Introducción

    Contrariamente a la creencia popular, los historiadores SI incursionan en números, bases de datos y otras cosas matemáticas que pensaste que nunca volverías a usar una vez que pasaras Matemáticas 101. Pero no lo sudes. Puedes usar bases de datos para responder algunas preguntas históricas interesantes, y si lo tomas paso a paso, en realidad puede ser bastante indoloro.

    ¿Qué tipo de preguntas de base de datos hacen los historiadores? Aquí hay algunos ejemplos:

    1. ¿Qué votantes estadounidenses tenían más probabilidades de emitir su voto por Abraham Lincoln en 1860? ¿Esto cambió por región? ¿Los residentes urbanos tenían más probabilidades de ser demócratas en 1860 que los rurales?
    2. ¿La llegada de las universidades públicas a Texas en la década de 1860 y el mayor acceso a la educación superior condujeron a mayores oportunidades laborales para los tejanos en las décadas de 1870 y 1880?
    3. ¿Cómo se vio afectada la trata transatlántica de esclavos entre África y Estados Unidos cuando Gran Bretaña prohibió la trata de esclavos en el Atlántico en 1807?

    Estas posibilidades son solo la proverbial “punta del iceberg”. Los datos agregados, del tipo que proviene de censos, resultados electorales y manifiestos de envío, a menudo proporcionan la mejor visión de la vida de la gente común. Las bases de datos son especialmente valiosas para conocer a las personas que, por una razón u otra, no dejaron muchas cuentas de primera mano. Las bases de datos de Slave Voyages https://slavevoyages.org/ es compilada por un equipo de estudiosos de miles de manifiestos y barcos troncos de embarcaciones que atravesaron el Atlántico entre los siglos XV y XIX y proporciona información invaluable sobre el pasaje medio.

    El problema con estas fuentes primarias, sin embargo, es que son de mayor ayuda cuando se las mira en conjunto, más que en su forma cruda, leyéndola como una sola fuente primaria como un discurso o un conjunto de letras de una persona famosa. Es difícil tratar de dar sentido al listado de la información de una sola calle por parte de un enumerador del censo, o intentar sacar conclusiones sobre los cambios en la trata de esclavos mirando un par de registros de barcos de esclavos diferentes. Dicho de otra manera (para abordar la pregunta número 2 anterior): solo podemos saber si los estadounidenses estaban más alfabetizados en la década de 1870 al observar la información del censo sobre alfabetización para todos los tejanos en dos censos diferentes (1870 y 1880). Si solo contáramos el número de individuos marcados alfabetizados en una sola calle, aunque encontráramos a los mismos residentes viviendo en la misma calle tanto para 1870 como para 1880 y aprendiéramos cuántos más le dijeron al enumerador del censo que estaban alfabetizados en 1880 pero no en 1870, solo sabríamos sobre alfabetización para aquellos de Texas residentes, no si las nuevas universidades desataron una tendencia a nivel estatal.

    Datos del Censo de Estados Unidos de 1870 y 1880

    A continuación se muestra una comparación entre la sección del Censo de Estados Unidos de 1870 y 1880 sobre analfabetismo.

    Un elemento H5P interactivo ha sido excluido de esta versión del texto. Puedes verlo en línea aquí:
    https://uta.pressbooks.pub/historicalresearch/?p=233#h5p-12

    Los registros del censo de Estados Unidos se pueden encontrar en census.gov

    La respuesta a este problema, de cómo responder preguntas históricas sobre tendencias entre la gente común, es crear una base de datos que pueda alimentar en potentes programas de análisis, como IBM SPSS Statistics o GIS. En los párrafos siguientes, encontrarás una explicación de los conceptos básicos para crear bases de datos. También hay enlaces al final del capítulo a una mirada más técnica a la construcción de bases de datos.

    Uno de estos desafíos es que el contenido informativo de las fuentes históricas debe ser convertido —a veces de varias maneras— antes de que sea útil como datos; y durante este proceso se deben tomar varias elecciones metodológicas. Existen numerosas formas 'correctas' de hacer esto y éstas variarán en función del objetivo específico y de las fuentes utilizadas. El 'modelado' de datos históricos es un proceso difícil, pero vale la pena el esfuerzo inicial invertido en crear un diseño sólido y viable que refleje con precisión sus datos y los objetivos de su proyecto.

    Fuentes, Información y Datos

    La información puede definirse como lo que proporcionan las fuentes. Los datos pueden definirse como lo que la base de datos necesita. El reto del historiador es considerar cómo transformar la información en datos.

    Puede encontrar problemas únicos al convertir fuentes en un recurso de base de datos útil que no encuentran otros usuarios de la base de datos. Estos problemas generalmente ocurren como resultado de dos realidades inevitables de la investigación histórica:

    • Al inicio de su investigación es posible que no sepa con precisión qué tipo de análisis querrá realizar con sus datos
    • Es probable que no pueda anticipar el alcance y alcance completos de la información contenida en su base de origen

    La investigación histórica es a menudo impredecible; con frecuencia surgen nuevas líneas de investigación inesperadas en el camino. Cuanto más se familiarice con las fuentes disponibles, es más probable que ocurran estos desarrollos. Esto dificulta el diseño de bases de datos. Debes estar preparado para hacer ajustes y cambios a medida que avanzas.

    El diseño de tu base de datos tendrá un efecto directo en lo útiles que serán tus datos. Los errores en la fase de diseño pueden hacer que la entrada de datos sea más laboriosa y difícil; y, más seriamente, dichos errores tendrán un impacto significativo en la capacidad de la base de datos para recuperar datos. Es esencial que el diseño inicial de la base de datos sea lo más 'correcto' posible para minimizar la necesidad de una reestructuración retroactiva en el futuro. Incluso entonces algún rediseño es inevitable.

    La información que los historiadores encuentran rara vez viene cuidadosamente empaquetada. De hecho, a veces puede estar tan enterrado que sólo un gran esfuerzo deducción considerable puede revelar la información oculta. A menudo la información está en forma narrativa larga marcada con peculiaridades individuales. En otros casos, puede venir en forma de imágenes, grabaciones de sonido o video, cada una de las cuales presenta desafíos únicos para el diseño y manipulación de bases de datos. Fuentes aún más estructuradas como las listas de impuestos, escrituras o registros censales presentan ciertos desafíos. La uniformidad y regularidad, las dos características definitorias de las bases de datos, son casi inexistentes en el registro histórico.

    Comprender la 'forma' de los datos es esencial para comprender cómo funcionan las bases de datos en general y cómo funciona su base de datos específica. Todas las bases de datos conservan los datos en tablas que contienen columnas verticales regulares y uniformes y filas horizontales. Su información deberá ser ingresada, y probablemente modificada hasta cierto punto, para que se ajuste a estos. Inevitablemente, necesitará manipular su información para ajustarse a la estructura de las tablas de la base de datos. Se producirá algún compromiso entre mantener la integridad y riqueza de las fuentes originales y maximizar el poder analítico de la base de datos.

    La información basada en texto o estadística a primera vista puede ser la más adecuada para la conversión a una base de datos. Tomemos, por ejemplo, nuestra comparación de las tasas de analfabetismo en EU entre 1870-1880. Esta fuente parece lista para ser convertida a “datos”. La información ya está convenientemente dispuesta en columnas y filas con cada columna perteneciente a una pieza de información (nombre, edad, ocupación, etc.), y cada fila corresponde a un solo individuo. Esta fuente debe “encajar” en la estructura de la base de datos sin necesidad de demasiada conversión; la naturaleza de la información se presta al diseño de la base de datos.

    Un elemento H5P interactivo ha sido excluido de esta versión del texto. Puedes verlo en línea aquí:
    https://uta.pressbooks.pub/historicalresearch/?p=233#h5p-12

    Ejemplo de una fuente histórica 'rectangular'

    Aún así, incluso aquí es necesario algún trabajo adicional si la fuente se va a almacenar en una base de datos. La estructura tabular contiene la mayor parte de la información, pero el encabezado de la página incluye detalles importantes sobre el lugar, la hora y la identidad del censista que pueden ser útiles. Estos elementos no se ajustan a un rectángulo limpio. También hay una sobreabundancia de información, la mayoría de la cual no es útil para nuestra pregunta de investigación. Sería útil crear una nueva tabla que tenga solo la información que estamos buscando.

    Conclusión

    Aunque el diseño de una base de datos suele ser un proceso que consume mucho tiempo, en última instancia puede ser gratificante en términos del poder analítico que ofrece. Si tienes más de unas pocas docenas de fuentes informativas y necesitas datos agregados de estas, vale la pena dedicar tiempo al diseño y desarrollo de una base de datos robusta. Recuerde que no hay dos bases de datos iguales debido a diferencias en fuentes y necesidades. El verdadero indicador de éxito es si sirve o no a tus propósitos.

    Esté atento a lo siguiente como indicadores de que puede ser necesario algún cambio de diseño.

    • Información que le gustaría analizar la cual aparece repetidamente, pero no tiene ningún lugar específico para ponerla (es decir, para la cual necesitará agregar nuevos campos)
    • Si te encuentras repitiendo información de un registro a otro, tendrás que pensar en reordenar tus relaciones para evitar esto.
    • Tenga cuidado con sus tipos de datos y cámbielos donde no sean útiles.
    • Busque datos que puedan ser estandarizados o clasificados.
    • Esté atento a la información que no había anticipado a la hora de diseñar la base de datos.

    Una vez que hayas ingresado algunos datos —no necesita ser todas las fuentes— desarrolla y prueba algunas consultas. Trabajar con una pequeña cantidad de información permite conocer la respuesta “correcta” fuera de lo que devuelve la consulta. Eso le permite probar su consulta y diseño de datos. Si obtiene respuestas que difieren de lo que espera, es más fácil solucionar el problema mientras que la base de datos es relativamente pequeña en tamaño y alcance. Las diferencias que obtengas pueden deberse al diseño de la base de datos o a algún defecto lógico en la propia consulta. Es importante aislar y resolver estos problemas mientras los datos sean lo suficientemente pequeños como para ser manejables.

    Si realiza cambios en el diseño de su base de datos, considere hacer copias de la base de datos antes de estos cambios. Tener una copia de seguridad puede salvar vidas en caso de que algo no funcione como se esperaba.

    Próximos pasos de la base

    A continuación encontrará enlaces a información adicional sobre la construcción y el uso de su base de datos

    • Crear una Base de Datos, y las distintas partes de una.
    • Reglas de base de datos y tipos de datos, consejos para una base de datos buena y algo libre de errores.
    • Solución de problemas de bases de datos
    • Trabajar con mesas múltiples

    This page titled 3.5: Construcción de bases de datos is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Alex Hunnicutt (Mavs Open Press) via source content that was edited to the style and standards of the LibreTexts platform.