Saltar al contenido principal
LibreTexts Español

7: Asuntos pragmáticos

  • Page ID
    151534
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El jardín de la vida nunca parece limitarse a las tramas que los filósofos han trazado para su conveniencia. A lo mejor algunos tractores más harían el truco.

    —Roger Zelazny 103

    Este es un capítulo algo extraño, incluso para mis estándares. Mi objetivo en este capítulo es hablar un poco más honestamente sobre las realidades de trabajar con datos de lo que verás en cualquier otro lugar del libro. El problema con los conjuntos de datos del mundo real es que son desordenados. Muy a menudo el archivo de datos con el que comienzas no tiene las variables almacenadas en el formato adecuado para el análisis que quieres hacer. A veces puede haber muchos valores faltantes en su conjunto de datos. A veces solo se quiere analizar un subconjunto de los datos. etcétera. En otras palabras, hay mucha manipulación de datos que debes hacer, solo para obtener todo tu conjunto de datos en el formato que lo necesites. El propósito de este capítulo es proporcionar una introducción básica a todos estos temas pragmáticos. Aunque el capítulo está motivado por el tipo de cuestiones prácticas que surgen al manipular datos reales, me quedaré con la práctica que he adoptado a través de la mayor parte del libro y me basaré en conjuntos de datos de juguetes muy pequeños que ilustran el tema subyacente. Debido a que este capítulo es esencialmente una colección de “trucos” y no cuenta una sola historia coherente, puede ser útil comenzar con una lista de temas:

    • Sección 7.1. Tabulando datos.
    • Sección 7.2. Transformar o recodificar una variable.
    • Sección 7.3. Algunas funciones matemáticas útiles.
    • Sección 7.4. Extracción de un subconjunto de un vector.
    • Sección 7.5. Extracción de un subconjunto de un marco de datos.
    • Sección 7.6. Ordenar, voltear o fusionar conjuntos de datos.
    • Sección 7.7. Cambiar la forma de un marco de datos.
    • Sección 7.8. Manipulación de texto.
    • Sección 7.9. Apertura de datos de diferentes tipos de archivos.
    • Sección 7.10. Coaccionar datos de un tipo a otro.
    • Sección 7.11. Otros tipos de datos importantes.
    • Sección 7.12. Temas diversos.

    Como puedes ver, la lista de temas que abarca el capítulo es bastante amplia, y ahí hay mucho contenido. A pesar de que este es uno de los capítulos más largos y duros del libro, en realidad solo estoy rascando la superficie de varios temas bastante diferentes e importantes. Mi consejo, como siempre, es leer el capítulo una vez y tratar de seguirlo todo lo que puedas. No te preocupes demasiado si no puedes captarlo todo a la vez, especialmente las secciones posteriores. El resto del libro solo depende ligeramente de este capítulo, por lo que puedes salirte con la tuya entendiendo lo básico. Sin embargo, lo que probablemente encontrarás es que más adelante necesitarás volver a este capítulo para entender algunos de los conceptos a los que me refiero aquí.


    This page titled 7: Asuntos pragmáticos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.