Saltar al contenido principal
LibreTexts Español

2.7: Onda emergente: Big Data y Machine Learning

  • Page ID
    132299
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    Al final de esta sección, podrás:

    • Definir big data y machine learning
    • Explicar cómo se utilizan los big data y el aprendizaje automático en ciencias políticas

    La ciencia política es una disciplina dinámica porque está dispuesta a tomar prestada de otras disciplinas para mejorar su estudio de actores políticos, instituciones y procesos. Hay un par de ondas emergentes que están cambiando la naturaleza de la indagación científica y de la ciencia política. Dos olas que queremos destacar aquí son el big data y el machine learning.

    La mente humana no es capaz de tamizar, clasificar y analizar estos crecientes conjuntos de datos, pero las computadoras sí. Es útil señalar que hasta finales de la década de 1980 y principios de los noventa, los investigadores tuvieron que calcular estadísticas descriptivas y regresiones lineales a mano y con calculadoras. Pero en los últimos 20 años, la tecnología se ha vuelto ampliamente disponible y el acceso al software ha aumentado. Con tanto el hardware como el software en manos de más politólogos, aumentamos el rango de exploración y generación de conocimiento que viene con el análisis de fenómenos políticos.

    El big data se define como la montaña de información, en forma de petabytes y exabytes, que se está almacenando en computadoras y servidores de todo el mundo. A medida que proliferan las computadoras y nuestro uso de ellas para uso personal, organizacional, corporativo y gubernamental crece exponencialmente, la cantidad de información que estamos generando como sociedad humana está explotando a pasos agigantados todos los días. Y hay preocupaciones sobre lo que esto significa para la sociedad (Brady 2019). Con crecientes montañas de datos, surgen algunas preguntas: ¿Cómo podemos estudiarlo? ¿Cómo podemos descubrir patrones en los datos? ¿Cómo podemos derivar nuevos significados y entendimientos a partir de estos datos?

    Big Data es “grande” porque la cantidad de espacio que ocupa en el disco duro de una computadora, pero las técnicas para analizar “Big Data” están disponibles en programas informáticos que los politólogos han utilizado durante años para analizar estadísticamente grandes conjuntos de datos. SPSS, Stata, R y Python son todos los elementos básicos del software de análisis de datos estadísticos en la disciplina.

    Pero, dentro de la última década, dos grandes cambios están revolucionando el estudio de todo, desde la política y la economía hasta la biología y la química. En primer lugar, hemos visto avances significativos en la tecnología de hardware informático. Específicamente, los avances en las unidades de procesamiento gráfico también conocidas como GPU han cambiado fundamentalmente nuestra capacidad para analizar montañas de datos. El corto de largo es que las unidades de procesamiento por computadora o CPU se han reducido en tamaño pero han crecido en potencia computacional. ¿Por qué crees que puedes sostener una computadora en la palma de tu mano? Las GPU, que funcionan de forma independiente y en conjunto con las CPU, tienen un tremendo poder computacional.

    En segundo lugar, los informáticos han estado desarrollando nuevos lenguajes de programación, mecanismos de colaboración en la programación y empujando los límites de la inteligencia artificial. Aquí es donde comienza a emerger nuestra segunda ola de aprendizaje automático. A medida que la informática ha traspasado los límites del software, dados los avances en CPU y GPU, está empujando los límites de lo que el software puede hacer con respecto a ingresar, analizar y aprender de los datos en el mundo que nos rodea. El aprendizaje automático es la capacidad de un programa de computadora para comenzar con un modelo inicial de datos, analizar datos reales, aprender de este análisis y actualizar automáticamente ese modelo inicial para incorporar los hallazgos de su análisis. Ahora bien, esto no solo sucede una vez que se hace el software de la computadora, este ciclo puede suceder iterativamente permitiendo así que el software destape categorías, patrones y significados.

    ¿Qué significa todo esto para la ciencia política? Honestamente, no tenemos respuesta a esa pregunta. Lo que sí sabemos es que la próxima generación de politólogos liderará los esfuerzos para utilizar big data y machine learning para explicar comportamientos políticos, instituciones y procesos. Es un momento emocionante para estar entrando al campo y las experiencias que tienes, las preguntas que te intrigan, y la investigación que llevará a cabo ayudarán a construir nuestro conocimiento de la política.