Saltar al contenido principal
LibreTexts Español

7.2: El qué y el por qué de las categorías

  • Page ID
    98033
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    El qué y el por qué de las categorías

    Las categorías son clases de equivalencia, conjuntos o grupos de cosas o entidades abstractas que tratamos igual. Esto no quiere decir que cada instancia de una categoría sea idéntica, solo que desde alguna perspectiva, o para algún propósito, las estemos tratando como equivalentes en base a lo que tienen en común. Cuando consideramos algo como miembro de una categoría, estamos tomando decisiones sobre cuáles de sus propiedades o roles nos estamos enfocando y cuáles estamos ignorando. Esto lo hacemos de manera automática e inconsciente la mayor parte del tiempo, pero también podemos hacerlo de manera explícita y consciente de nosotros mismos. Cuando creamos categorías con esfuerzo consciente, a menudo decimos que estamos creando un modelo, o simplemente modelando. Debe estar familiarizado con la idea de que un modelo es un conjunto de descripciones simplificadas o una representación física que elimina cierta complejidad para enfatizar algunas características o características y desenfatizar otras. [1]

    Cuando nos encontramos con objetos o situaciones, reconocerlos como miembros de una categoría nos ayuda a saber cómo interactuar con ellos. Por ejemplo, cuando entramos en un edificio desconocido podríamos necesitar abrir o pasar por una entrada que reconocemos como puerta. Puede que nunca antes hayamos visto esa puerta en particular, pero tiene propiedades y prestaciones que sabemos que todas las puertas tienen; tiene un pomo o una manija; permite el acceso a un espacio más grande; se abre y se cierra. Al asignar mentalmente esta puerta en particular a la categoría de “puertas” la distinguimos de “ventanas”, categoría que también contiene objetos que a veces tienen tiradores y que se abren y cierran, pero por los que normalmente no pasamos para entrar en otro espacio. Por lo tanto, los juicios de categorización no son solo sobre lo que se incluye en una clase, sino también sobre lo que se excluye de una clase. Sin embargo, los límites de categoría no son nítidos; una “puerta holandesa” se divide horizontalmente por la mitad para que la parte inferior se pueda cerrar como una puerta mientras que la parte superior puede permanecer abierta como una ventana.

    Las categorías son modelos cognitivos y lingüísticos para aplicar conocimientos previos; crear y usar categorías son actividades humanas esenciales. Las categorías nos permiten relacionar las cosas entre sí en términos de similitud y disimilitud y están involucradas cada vez que percibimos, comunicamos, analizamos, predicemos o clasificamos. Sin categorías, percibiríamos al mundo como un desenfoque desorganizado de cosas sin relación comprensible o memorable entre sí. Cada entrada a la pared que encontremos sería nueva para nosotros, y tendríamos que descubrir sus propiedades e interacciones compatibles como si nunca antes nos hubiéramos encontrado con una puerta. Por supuesto, todavía a menudo necesitamos identificar algo como una instancia particular, pero las categorías nos permiten entender cómo es equivalente a otras instancias. Podemos relacionarnos indistintamente con algo tan específico como “la puerta de madera a la sala de conferencias principal” o más generalmente como “cualquier puerta.

    Todas las lenguas y culturas humanas dividen el mundo en categorías. Durante mucho tiempo, filósofos, psicólogos y antropólogos han debatido cómo y por qué esto ocurre. Una explicación para esta diferenciación es que las personas reconocen la estructura en el mundo, para luego crear categorías de cosas que “van juntas” o son de alguna manera similares. Una visión alternativa dice que las mentes humanas le dan sentido al mundo al imponerle estructura, y que lo que va de la mano o parece similar es el resultado más que una causa de categorización. Bulmer enmarcó el contraste de una manera memorable preguntando cuál vino primero, el pollo (los hechos objetivos de la naturaleza) o la cabeza de huevo (el papel del intelecto humano). [2]

    Un debate secundario y más especializado que se desarrolla durante las últimas décadas entre lingüistas, científicos cognitivos e informáticos se refiere a la medida en que los mecanismos cognitivos involucrados en la formación de categorías se especializan para ese propósito en lugar de procesos de aprendizaje más generales. [3]

    Incluso antes de que puedan hablar, los niños se comportan de manera que sugieren que han formado categorías basadas en la forma, el color y otras propiedades que pueden percibir directamente en los objetos físicos. [4]

    La gente aprende casi sin esfuerzo decenas de miles de categorías encarnadas en la cultura y el idioma en el que crecen. Las personas también confían en sus propias experiencias, preferencias y metas para adaptar estas categorías culturales o crear categorías completamente individuales que utilizan para organizar los recursos que organizan personalmente. Posteriormente, a través de la formación situacional y la educación formal, las personas aprenden a aplicar procesos de pensamiento sistemático y lógico para que puedan crear y comprender categorías en ingeniería, logística, transporte, ciencia, derecho, negocios y otros contextos institucionales.

    Estos tres contextos de categorización cultural, individual e institucional comparten algunas ideas centrales pero enfatizan diferentes procesos y propósitos para crear categorías, por lo que son una distinción útil. [5] La categorización cultural puede entenderse como una capacidad cognitiva humana natural que sirve de base para sistemas de organización tanto informales como formales. La categorización individual tiende a crecer espontáneamente a partir de nuestras actividades personales. La categorización institucional responde a la necesidad de coordinación formal y cooperación dentro y entre empresas, gobiernos y otras empresas orientadas a objetivos.

    En contraste con estos tres contextos de categorización en los que las categorías son creadas por personas, las categorías computacionales son creadas por programas de computadora para recuperación de información, aprendizaje automático, análisis predictivo y otras aplicaciones. Las categorías computacionales son similares a las creadas por las personas de alguna manera pero difieren sustancialmente en otras formas.

    Categorías Culturales

    Las categorías culturales son la forma arquetípica de categorías en las que generalmente se basan las categorías individuales e institucionales. Las categorías culturales tienden a describir nuestras experiencias cotidianas del mundo y nuestro conocimiento cultural acumulado. Estas categorías describen objetos, eventos, escenarios, experiencias internas, orientación física, relaciones entre entidades y muchos otros aspectos de la experiencia humana. Las categorías culturales se aprenden principalmente, con poca instrucción explícita, a través de la exposición normal de los niños con sus cuidadores; se asocian con la adquisición del lenguaje y el uso del lenguaje dentro de contextos culturales particulares.

    Hace dos mil años Platón escribió que las especies vivas podrían identificarse “tallando la naturaleza en sus articulaciones”, los límites naturales o discontinuidades entre tipos de cosas donde las diferencias son las mayores o más sobresalientes. La metáfora de Platón es intuitivamente atractiva porque podemos llegar fácilmente a ejemplos de propiedades o comportamientos perceptibles de las cosas físicas que van de la mano y que hacen que algunas formas de categorizarlas parezcan más naturales que otras. [6]

    Los lenguajes naturales dependen en gran medida de los sustantivos para hablar de categorías de cosas porque es útil tener una forma taquigráfica de referirse a un conjunto de propiedades que coocurren de manera predecible. [7] Por ejemplo, en inglés (prestado del portugués) tenemos una palabra para “banana” porque una particular forma curva, color amarillo verdoso o amarillo, y un tamaño conveniente tienden a coexistir en un objeto comestible familiar, por lo que se volvió útil darle un nombre. La palabra “banano” reúne esta configuración de percepciones altamente interrelacionadas en un concepto unificado por lo que no tenemos que referirnos a los plátanos enumerando sus propiedades. [8]

    Los idiomas difieren mucho en las palabras que contienen y también en formas más fundamentales que requieren que hablantes o escritores atiendan detalles sobre el mundo o aspectos de la experiencia que otro idioma les permite ignorar. Esta idea suele describirse como relatividad lingüística. (Ver la barra lateral, Relatividad Lingüística.)

    Por ejemplo, los hablantes de la lengua aborigen australiana, Guugu Yimithirr, no utilizan conceptos de izquierda y derecha, sino que utilizan direcciones cardinales. Donde en inglés podríamos decirle a una persona orientada al norte, “Da un paso a tu izquierda”, usarían su término para occidente. Si la persona mirara hacia el sur, cambiaríamos nuestra instrucción a “derecha”, pero aún usarían su término para occidente. Imagina lo difícil que sería para un hablante de Guugu Yimithirr y un hablante de inglés colaborar en la organización de un trastero o un clóset. [10]

    No es polémico notar que diferentes culturas y comunidades lingüísticas tienen diferentes experiencias y actividades que les dan conocimientos contrastantes sobre dominios particulares. Nadie dudaría que los estudiantes universitarios en Chicago pensarían de manera diferente sobre los animales que los habitantes de las selvas tropicales guatemaltecas, o incluso que diferentes tipos de “expertos en árboles” (taxonomistas, paisajistas, silvicultores y personal de mantenimiento de árboles) categorizarían los árboles de manera diferente. [11]

    Por otro lado, a pesar de la amplia variación en los climas, ambientes y culturas que los producen, a un alto nivel las “taxonomías folclóricas” que describen fenómenos naturales son sorprendentemente consistentes en todo el mundo. Hace medio siglo los sociólogos Emile Durkheim y Marcel Mauss observaron que el lenguaje y la estructura de las taxonomías folclóricas reflejan el de las relaciones familiares humanas (e.g., diferentes tipos de árboles podrían ser “ hermanos”, pero los animales serían parte de otra familia por completo). Sugirieron que enmarcar el mundo en términos de relaciones humanas familiares permitía a las personas entenderlo más fácilmente. [12]

    El antropólogo Brent Berlin, investigador más reciente, coincide con la observación de Durkheim y Mauss de que las relaciones de parentesco y las taxonomías folclóricas están relacionadas, pero sostiene que los humanos modelaron sus estructuras familiares según el mundo natural, no al revés. [13]

    Categorías Individuales

    Las categorías individuales se crean en un sistema de organización para satisfacer los requisitos ad hoc que surgen de las experiencias, preferencias y colecciones de recursos únicas de una persona. A diferencia de las categorías culturales, que suelen desarrollarse lentamente y duran mucho tiempo, las categorías individuales se crean por actividad intencional, en respuesta a una situación específica, o para resolver un desafío organizacional emergente. Como consecuencia, las categorías en los sistemas de organización individuales generalmente tienen vidas cortas y rara vez sobreviven a la persona que las creó. [14]

    Las categorías individuales provienen de categorías culturales pero difieren en dos formas importantes. Primero, las categorías individuales a veces tienen una base imaginativa o metafórica que es significativa para la persona que las creó pero que podría distorsionar o malinterpretar las categorías culturales. Segundo, las categorías individuales suelen ser versiones especializadas o sintetizadas de categorías culturales que capturan experiencias particulares o historia personal. Por ejemplo, una persona que ha vivido en China y México, o convivido con gente de esos lugares, podría tener categorías altamente individualizadas para los alimentos que le gustan y no les gustan que incorporan características de la cocina tanto china como mexicana.

    Las categorías individuales en los sistemas de organización también reflejan el conjunto idiosincrásico de artículos para el hogar, música, libros, marcadores de sitios web u otros recursos que una persona podría haber recopilado a lo largo del tiempo. Los sistemas de organización de registros financieros, documentos personales o mensajes de correo electrónico suelen utilizar categorías altamente especializadas que están moldeadas por tareas específicas a realizar, relaciones con otras personas, eventos de historia personal y otras consideraciones altamente individualizadas. Dicho de otra manera, las categorías individuales se utilizan para organizar colecciones de recursos que probablemente no sean muestras representativas de todos los recursos del tipo que se están recolectando. Si todos tuvieran la misma colección de música, libros, ropa o juguetes el mundo sería un lugar aburrido.

    Tradicionalmente, los sistemas de categorización individual generalmente no eran visibles o compartidos con otros, mientras que esto se ha convertido en una situación cada vez más común para las personas que utilizan un sistema de organización basado en la web para imágenes, música u otros recursos personales. En sitios web como los populares sitios de Flickr, Instagram y YouTube para fotos y videos, las personas suelen usar categorías culturales existentes para etiquetar su contenido, así como los individuales que inventan. [15]

    Categorías Institucionales

    A diferencia de las categorías culturales que se crean y utilizan implícitamente, y a las categorías individuales que son utilizadas por personas que actúan solas, las categorías institucionales son creadas y utilizadas explícitamente, y la mayoría de las veces por muchas personas en coordinación entre sí. Las categorías institucionales se crean con mayor frecuencia en dominios abstractos e intensivos en información, donde se necesitan categorías inequívocas y precisas para regular y sistematizar la actividad, permitir el intercambio y reutilización de información y reducir los costos de transacción. Además, en lugar de describir el mundo tal como es, las categorías institucionales suelen definirse para cambiar o controlar el mundo imponiendo modelos semánticos más formales y arbitrarios que los de las categorías culturales. Las leyes, regulaciones y estándares a menudo especifican categorías institucionales, junto con reglas de decisión para asignar recursos a nuevas categorías, y reglas de comportamiento que prescriben cómo las personas deben interactuar con ellas. La rigurosa definición de categorías institucionales permite clasificar: la asignación sistemática de recursos a categorías en un sistema de organización. [16]

    La creación de categorías institucionales por procesos más sistemáticos que las categorías culturales o individuales no garantiza que sean utilizadas de manera sistemática y racional, porque el razonamiento y la justificación detrás de las categorías institucionales pueden ser desconocidos para, o ignorados por, las personas que las utilizan. De igual manera, esta forma de crear categorías no impide que sean sesgadas. En efecto, el objetivo de las categorías institucionales suele ser imponer o incentivar sesgos en la interpretación o el comportamiento. No hay mejor ejemplo de ello que la práctica del gerrymandering, diseñando los límites de los distritos electorales para dar ventaja a un partido político o grupo étnico. [17] (Ver la barra lateral, Gerrymandering en Illinois.)

    La categorización institucional se distingue de la categorización individual principalmente porque invariablemente requiere esfuerzos significativos para conciliar los desajustes entre categorías individuales existentes, donde esas categorías encarnan conocimiento útil de trabajo o contextual que se pierde en el paso a una sistema institucional formal. [18]

    Los esfuerzos de categorización institucional también deben superar la vaguedad e inconsistencia de las categorías culturales, ya que las primeras a menudo deben ajustarse a normas lógicas más estrictas para apoyar la inferencia y cumplir con los requisitos legales. Además, la categorización institucional suele ser un proceso que debe contabilizarse en un presupuesto y planes de dotación de personal. Si bien algunos tipos de categorías institucionales pueden ser ideadas o descubiertas por procesos computacionales, la mayoría de ellas se crean a través de la colaboración de muchos individuos, típicamente de diversas partes de una organización o de diferentes firmas. Por ejemplo, con el caso gerrymandering que acabamos de discutir, es importante enfatizar que los insumos a estos programas y las decisiones sobre la distritación son controlados por la gente, razón por la cual los distritos son categorías institucionales; los programas son simplemente herramientas que hacen más eficiente el proceso. [19]

    Piense en la categoría muy amplia de “color. ” ¿Cuáles son algunos ejemplos de una categoría de color “cultural”? ¿Qué tal uno “individual”? ¿Y uno “institucional”?

    Las diferentes perspectivas comerciales o técnicas de los participantes suelen ser los ingredientes esenciales para desarrollar categorías robustas que puedan satisfacer requisitos cuidadosamente identificados. Y a medida que los requisitos cambian con el tiempo, las categorías institucionales a menudo también deben cambiar, lo que implica control de versiones, pruebas de cumplimiento y otros procesos formales de mantenimiento y gobierno.

    Algunas categorías institucionales que inicialmente tenían aplicabilidad estrecha o enfocada han encontrado su camino hacia un uso más popular y ahora se consideran categorías culturales. Un buen ejemplo es la tabla periódica en química, que Mendeleev desarrolló en 1869 como un nuevo sistema de categorías para los elementos químicos. La tabla periódica resultó esencial para los científicos en la comprensión de sus propiedades y en la predicción de las no descubiertas. Hoy en día la tabla periódica se enseña en las escuelas primarias, y muchas cosas distintas a los elementos se organizan comúnmente usando una estructura gráfica que se asemeja a la tabla periódica de elementos en química, incluyendo películas y películas de ciencia ficción, postres y superhéroes. [20]

    Un “Continuum de Categorización

    Como hemos visto, los conceptos de categorización cultural, individual e institucional distinguen útilmente los procesos y propósitos primarios cuando las personas crean categorías. Sin embargo, estos tres tipos de categorías pueden fusionarse, chocar y recombinarse entre sí. En lugar de verlas como que tienen límites precisos, podríamos verlas como regiones en un continuo de actividades y métodos de categorización.

    Considere algunas perspectivas diferentes sobre la categorización de animales como ejemplo. Las instituciones científicas clasifican a los animales de acuerdo con sistemas de clasificación explícitos y principios, como la taxonomía linnaea que asigna animales a un filo, clase, orden, familia, género y especie. Las prácticas de categorización cultural no pueden describirse adecuadamente en términos de una taxonomía maestra, y son más fluidas, convergiendo con taxonomías de principios a veces y divergiendo en otras ocasiones. Si bien los seres humanos se clasifican dentro del reino animal en los sistemas de clasificación biológica, las personas generalmente no se consideran animales en la mayoría de los contextos culturales. A veces una designación científica para los seres humanos, el homo sapiens se aplica incluso a los seres humanos en contextos culturales, ya que la designación taxonómica género-especie ha influido en las concepciones culturales de las personas y (otros) animales a lo largo de los años.

    Los animales también suelen clasificarse culturalmente como mascotas o no mascotas. La categoría “mascotas” comúnmente incluye perros, gatos y peces. Un gato mascota puede ser categorizado en múltiples niveles que incorporan perspectivas individuales, culturales e institucionales sobre la categorización, como un “animal” (cultural/institucional), como un “mamífero” (institucional), como un “pelo corto doméstico” (institucional) comogato” (cultural), y como “alborotador” o “favorito” (individuo), entre otras posibilidades, además de ser identificado individualmente por uno o más nombres de mascotas. Además, no todos experimentan mascotas como perros, gatos y peces. Algunas personas tienen mascotas relativamente inusuales, como los cerdos. Para las personas que tengan cerdos de compañía o que conozcan a personas con cerdos de compañía, los “cerdos” pueden incluirse en la categoría “mascotas”. Si suficientes personas tienen cerdos mascotas, eventualmente los “cerdos” podrían incluirse en la categoría de mascotas de la cultura convencional.

    La categorización sesgada hacia perspectivas culturales incorpora categorías relativamente tradicionales, como las aprendidas implícitamente de las interacciones sociales, como los entendimientos convencionales de qué tipos de animales son “mascotas”, mientras que la categorización sesgada hacia perspectivas institucionales enfatiza explícitas, formales, como las categorías empleadas en los sistemas de clasificación biológica.

    Categorías Computacionales

    Las categorías computacionales son creadas por programas de computadora cuando el número de recursos, o cuando el número de descripciones u observaciones asociadas a cada recurso, son tan grandes que la gente no puede pensar en ellos de manera efectiva. Las categorías computacionales se crean para la recuperación de información, análisis predictivo y otras aplicaciones donde los requisitos de escala de información o velocidad son críticos. Las categorías resultantes son similares a las creadas por las personas de alguna manera pero difieren sustancialmente en otras formas.

    El tipo más simple de categorías computacionales se puede crear usando estadística descriptiva (ver “Organizar con estadísticas descriptivas”). Las estadísticas descriptivas no identifican las categorías que crean dándoles etiquetas culturales o institucionales familiares. En cambio, crean categorías implícitas de artículos según lo mucho que difieran de los más típicos o frecuentes. Por ejemplo, en cualquier conjunto de datos donde los valores sigan la distribución normal, las estadísticas de tendencia central y dispersión sirven como medidas de referencia estándar para cualquier observación. Estas estadísticas identifican categorías de ítems que son muy diferentes o valores atípicos estadísticamente improbables, que podrían ser señales de errores de medición, equipos mal calibrados, empleados que están inadecuadamente capacitados o cometen fraude, u otros problemas. La metodología “Six Sigma” para la mejora de procesos y el control de calidad se basa en esta idea de que la recolección cuidadosa y consistente de estadísticas puede mejorar cualquier operación medible.

    Muchos métodos y aplicaciones de procesamiento de texto utilizan estadísticas simples para clasificar las palabras por su frecuencia en un idioma, en una colección de documentos o en documentos individuales, y estas categorías se explotan en muchas aplicaciones de recuperación de información (consulte “Interacciones basadas en propiedades de instancia” y” Interacciones Basadas en Propiedades de Colección”).

    Las categorías que las personas crean y etiquetan también se pueden usar de manera más explícita en algoritmos y aplicaciones computacionales. En particular, un programa que puede asignar un elemento o instancia a una o más categorías existentes se denomina clasificador. El subcampo de la informática conocido como machine learning es el hogar de numerosas técnicas para crear clasificadores entrenándolos con ejemplos ya correctamente categorizados. Esta formación se llama aprendizaje supervisado; se supervisa porque comienza con instancias etiquetadas por categoría, e implica aprendizaje porque con el tiempo el clasificador mejora su rendimiento ajustando los pesos para características que distinguen las categorías. Pero estrictamente hablando, las técnicas de aprendizaje supervisado no aprenden las categorías; implementan y aplican categorías que heredan o se les dan. Discutiremos más a fondo la implementación computacional de categorías creadas por personas en “Categorías de Implementación”.

    En contraste, muchas técnicas computacionales en el aprendizaje automático pueden analizar una colección de recursos para descubrir regularidades estadísticas o correlaciones entre los ítems, creando un conjunto de categorías sin ningún dato de entrenamiento etiquetado. Esto se llama aprendizaje no supervisado o reconocimiento de patrones estadísticos. Como señalamos en “Categorías Culturales”, aprendemos la mayoría de nuestras categorías culturales sin ninguna instrucción explícita sobre ellas, por lo que no es sorprendente que los modelos computacionales de categorización desarrollados por científicos cognitivos a menudo empleen métodos de aprendizaje estadístico no supervisados.

    Muchas categorías computacionales son como categorías individuales porque están vinculadas a colecciones específicas de recursos o datos y están diseñadas para satisfacer objetivos estrechos. Las categorías individuales que utiliza para organizar su bandeja de entrada de correo electrónico o los archivos en su computadora reflejan sus intereses específicos, actividades y red personal y seguramente son diferentes a las de cualquier otra persona. Del mismo modo, la compañía de tu tarjeta de crédito analiza tus transacciones específicas para crear categorías computacionales de “probablemente buena” y “probablemente fraudulenta” que son diferentes para cada titular de la tarjeta.

    Este alcance enfocado es obvio cuando consideramos cómo podríamos describir una categoría computacional. “Transacción fraudulenta para el titular de la tarjeta 4264123456780123” no se lexicaliza con una etiqueta de una palabra como lo son las categorías culturales familiares. “Puerta” y “ventana” tienen amplios alcances que no están atados a un solo propósito. Dicho de otra manera, las categorías culturales “puerta” y “ventana” son altamente reutilizables, al igual que las categorías institucionales como las que se utilizan para recopilar datos económicos o de salud que pueden ser analizados para muchos propósitos diferentes. Las definiciones de “puerta” y “ventana” pueden ser un poco confusas, pero las categorías institucionales se definen con mayor precisión, a menudo por ley o regulación. Ejemplos son el Sistema de Clasificación Industrial de América del Norte (NAICS) de la Oficina del Censo de Estados Unidos y el Código Estándar de Productos y Servicios de las Naciones Unidas (UNSPC).

    Un contraste final entre las categorías creadas por las personas y las creadas computacionalmente es que las primeras casi siempre pueden ser inspeccionadas y razonadas por otras personas, pero sólo algunas de las segundas pueden hacerlo. Un modelo computacional que clasifica a los solicitantes de préstamos como buenos o malos riesgos crediticios probablemente usa propiedades como la edad, ingresos, domicilio y estado civil, para que un banquero pueda entender y explicar una decisión crediticia. Sin embargo, muchas otras categorías computacionales, especialmente las que crearon mediante técnicas de clustering y deep learning, son inseparables del modelo matemático que aprendió a utilizarlas, y como resultado son ininterpretables por las personas.

    Un algoritmo de aprendizaje automático para clasificar objetos en imágenes crea una compleja red neuronal multicapa cuyas características no tienen una relación clara con las categorías, y esta red no tiene otro uso. Dicho de otra manera, los programas de aprendizaje automático son muy generales porque pueden emplearse en cualquier dominio con datos de alta dimensión, pero lo que aprenden no se puede aplicar en ningún otro dominio.


    1. La ciencia cognitiva se centra principalmente en los mecanismos automáticos e inconscientes para crear y usar categorías. Esta perspectiva disciplinaria enfatiza la activación del conocimiento de categorías con el propósito de hacer inferencias y “ir más allá de la información dada”, para usar la frase clásica de Bruner (Bruner 1957). En contraste, la disciplina de la organización se enfoca en los mecanismos explícitos y autoconscientes para crear y usar categorías porque por definición, los sistemas de organización sirven propósitos intencionales y a menudo altamente explícitos. Los sistemas de organización facilitan inferencias sobre los recursos que contienen, pero los propósitos más restringidos para los que se describen y organizan los recursos hacen de la inferencia un objetivo secundario.

      La ciencia cognitiva también está altamente enfocada en comprender y crear modelos computacionales de los mecanismos para crear y usar categorías. Estos modelos combinan el procesamiento basado en datos o de abajo hacia arriba con el procesamiento basado en el conocimiento o de arriba hacia abajo para simular el curso del tiempo y los resultados de la categorización tanto en escalas de grano fino (como en el reconocimiento de palabras u objetos) como en marcos de tiempo de desarrollo (como en la forma en que los niños aprenden categorías). La disciplina de la organización puede aprender de estos modelos sobre los tipos de propiedades y principios que utilizan los sistemas organizadores, pero estos modelos computacionales no son una preocupación primordial para nosotros en este libro.


    2. No obstante, incluso la forma en que se ha enmarcado este debate es un poco polémico. El pollo de Bulmer, la posición de “las categorías están en el mundo”, ha sido descrito como empírico, impulsado por el medio ambiente, de abajo hacia arriba u objetivista, y estos no son sinónimos. De igual manera, la posición de “cabeza de huevo” de que “las categorías están en la mente” se ha llamado racional, constructiva, de arriba hacia abajo, experiencial y encarnada —y tampoco son sinónimos. Véase (Bulmer 1970). Véase también (Lakoff 1990), (Malt 1995).


    3. ¿Existe una “gramática universal” o una “facultad de lenguaje” que imponga fuertes restricciones al lenguaje humano y a la cognición? (Chomsky 1965) y (Jackendoff 1996) lo piensan así. Tales propuestas implican representaciones cognitivas en las que las categorías son estructuras explícitas en la memoria con instancias y propiedades asociadas. En contraste, las teorías de aprendizaje generalizado modelan la formación de categorías como el ajuste de los patrones y ponderación de conexiones en redes de procesamiento neuronal que no están especializadas para el lenguaje de ninguna manera. Las simulaciones computacionales de redes semánticas pueden reproducir los resultados experimentales y conductuales sobre la adquisición del lenguaje y los juicios semánticos que han sido utilizados como evidencia para representaciones explícitas de categorías sin necesidad de nada como ellos. (Rogers y McClelland 2008) revisan minuciosamente los modelos explícitos de categorías y luego muestran cómo los modelos de aprendizaje relativamente simples pueden prescindir de ellos.


    4. Los debates sobre la formación de categorías humanas también se extienden a cuestiones de cómo los niños aprenden categorías y métodos de categorización. La mayoría de los psicólogos argumentan que el aprendizaje de categorías comienza con mecanismos generales de aprendizaje que están muy basados en la percepción, pero no coinciden en caracterizar estos cambios como “etapas” o como fases en un sistema dinámico más complejo. Con el tiempo evolucionan técnicas de aprendizaje más específicas que se centran en correlaciones entre propiedades perceptuales (las cosas con alas tienden a tener plumas), correlaciones entre propiedades y roles (las cosas con ojos tienden a comer), y en última instancia correlaciones entre roles (las cosas que comen tienden a dormir). Véase (Smith y Thelen 2003).


    5. Estos tres contextos fueron propuestos por (Glushko, Maglio, Matlock, y BarSalou 2008), quienes señalaron que la ciencia cognitiva se ha centrado en la categorización cultural y en gran medida ignorado contextos individuales e institucionales. Argumentan que tomar una visión más amplia de la categorización resalta dimensiones sobre las que varía que no son evidentes cuando solo se consideran categorías culturales. Por ejemplo, las categorías institucionales suelen diseñarse y mantenerse utilizando métodos prescriptivos que no tienen análogos con categorías culturales. Existe una diferencia entre las categorías institucionales creadas para las personas, y las categorías creadas en instituciones por computadoras en el sentido de análisis predictivo, minería de datos.


    6. Esta cita proviene del diálogo Fedro de Platón, escrito alrededor del 370 a.C. Los filósofos contemporáneos y los científicos cognitivos comúnmente lo invocan en las discusiones sobre si existen “tipos naturales”. Por ejemplo, véase (Campbell, O'Rourke, y Slater 2011), y (Hutchins 2010), (Atran 1987), y otros han argumentado que la existencia de discontinuidades perceptuales no es suficiente para dar cuenta de la formación de categorías. En cambio, las personas asumen que los miembros de una categoría biológica deben tener una esencia de propiedades concurrentes y estas guían a las personas a enfocarse en las diferencias sobresalientes, creando así categorías. Los clústeres de propiedades permiten inferencias sobre la causalidad, que luego construye un marco sobre el cual se pueden crear y refinar categorías adicionales. Por ejemplo, si “tener alas” y “volar” son propiedades concurrentes que sugieren una categoría de “pájaro”, las alas se infieren entonces como la base causal del vuelo, y las alas se vuelven más sobresalientes.


    7. Los pronombres, adjetivos, verbos, adverbios, preposiciones, conjunciones, partículas y números y otras “partes del discurso” también son categorías gramaticales, pero los sustantivos llevan la mayor parte del peso semántico.


    8. En contraste, el conjunto de posibles interacciones incluso con un objeto simple como un plátano es muy grande. Podemos recoger, pelar, rebanar, aplastar, comer o lanzar un plátano, así que en lugar de capturar esta complejidad en el significado de plátano se divide en los verbos que pueden actuar sobre el sustantivo banana. Hacerlo requiere que los lenguajes utilicen verbos para capturar un tipo de significado más amplio y abstracto que está determinado por los sustantivos con los que se combinan. Verbos familiares como “set”, “put” y “get” tienen docenas de sentidos diferentes como resultado porque van con tantos sustantivos diferentes. Nosotros prendemos fuego y ponemos mesas, pero los fuegos y las mesas tienen poco en común. El carácter intangible de los verbos y la complejidad de múltiples significados hacen que sea más fácil enfocarse en su lugar en sus sustantivos asociados, que a menudo son recursos físicos, y crear sistemas de organización que enfatizan a estos últimos más que a los primeros. Creamos sistemas de organización que se enfocan en verbos cuando estamos categorizando acciones, comportamientos o servicios donde los recursos involucrados son menos visibles o menos directamente involucrados en las interacciones soportadas.


    9. Muchas lenguas tienen un sistema de género gramatical en el que todos los sustantivos deben identificarse como masculinos o femeninos utilizando artículos definidos (el y la en español, le y la en francés, y así sucesivamente) y pronombres correspondientes. Las lenguas también contrastan en cómo describen el tiempo, las relaciones espaciales y en las que las cosas son tratadas como objetos contables (un buey, dos bueyes) a diferencia de sustancias o sustantivos masivos que no tienen distintas formas singulares y plurales (como el agua o la suciedad). (Deutscher 2011) revisa y desacredita cuidadosamente la fuerte visión whorfiana y defiende una perspectiva más matizada sobre la relatividad lingüística. También revisa gran parte del importante trabajo de Lera Boroditsky en esta área. El libro de George Lakoff con el título Mujeres, fuego y cosas peligrosas (Lakoff 1990) señala provocativamente las diferencias en las reglas de género entre las lenguas; en una lengua aborigen llamada Dyirbal muchas cosas peligrosas, incluido el fuego tienen género femenino, mientras tanto “fuego” es masculino en español (el feugo) y francés (le feu).


    10. Este análisis proviene de (Haviland 1998). Más recientemente, Lera Boroditsky ha realizado muchos estudios y experimentos interesantes sobre la relatividad lingüística. Ver (Boroditksy 2003) para un resumen académico y (Boroditsky 2010, 2011) para tratamientos más populares.


    11. (Medin et al. 1997).


    12. Esto se reflejó en última instancia en sistemas mitológicos complejos, como la mitología griega, donde las relaciones genealógicas entre dioses representaban relaciones de categoría entre los fenómenos con los que estaban asociados. A medida que el conocimiento humano crecía y las taxonomías se volvieron más completas y complejas, argumentaron Durkheim y Mauss, sentaron las bases para las clasificaciones científicas y arrojan sus raíces mitológicas. (Durkheim 1963).


    13. (Berlín 2014)


    14. Los archivos personales de personas que resultan ser famosas o importantes son la excepción que prueba esta regla. En ese caso, el sistema organizador del individuo y sus categorías se conservan junto con sus contenidos.


    15. La restricción sintáctica típica de que las etiquetas están delimitadas por espacios en blanco fomenta la creación de nuevas categorías combinando nombres de categorías existentes usando concatenación y convenciones de casos de camellos; las fotos que podrían clasificarse como “Berkeley” y “Estudiante” a veces se etiquetan como” BerkeleyEstudiante. ” Procesos generativos similares para crear nombres de categorías individuales se utilizan con los “hashtags” de Twitter donde los tweets sobre eventos a menudo se clasifican con una etiqueta ad hoc que combina un nombre de evento y un identificador de año como “#NBAFinals16.


    16. Considerar cómo la categoría cultural de “matar a una persona” es refinada por el sistema jurídico para distinguir el homicidio involuntario y los diferentes grados de asesinato en función de la cantidad de intencionalidad y planeación involucrada (por ejemplo, asesinato en primer y segundo grado) y el papel de las personas involucradas en el asesinato ( accesorio). En general, el propósito de las leyes es reemplazar los juicios groseros de categorización basados en la similitud general de hechos con una categorización basada en reglas basada en dimensiones o propiedades específicas.


    17. La palabra fue inventada en 1812 en un artículo periodístico crítico del gobernador de Massachusetts Elbridge Gerry, quien supervisó la creación de distritos electorales sesgados. Uno de esos distritos estaba tan contorsionado en forma, se decía que parecía una salamandra, y así se llamaba Gerrymander. La práctica sigue siendo generalizada, pero hoy en día sofisticados programas informáticos pueden seleccionar a los votantes en cualquier número de características y crear límites que los “embalan” en un solo distrito para concentrar su poder de voto o “romperlos” en múltiples distritos para diluirlo.


    18. Las particularidades o idiosincrasias de los sistemas de categorización individuales a veces capturan la experiencia y el conocimiento del usuario que no está representado en las categorías institucionales que los reemplazan. Muchos de los lectores de este libro son profesionales de la información cuya competencia tecnológica es central en su trabajo y que les ayuda a ser creativos. Pero para muchas otras personas, la tecnología de la información ha permitido la rutinización del trabajo en oficinas, líneas de montaje y en otros trabajos donde las nuevas categorías laborales institucionalizadas han “descalificado” o “descalificado” la naturaleza del trabajo, destruyendo la competencia y engendrando una gran trato de resistencia por parte de los trabajadores afectados.


    19. Preocupaciones técnicas similares surgen en los esfuerzos de estandarización dentro de la empresa y multi-compañía, pero el carácter competitivo y potencialmente anticompetitivo de esta última impone una mayor complejidad al introducir consideraciones de estrategia y política empresarial. La creación de estándares creíbles en contextos multicompañía depende de un proceso explícito y transparente para recopilar y priorizar requisitos, negociar especificaciones que los satisfagan y garantizar implementaciones conformes, sin que en ningún momento le dé ventaja a ninguna empresa participante. Consulte el Proceso del Comité Técnico de OASIS para un ejemplo (https://www.oasis-open.org/policies-guidelines/tc-process) y (Rosenthal et al. 2004) para un análisis de las mejores prácticas.


    20. Desafortunadamente, en esta transición de la ciencia a la cultura popular, muchas de estas llamadas tablas periódicas son solo colecciones ad hoc que ignoran la idea esencial de que las filas y columnas capturan principios explicativos sobre las propiedades de los recursos que varían de manera periódica. Una excepción notable es la Tabla Periódica de Postres de Andrew Plotkin. Véase (Suehle 2012) y la mesa de Plotkin en (Tabla Periódica de Postre).


    21. Los estándares Corporate Average Fuel Economy (CAFE) han sido desarrollados por la Administración Nacional de Seguridad del Tráfico en Carreteras de Estados Unidos (http://www.nhtsa.gov/fuel-economy) desde 1975. Para una evaluación cuidadosa y crítica del informe 2002 del Comité de Efectividad e Impacto de las Normas Corporativas de Economía Promedio de Combustible (CAFE), Consejo Nacional de Investigaciones.



    This page titled 7.2: El qué y el por qué de las categorías is shared under a not declared license and was authored, remixed, and/or curated by Robert J. Glushko.