Saltar al contenido principal
LibreTexts Español

7.3: Principios para crear categorías

  • Page ID
    98031
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    “El qué y el por qué de las categorías” explicó qué son las categorías y los contextos y propósitos culturales, individuales e institucionales contrastantes para los que se crean las categorías. Al hacerlo, se mencionaron varios principios diferentes para crear categorías, la mayoría de pasada.

    Ahora analizamos sistemáticamente los principios para crear categorías, incluyendo enumeración, propiedades individuales, múltiples propiedades y jerarquía, probabilística, similitud y categorización basada en teoría y objetivos. Estas formas de crear categorías difieren en la información y los mecanismos que utilizan para determinar la pertenencia a categorías.

    Enumeración

    El principio más simple para crear una categoría es la enumeración; cualquier recurso en un conjunto finito o contable puede considerarse miembro de categoría solo por ese hecho. Este principio también se conoce como definición extensional, y los miembros del conjunto se llaman la extensión. Muchas categorías institucionales se definen por enumeración como un conjunto de valores posibles o legales, como los 50 Estados Unidos o los códigos de moneda ISO (ISO 4217).

    Las categorías enumerativas permiten que la membresía se determine sin ambigüedades porque un valor como el nombre de un estado o el código de moneda es miembro de la categoría o no lo es. No obstante, esta claridad tiene un inconveniente; hace difícil argumentar que algo que no se menciona explícitamente en una enumeración debe ser considerado miembro de la categoría, lo que puede hacer inflexibles las leyes o reglamentos. Además, viene un tamaño cuando la definición enumerativa es poco práctica o ineficiente, y la categoría o bien debe subdividirse o bien darse una definición basada en principios distintos a la enumeración. [1]

    Por ejemplo, desde hace milenios los terrícolas hemos tenido una categoría cultural de “planeta” como objeto celeste “errante”, y debido a que solo conocíamos planetas en nuestro propio sistema solar, la categoría de planeta se definió por enumeración: Mercurio, Venus, Tierra, Marte, Júpiter y Saturno. Cuando los planetas exteriores de Urano, Neptuno y Plutón fueron identificados como planetas en los siglos 18-20, se agregaron a esta lista de planetas sin ningún cambio en la categoría cultural. Pero en las últimas dos décadas se han detectado muchos planetas desconocidos hasta ahora fuera de nuestro sistema solar, haciendo que el conjunto de planetas sea ilimitado, y la definición por enumeración ya no funciona.

    La Unión Astronómica Internacional (IAU) pensó que resolvió esta crisis de categoría al proponer una definición de planeta como “un cuerpo celeste que está (a) en órbita alrededor de una estrella, (b) tiene suficiente masa para que su autogravedad supere las fuerzas corporales rígidas de manera que asume una forma de equilibrio hidrostático (casi redondo), y c) ha despejado el vecindario alrededor de su órbita. ” Desafortunadamente, Plutón no satisface el tercer requisito, por lo que ya no es miembro de la categoría planeta, y en cambio ahora se le llama un “planeta inferior.

    Cambiar la definición de una categoría cultural significativa generó mucha controversia y angustia entre la gente común y corriente no científica. Un titular típico era “La degradación de Plutón tiene escuelas dando vueltas”, describiendo el clamor de los estudiantes de primaria y maestros sobre la injusticia que se le hizo a Plutón y la interrupción en el plan de estudios. [2]

    Propiedades Individuales

    Es intuitivo y útil pensar en términos de propiedades cuando identificamos instancias y cuando estamos describiendo instancias (como vimos en “Identidad de recursos” y en Descripción de recursos y metadatos). Por lo tanto, también debe ser intuitivo y útil considerar propiedades cuando analizamos más de una instancia para compararlas y contrastarlas para poder determinar qué conjuntos de instancias pueden tratarse como una categoría o clase de equivalencia. Las categorías cuyos miembros están determinados por una o más propiedades o reglas siguen el principio de definición intensional, y las propiedades definitorias se denominan intensión.

    Podría estar pensando aquí que la enumeración o definición extensional de una categoría también es una prueba de propiedad; ¿no es “ser un estado” una propiedad de California? Pero la estadidad no es una propiedad precisamente porque “estado” se define por extensión, lo que significa que la única manera de probar la estadidad de California es ver si está en la lista de estados. [3]

    Cualquier propiedad individual de un recurso se puede usar para crear categorías, y las más fáciles de usar suelen ser las propiedades estáticas intrínsecas. Como discutimos en Descripción del recurso y Metadatos, las propiedades estáticas intrínsecas son aquellas inherentes a un recurso que nunca cambia. El material de composición de objetos naturales o manufacturados es una propiedad intrínseca y estática que puede ser utilizada para disponer los recursos físicos. Por ejemplo, un sistema de organización para una colección personal de música que se basa en la propiedad estática intrínseca del formato físico podría usar categorías para CD, DVD, álbumes de vinilo, cartuchos de 8 pistas, cinta de carrete a carrete y casetes de cinta. [4]

    El uso de una sola propiedad es más natural cuando las propiedades pueden tomar solo un pequeño conjunto de valores discretos como formatos de música, y especialmente cuando la propiedad está estrechamente relacionada con la forma en que se utilizan los recursos, como lo son con la colección de música donde cada formato requiere diferentes equipos para escuchar la música. Cada valor se convierte entonces en una subcategoría de la categoría musical.

    El autor, la fecha y el lugar donde se creó un recurso intelectual no pueden percibirse directamente, sino que también son propiedades estáticas intrínsecas. El tema o propósito de un recurso, su “de qué se trata” o “para qué era originalmente”, también son propiedades estáticas intrínsecas que no son directamente perceptibles, especialmente para los recursos de información.

    El nombre o identificador de un recurso suele ser arbitrario pero una vez asignado normalmente no cambia, convirtiéndolo en una propiedad estática extrínseca. Cualquier colección de recursos con identificadores alfabéticos o numéricos como propiedad asociada puede utilizar el orden de clasificación como principio organizador para organizar especias, libros, registros de personal, etc., de una manera completamente confiable. Algunos podrían argumentar si este principio organizador crea un sistema de categorías, o si simplemente explota el orden inherente a la notación del identificador. Por ejemplo, con los identificadores alfabéticos, podemos pensar en el orden alfabético como la creación de un sistema de categorías recursivo con 26 categorías de nivel superior (A-Z), cada una conteniendo el mismo número de categorías de segundo nivel, y así sucesivamente hasta que cada instancia sea asignada a su lugar apropiado. [5]

    Algunas propiedades de recursos son tanto extrínsecas como dinámicas porque se basan en el uso o comportamientos que pueden ser altamente dependientes del contexto. El actual propietario o ubicación de un recurso, su frecuencia de acceso, la frecuencia conjunta de acceso con otros recursos, o su calificación o preferencia actual con respecto a recursos alternativos son propiedades típicas extrínsecas y dinámicas que pueden ser la base para ordenar los recursos y definir categorías.

    Estas propiedades pueden tener una gran cantidad de valores o ser medidas continuas, pero siempre que existan reglas explícitas para usar valores de propiedad para determinar la asignación de categorías, las categorías resultantes siguen siendo fáciles de entender y usar. Por ejemplo, naturalmente categorizamos a las personas que conocemos en base a su profesión actual, la ciudad donde viven, sus pasatiempos o su edad. Las propiedades con una dimensión numérica como “frecuencia de uso” a menudo se transforman en un pequeño conjunto de categorías como “usado frecuentemente”,usado ocasionalmente” y “raramente usado” en función de los valores numéricos de las propiedades. [6]

    Existe un número infinito de propiedades lógicamente expresables para cualquier recurso, pero la mayoría de ellas no conducirían a categorías que serían interpretables y útiles para las personas. Si las personas van a utilizar las categorías, es importante basarlas en propiedades que sean psicológicamente o pragmáticamente relevantes para el dominio de recursos que se está categorizando. Si algo pesa más o menos de 5000 libras es una propiedad pobre para aplicar a las cosas en general, porque pone gatos y sillas en una categoría, y autobuses y elefantes en otra. [7]

    Para resumir: Las propiedades individuales más útiles para usar para crear categorías para un sistema de organización utilizado por las personas son aquellas que están formalmente asignadas, objetivamente medibles y ordenables, o vinculadas a categorías culturales bien establecidas, porque las categorías resultantes serán más fáciles de comprender y describir.

    Si solo se usa una sola propiedad para distinguir entre algún conjunto de recursos y para crear las categorías en un sistema de organización, la elección de la propiedad es crítica porque diferentes propiedades a menudo conducen a diferentes categorías. Al usar la propiedad de la edad, es poco probable que Bill Gates y Mark Zuckerberg terminen en la misma categoría de personas. Usando la propiedad patrimonial, sin duda lo harían. Además, si solo se usa una propiedad para crear un sistema de categorías, cualquier categoría con un gran número de elementos en ella carecerá de coherencia porque las diferencias en otras propiedades serán demasiado evidentes, y algunos miembros de categoría no encajarán tan bien como los demás.

    Propiedades múltiples

    Los sistemas de organización suelen utilizar múltiples propiedades para definir categorías. Hay tres formas diferentes en las que hacer esto que difieren en el alcance de los inmuebles y lo esenciales que son para definir las categorías.

    Categorías multinivel o jerárquicas

    Si tienes muchas camisas en tu armario (y eres un poco compulsivo o un “fanático limpio”), en lugar de simplemente separar tus camisas de tus pantalones usando una sola propiedad (la parte del cuerpo en la que se usa la ropa) podrías arreglar las camisas por estilo, y luego por la longitud de la manga, y finalmente por color. Cuando todos los recursos de un sistema de organización se organizan usando la misma secuencia de propiedades de recursos, esto crea una jerarquía lógica, un sistema de categorías multinivel.

    Si tratamos todas las camisas como la colección que se está organizando, en el sistema de organización de camisas la amplia categoría de camisas se divide primero por estilo en categorías como “camisas de vestir”,camisas de trabajo”,camisas de fiesta” y “atléticas o sudaderas. ” Cada una de estas categorías de estilo se divide aún más hasta que las categorías son muy estrechas, como la categoría “camisas de vestir de manga larga blancas”. Una playera en particular termina en esta última categoría sólo después de pasar una serie de pruebas de propiedad en el camino: es una camisa de vestir, tiene mangas largas, y es blanca. Cada prueba crea categorías más precisas en las intersecciones de las categorías cuyos miembros pasaron las pruebas de propiedad anteriores.

    Dicho de otra manera, cada subdivisión de una categoría se lleva a cabo cuando identificamos o elegimos una propiedad que diferencia a los miembros de la categoría de una manera que es importante o útil para alguna intención o propósito. Las camisas difieren de los pantalones en el valor de la propiedad de “parte del cuerpo”, y todas las subcategorías de playeras comparten este valor de “parte superior” de esa propiedad. No obstante, las camisas difieren en otras propiedades que determinan la subcategoría a la que pertenecen. Aun cuando prestamos atención a estas propiedades diferenciadoras, es importante recordar las otras propiedades, las que los miembros de una categoría en cualquier nivel de la jerarquía tienen en común con los miembros de las categorías que la contienen. Estas propiedades a menudo se describen como “heredadas” o “inferidas” de la categoría más amplia. [8] Por ejemplo, así como cada camisa comparte la propiedad “usada en la parte superior del cuerpo”, cada prenda de vestir comparte la propiedad de “se puede usar en el cuerpo”, y cada recurso en la categoría “camisas” y “pantalones” hereda esa propiedad.

    Cada propiedad diferenciadora crea otro nivel en la jerarquía de categorías, lo que plantea una pregunta obvia: ¿Cuántas propiedades y niveles necesitamos? Para poder responder a esta pregunta, debemos reflexionar sobre las categorías de playeras en nuestro armario. Nuestro sistema de organización para camisas las arregla con las tres propiedades de estilo, longitud de manga y color; algunas de las categorías en el nivel más bajo de la jerarquía resultante pueden tener solo un miembro, o ningún miembro en absoluto. Es posible que tengas camisas de fiesta de manga corta amarillas o rojas, pero probablemente no tengas camisas de vestir de manga larga amarillas o rojas, haciéndolas categorías vacías. Obviamente, cualquier categoría con un solo miembro no necesita ninguna propiedad adicional para distinguir a los miembros, por lo que una jerarquía de categorías está lógicamente completa si cada recurso está en una categoría por sí mismo.

    Sin embargo, incluso cuando las categorías de nivel más bajo de nuestro sistema de organización de camisetas tienen más de un miembro, podríamos optar por no usar propiedades adicionales para subdividirlo porque las diferencias que quedan entre los miembros no nos importan para las interacciones que el sistema organizador necesita apoyar. Supongamos que tenemos dos camisas de vestir blancas de manga larga de diferentes fabricantes de camisas, pero siempre que necesitemos usar una de ellas, ignoramos esta propiedad. En cambio, solo elegimos una u otra, tratando las camisas como completamente equivalentes o sustituibles. Cuando las diferencias restantes entre miembros de una categoría no hacen diferencia para los usuarios de la categoría, podemos decir que el sistema de organización está pragmática o prácticamente completo aunque todavía no esté lógicamente completo. Es decir, está completo “para todos los efectos y propósitos. ” En efecto, podríamos argumentar que es deseable dejar de subdividir un sistema de categorías mientras quedan algunas pequeñas diferencias entre los ítems de cada categoría porque esto deja cierta flexibilidad o espacio lógico en el que organizar nuevos ítems. Este punto podría recordarle el concepto de sobreajuste, donde los modelos con muchos parámetros pueden ajustarse con mucha precisión a sus datos de entrenamiento, pero como resultado generalizar menos bien a nuevos datos. (Ver “Descripción del recurso para Sensemaking y Ciencia”.)

    Por otro lado, considera la sección playera de una gran tienda departamental. Las camisas allí podrían estar organizadas por estilo, longitud de manga y color tal como están en nuestro armario de casa, pero sin duda serían organizadas aún más por el fabricante de camisas y por talla para permitir que un comprador encuentre una camisa de vestir azul de manga larga Marc Jacobs de talla 15/35. El sistema de organización de tiendas departamentales necesita más propiedades y una jerarquía más profunda para el dominio de camisas porque tiene un número mucho mayor de instancias de camisa para organizar y porque necesita apoyar a muchos compradores de camisas, no solo a una persona cuyas camisas son todas de la misma talla.

    Diferentes propiedades para subconjuntos de recursos

    Una forma diferente de usar múltiples propiedades de recursos para crear categorías en un sistema de organización es emplear diferentes propiedades para distintos subconjuntos de los recursos que se están organizando. Esto contrasta con el estricto enfoque multinivel en el que cada recurso es evaluado con respecto a cada propiedad. Alternativamente, podríamos ver este principio como una forma de organizar múltiples dominios que son conceptualmente o físicamente adyacentes, cada uno de los cuales tiene un conjunto separado de categorías en función de las propiedades de los recursos en ese dominio. Este principio es utilizado para la mayoría de las estructuras de carpetas en los sistemas de archivos informáticos y por muchas aplicaciones de correo electrónico; puedes crear tantas categorías de carpetas como quieras, pero cualquier recurso solo se puede colocar en una carpeta.

    Los contrastes entre las propiedades intrínsecas y extrínsecas, y entre las estáticas y las dinámicas, son útiles para explicar este método de creación de categorías organizativas. Por ejemplo, podrías organizar toda tu ropa usando propiedades estáticas intrínsecas si mantienes tus camisas, calcetines y suéteres en diferentes cajones y los arreglas por color; propiedades estáticas extrínsecas si compartes tu armario de entrada con un compañero de cuarto, para que cada uno use solo un lado de ese espacio de clóset; propiedades dinámicas intrínsecas si arreglas tu ropa para un fácil acceso según la temporada; y, propiedades dinámicas extrínsecas si mantienes tu chaqueta y sombrero de uso más frecuente en un gancho junto a la puerta principal. [9]

    Si relajamos el requisito de que diferentes subconjuntos de recursos usen diferentes propiedades de organización y permitimos que cualquier propiedad se use para describir cualquier recurso, el principio de organización suelta que ahora tenemos a menudo se llama etiquetado. Usar cualquier propiedad de un recurso para crear una descripción es un principio incontrolado y a menudo sin principios para crear categorías, pero es cada vez más popular para organizar fotos, sitios web, mensajes de correo electrónico en gmail u otros recursos basados en la web. Discutimos el etiquetado con más detalle en “Etiquetado de recursos basados en la web”.

    Propiedades necesarias y suficientes

    Un gran conjunto de recursos no siempre requiere de muchas propiedades y categorías para organizarlo. Algunos tipos de categorías se pueden definir con precisión con solo unas pocas propiedades esenciales. Por ejemplo, un número primo es un entero positivo que no tiene divisores que no sean 1 y sí mismo, y esta definición de categoría distingue perfectamente los números primos y no primos sin importar cuántos números se estén categorizando. “Entero positivo” y “divisible solo por 1 y por sí mismo” son propiedades necesarias o definitivas para la categoría de número primo; cada número primo debe satisfacer estas propiedades. Estas propiedades también son suficientes para establecer membresía en la categoría de números primos; cualquier número que satisfaga las propiedades necesarias es un número primo. Las categorías definidas por propiedades necesarias y suficientes también se denominan monotéticas. También a veces se les llama categorías clásicas porque se ajustan a la teoría de Aristóteles de cómo se usan las categorías en la deducción lógica usando silogismos. [10] (Ver la barra lateral, La Vista Clásica de Categorías.)

    Las teorías de categorización han evolucionado mucho desde que Platón y Aristóteles las propusieron hace más de dos mil años, pero de muchas maneras todavía nos adherimos a las visiones clásicas de las categorías cuando creamos sistemas de organización porque pueden ser más fáciles de implementar y mantener de esa manera.

    Una implicación importante de la definición de categoría necesaria y suficiente es que cada miembro de la categoría es un miembro igualmente bueno o ejemplo de la categoría; cada número primo es igualmente primo. Los sistemas de categorías institucionales a menudo emplean propiedades necesarias y suficientes para su simplicidad conceptual e implementación directa en árboles de decisión, esquemas de bases de datos y clases de lenguaje de programación.

    Considere la definición de una dirección como que requiere una calle, ciudad, región gubernamental y código postal. Cualquier cosa que tenga todos estos componentes de información se considera, por lo tanto, una dirección válida, y cualquier cosa que carezca de alguno de ellos no se considerará una dirección válida. Si refinamos las propiedades de una dirección para exigir que la región gubernamental sea un estado, y específicamente uno de la lista de códigos oficiales de estado y territorio del Servicio Postal de los Estados Unidos, creamos una subcategoría para direcciones estadounidenses que utiliza una categoría enumerada como parte de su definición. De igual manera, podríamos crear una subcategoría para las direcciones canadienses intercambiando el nombre “provincia” por estado, y usando una lista enumerada de códigos de provincia y territorio canadienses.

    Los límites de la categorización basada en propiedades

    La categorización basada en propiedades funciona tautológicamente bien para categorías como “número primo” donde la categoría se define por propiedades necesarias y suficientes. La categorización basada en propiedades también funciona bien cuando las propiedades son conceptualmente distintas y el valor de una propiedad es fácil de percibir y examinar, ya que lo son con recursos físicos hechos por el hombre como camisas.

    La experiencia histórica con la organización de sistemas que necesitan categorizar los recursos de información ha demostrado que basar categorías en propiedades fácilmente percibidas a menudo no es efectivo. Puede haber indicaciones “en la superficie” que sugieran las “uniones” o límites entre tipos de recursos de información, pero estas suelen ser solo opciones de presentación o empaque, es decir, ni el tamaño de un libro ni el color de su portada son señales confiables para lo que contiene. Los recursos de información tienen numerosas propiedades descriptivas como su título, autor y editor que se pueden utilizar de manera más efectiva para definir categorías, y éstas son ciertamente útiles para algunos tipos de interacciones, como encontrar todos los libros escritos por un autor en particular o publicados por la misma editorial. Sin embargo, para fines prácticos, la propiedad más útil de un recurso de información es su torno, que puede no ser objetivamente perceptible y que ciertamente es difícil de caracterizar. [11] Cualquier recopilación de recursos de información en una biblioteca o sistema de archivo de documentos probablemente sea sobre muchos temas y temas, y cuando un recurso individual se categoriza de acuerdo con un número limitado de sus propiedades de contenido, al mismo tiempo no se categoriza utilizando el otros.

    Cuando comenzó la web, hubo muchos intentos de crear categorías de sitios web, sobre todo por Yahoo! A medida que la web crecía, se hizo evidente que los motores de búsqueda serían mucho más útiles porque sus índices de texto casi en tiempo real obvian la necesidad de asignar a priori páginas web a categorías. Más bien, los motores de búsqueda web representan cada página web o documento de una manera que trata cada palabra o término que contienen como una propiedad separada.

    Considerando cada palabra distinta en un documento estira nuestra noción de propiedad para hacerla muy diferente de los tipos de propiedades que hemos discutido hasta ahora, donde las propiedades estaban siendo utilizadas explícitamente por la gente para tomar decisiones sobre la membresía de categorías y la organización de recursos. Simplemente no es posible que las personas presten atención a más de unas pocas propiedades al mismo tiempo aunque quieran, porque así es como funciona la maquinaria perceptual y cognitiva humana. Pero las computadoras no tienen tales limitaciones, y los algoritmos para la recuperación de información y el aprendizaje automático pueden utilizar un gran número de propiedades, como veremos más adelante en este capítulo y en Clasificación: Asignación de recursos a categorías e interacciones con recursos.

    Categorías probabilísticas y “semejanza familiar

    Como hemos visto, algunas categorías pueden definirse con precisión utilizando características necesarias y suficientes, especialmente cuando las propiedades que determinan la pertenencia a la categoría son fáciles de observar y evaluar. Algo es o un número primo o no lo es Una persona no puede ser un estudiante registrado y no registrado al mismo tiempo.

    Sin embargo, la categorización basada en la consideración explícita y lógica de las propiedades es mucho menos efectiva, y a veces ni siquiera es posible para dominios donde las propiedades carecen de una o más de las características de separabilidad, perceptibilidad y necesidad. En cambio, necesitamos categorizar usando propiedades de manera probabilística o estadística para llegar a alguna medida de semejanza o similitud entre el recurso a categorizar y los demás miembros de la categoría.

    Considera una categoría familiar como “pájaro. ” Todas las aves tienen plumas, alas, picos y dos patas. Pero hay miles de tipos de aves, y se distinguen por propiedades que algunas aves tienen que otras carecen: la mayoría de las aves pueden volar, la mayoría están activas durante el día, algunas nadan, algunas nadan bajo el agua; algunas tienen pies palmeados. Estas propiedades están correlacionadas o agrupadas, consecuencia de la selección natural que transmite ventajas a configuraciones particulares de características, y hay muchos racimos diferentes; las aves que viven en árboles tienen alas y pies diferentes a las que nadan, y las aves que viven en desiertos tienen diferentes coloraciones y metabolismos que los que viven cerca del agua. Entonces, en lugar de definirse por un solo conjunto de propiedades que son a la vez necesarias y suficientes, la categoría ave se define probabilísticamente, lo que significa que las decisiones sobre la pertenencia a la categoría se toman acumulando evidencia de las propiedades que son más o menos características de la categoría.

    Las categorías de recursos de información suelen tener el mismo carácter probabilístico. La categoría de mensajes spam es sugerida por la presencia de palabras particulares (beneficiario, farmacéutico) pero estas palabras también ocurren en mensajes que no son spam. Un clasificador de spam utiliza las probabilidades de cada palabra en un mensaje en contextos de spam y no spam para calcular una probabilidad general de que el mensaje sea spam.

    Hay tres consecuencias relacionadas para las categorías cuando sus propiedades características tienen una distribución probabilística:

    • El primero es un efecto de tipicidad o centralidad que hace que algunos miembros de la categoría sean mejores ejemplos que otros. La pertenencia a categorías probabilísticas no es total o nula, por lo que aunque compartan muchas propiedades, una instancia que tenga más de las propiedades características será juzgada como mejor o más típica. [12] Intenta definir “pájaro” y luego pregúntate si todas las cosas que clasificas como aves son igualmente buenos ejemplos de la categoría (mira las seis aves en Parejanza familiar y Tipicalidad). Este efecto también se describe como gradiencia en la pertenencia a categorías y refleja la medida en que se comparten las propiedades más características.

    • Una segunda consecuencia es que el compartir algunas pero no todas las propiedades crea lo que llamamos semejanzas familiares entre los miembros de la categoría; así como los miembros biológicos de la familia no necesariamente comparten un solo conjunto de características físicas sino que siguen siendo reconocibles como miembros de una misma familia. Esta idea fue propuesta por primera vez por el filósofo del siglo XX Ludwig Wittgenstein, quien utilizó los “juegos” como ejemplo de una categoría cuyos miembros se asemejan entre sí según subconjuntos de propiedades cambiantes. [13]

    • La tercera consecuencia, cuando las categorías no tienen características necesarias para la membresía, es que los límites de la categoría no son fijos; la categoría se puede estirar y asignar nuevos miembros siempre que se asemejen a miembros titulares. Los videojuegos personales y los juegos online multijugador como World of Warcraft no existían en la época de Wittgenstein pero no tenemos problemas para reconocerlos como juegos y tampoco Wittgenstein, si estuviera vivo. Recordemos que en Fundamentos para Sistemas Organizadores señalamos que la categoría cultural de “biblioteca” ha sido extendida repetidamente por nuevas propiedades, como cuando Flickr se describe como una biblioteca basada en la web para compartir fotos. Las categorías definidas por semejanza de familia o conjuntos de propiedades múltiples y cambiantes se denominan politéticas.

    Concluimos que en lugar de usar propiedades una a la vez para asignar membresía a categorías, podemos usarlas de manera compuesta o integrada donde juntas un conjunto de propiedades concurrentes proporciona evidencia que contribuye a un cálculo de similitud. Algo se clasifica como A y no como B si es más similar al miembro mejor o más típico de A que lo es a los B [16].

    Similaridad

    La similitud es una medida del parecido entre dos cosas que comparten algunas características pero no son idénticas. Se trata de una noción muy flexible cuyo significado depende del dominio dentro del cual la aplicamos. Algunas personas consideran que el concepto de similitud en sí mismo carece de sentido porque siempre debe haber alguna base, algún conjunto no declarado de propiedades, para determinar si dos cosas son similares. Si pudiéramos identificar esas propiedades y cómo se utilizan, no habría ningún trabajo para que se hiciera un mecanismo de similitud. [17]

    Para que la similitud sea un mecanismo útil para la categorización tenemos que especificar cómo se determina la medida de similitud. Hay cuatro enfoques motivados psicológicamente que proponen diferentes funciones para la similitud computacional: basado en características o propiedades, basado en geometría, transformacional y basado en alineación o analogía. El gran contraste aquí es entre los modelos que representan elementos como conjuntos de propiedades o entidades conceptuales discretas, y aquellos que asumen que las propiedades varían en un espacio métrico continuo. [18]

    Modelos de similitud basados en características

    Un modelo influyente de cálculo de similitud basado en características es el modelo de contraste de Amos Tversky, que coincide con las características o propiedades de dos cosas y calcula una medida de similitud de acuerdo con tres conjuntos de características:

    • esas características que comparten,

    • aquellas características que el primero tiene que el segundo carece, y

    • esas características que tiene el segundo que le falta al primero.

    La similitud basada en las características compartidas se reduce por los dos conjuntos de características distintivas. Los pesos asignados a cada conjunto se pueden ajustar para explicar los juicios de pertenencia a categorías. Otra medida de similitud comúnmente basada en características es el coeficiente de Jaccard, la relación entre las características comunes y el número total de ellas. Este cálculo simple equivale a cero si no hay entidades superpuestas y uno si todas las entidades se superponen. La medida de Jaccard se usa a menudo para calcular la similitud de documentos tratando cada palabra como una característica. [19]

    A menudo usamos una versión heurística del cálculo de similitud basado en características cuando creamos sistemas de categorías multinivel o jerárquicas para garantizar que las categorías en cada nivel estén en el mismo nivel de abstracción o amplitud. Por ejemplo, si estuviéramos organizando una colección de instrumentos musicales, no parecería correcto tener subcategorías de “instrumentos de viento de madera”,violines” y “violonchelos” porque la similitud basada en características entre las categorías no es la misma para todos los pares comparaciones entre las categorías; los violines y violonchelos son simplemente demasiado similares entre sí para ser categorías separadas dadas los instrumentos de viento de madera como categoría.

    Modelos geométricos de similitud

    Los modelos geométricos son un tipo de marco de similitud en el que los elementos cuyos valores de propiedad son métricos se representan como puntos en un espacio de características o propiedades multidimensional. Los valores de propiedad son las coordenadas, y la similitud se calcula midiendo la distancia entre los ítems.

    Las funciones de similitud geométrica son comúnmente utilizadas por los motores de búsqueda; si una consulta y un documento se representan cada uno como un vector de términos de búsqueda, la relevancia está determinada por la distancia entre los vectores en el “espacio de términos”. ” El diagrama simplificado en la barra lateral, Similaridad de documentos, representa cuatro documentos cuyas ubicaciones en el espacio de términos están determinadas por cuántos de cada uno de los tres términos contienen. Los vectores de documento se normalizan a la longitud 1, lo que permite utilizar el coseno del ángulo entre dos documentos cualesquiera como medida de su similitud. Los documentos d1 y d2 son más similares entre sí que los documentos d3 y d4, porque el ángulo entre el primer par (θ) es menor que el ángulo entre el segundo (Φ). Discutiremos cómo funciona esto con mayor detalle en Interacciones con Recursos.

    Si los vectores que representan elementos en un espacio de propiedad multidimensional son de diferentes longitudes, en lugar de calcular la similitud usando cosenos necesitamos calcular la similitud de una manera que considere más explícitamente las diferencias en cada dimensión.

    El diagrama en la barra lateral, Funciones de distancia geométrica muestra dos formas diferentes de calcular la distancia entre los puntos 1 y 2 usando las diferencias A y B. La función distancia euclidiana toma la raíz cuadrada de la suma de las diferencias cuadradas en cada dimensión; en dos dimensiones, esta es la familiar Teorema de Pitágoras para calcular la longitud de la hipotenusa de un triángulo rectángulo, donde el exponente aplicado a las diferencias es 2. En contraste, la función de distancia de bloque de ciudad, llamada así porque es la forma natural de medir distancias en ciudades con planos de calles “en forma de cuadrícula”, simplemente suma las diferencias en cada dimensión, lo que equivale a un exponente de 1.

    Podemos interpretar el exponente como una función de ponderación que determina la contribución relativa de cada propiedad al cálculo general de la distancia o similitud. La elección del exponente depende del tipo de propiedades que caracterizan a un dominio y de cómo las personas hacen juicios de categoría dentro de él. El exponente de 1 en la función City Block asegura que cada propiedad aporte su monto total. A medida que el exponente crece, magnifica el impacto de las propiedades sobre las que las diferencias son las mayores.

    La función Chebyshev lleva esto al límite (donde el exponente sería infinito) y define la distancia entre dos elementos como la diferencia de sus valores en la propiedad individual con la mayor diferencia. Lo que esto significa en la práctica es que dos elementos podrían tener valores similares o incluso idénticos en la mayoría de las propiedades, pero si difieren mucho en una sola propiedad, serán tratados como muy disímiles. Podemos hacer una analogía con los estereotipos o prejuicios cuando una persona es igual que tú en todos los sentidos excepto por la única propiedad que consideras negativa, que luego se convierte en la única que te importa.

    En el otro extremo, si el exponente se reduce a cero, éste trata cada propiedad como binaria, ya sea presente o ausente, y la función distance se convierte en un recuento del número de veces que el valor de la propiedad para un elemento es diferente del valor para el otro. A esto se le llama la “distancia Hamming.

    Modelos transformacionales de similitud

    Los modelos transformacionales asumen que la similitud entre dos cosas es inversamente proporcional a la complejidad de la transformación requerida para convertir una en otra. El modelo transformacional más simple de similitud cuenta el número de propiedades que necesitarían cambiar sus valores. De manera más general, una forma de realizar la tarea de coincidencia de nombres de determinar cuándo dos cadenas diferentes denotan a la misma persona, objeto u otra entidad nombrada es calcular la “distancia de edición” entre ellas; el número de cambios requeridos para transformar uno en otro.

    El cálculo más simple solo cuenta el número de operaciones de inserción, eliminación y sustitución y se llama distancia Levenshtein; por ejemplo, la distancia entre “bob” y “libro” es dos: insertar “o” y cambiar la segunda “b” a “k”. Dos cadenas con una distancia de edición corta pueden ser variantes ortográficas o errores ortográficos del mismo nombre, y los modelos transformacionales que son sensibles a errores comunes de mecanografía como letras transpuestas o duplicadas son muy efectivos en la corrección ortográfica. Los modelos transformacionales de similitud también se utilizan comúnmente para detectar plagio y duplicar páginas web. [20]

    Modelos de similitud de alineación o analogía

    Ninguno de los tipos anteriores de modelos de similitud funciona muy bien al comparar cosas que tienen mucha estructura interna o relacional. En estos casos, los cálculos basados en entidades coincidentes son insuficientes; es necesario comparar las entidades que se alinean porque tienen el mismo papel en estructuras o relaciones. Por ejemplo, un automóvil con rueda verde y un camión con capucha verde comparten la característica verde, pero esta característica coincidente no aumenta mucho su similitud porque la rueda del automóvil no se alinea con el capó del camión. Por otro lado, la analogía nos permite decir que un átomo es como el sistema solar. No tienen propiedades comunes, pero comparten la relación de tener objetos más pequeños que giran alrededor de uno grande.

    Este tipo de comparación analógica es especialmente importante en la resolución de problemas. Se podría pensar que los expertos son buenos para resolver problemas en su dominio de especialización porque han organizado sus conocimientos y experiencia de manera que permiten la búsqueda y evaluación eficiente de posibles soluciones. Por ejemplo, es bien sabido que los maestros de ajedrez buscan sus recuerdos de posiciones ganadoras anteriores y los movimientos asociados para decidir qué jugar. Sin embargo, los mejores jugadores de ajedrez también organizan sus conocimientos y seleccionan movimientos sobre la base de similitudes abstractas que no pueden explicarse en términos de posiciones específicas de piezas de ajedrez. Esta idea de que los expertos representan y resuelven problemas a niveles más profundos que los novatos mediante el uso de principios más abstractos o estructura de dominio se ha replicado en muchas áreas. Los principiantes tienden a centrarse más en las propiedades de la superficie y se basan más en la similitud literal. [21]

    Categorías Derivadas de Objetivos

    Otro principio psicológico para crear categorías es organizar recursos que vayan de la mano para satisfacer una meta. Considera la categoría “Cosas a tomar de una casa en llamas”, un ejemplo que el científico cognitivo Lawrence BarSalou calificó una categoría ad hoc o derivada de objetivos. [22]

    ¿Qué cosas tomarías de tu casa si un incendio lo amenazara?? Posiblemente tu gato, tu billetera y chequera, papeles importantes como certificados de nacimiento y pasaportes, y el viejo álbum de fotos de la abuela, y cualquier otra cosa que creas que es importante, invaluable o irremplazable, siempre y cuando puedas llevarlo. Estos artículos no tienen propiedades discernibles en común, salvo por ser tus posesiones más preciadas. La categoría es derivada o inducida por un objetivo particular en algún contexto específico.

    Categorías basadas en teoría

    Un principio psicológico final para crear categorías es organizar las cosas de manera que se ajusten a una teoría o historia que haga que una categorización particular sea sensata. Una categoría basada en la teoría puede ganar incluso si la categorización probabilística, sobre la base del parecido familiar o similitud con respecto a las propiedades visibles, conduciría a una asignación de categoría diferente. Por ejemplo, una teoría del cambio de fase explica por qué el agua líquida, el hielo y el vapor son todos el mismo compuesto químico a pesar de que comparten pocas propiedades visibles.

    Las categorías basadas en teoría basadas en el origen o la causalidad son especialmente importantes con recursos altamente inventivos y computacionales porque a diferencia de los tipos naturales de recursos físicos, poco o nada de lo que pueden hacer o cómo se comportan es visible en la superficie (ver “Aprovidencia y capacidad”). Consideremos todas las diferentes apariencias y factores de forma de los recursos que categorizamos como “computadoras—su esencia es que todas computan, un principio invisible o teorístico que no depende de sus propiedades visibles. [23]


    1. Las controversias jurídicas suelen reflejar diferentes interpretaciones de la pertenencia a la categoría y si una lista de miembros de la categoría es exhaustiva o meramente ilustrativa. El principio jurídico de “exclusión implícita—expressio unius est exclusio alterius — dice que si “nombra expresamente” o “designa” una enumeración de una o varias cosas, se excluye, por implicación, cualquier cosa que no sea nombrada. Sin embargo, el prefacio de la lista con “como”, “incluyendo” o “me gusta” implica que no es una enumeración estricta porque podría haber otros miembros.


    2. La Unión Astronómica Internacional (IAU) (iau.org) publicó su nueva definición de planeta en agosto de 2006. Un documental de televisión pública en 2011 llamado The Pluto Files vuelve a contar la historia (Tyson 2011).


    3. La distinción entre intención y extensión fue introducida por Gottlob Frege, filósofo y matemático alemán (Frege 1892).


    4. El número de recursos en cada una de estas categorías depende de la edad de la colección y del coleccionista. Podríamos ser más precisos aquí y decir “propiedad atómica única” o de otra manera definir más cuidadosamente “propiedad” en este contexto como una característica que es básica y no fácil o naturalmente descomponible en otras características. Sería posible analizar el formato físico de un recurso musical como una composición de tamaño, forma, peso y propiedades de la sustancia material, pero no es así como normalmente piensa la gente. En cambio, tratan el formato físico como una propiedad única como lo hacemos en este ejemplo.


    5. Necesitamos pensar en el orden alfabético o cualquier otro principio organizativo de una manera lógica que no implique ninguna implementación física particular. Por lo tanto, no es necesario considerar cuáles de estas categorías alfabéticas existen como carpetas, archivos u otras particiones tangibles.


    6. Otro ejemplo: las reglas para enviar paquetes podrían usar el tamaño o el peso para calcular el costo de envío, y si estas reglas se basan en valores numéricos específicos o rangos de valores, la intención parece ser crear categorías de paquetes.


    7. Si te esfuerzas, puedes llegar a situaciones en las que esta propiedad sea importante, como cuando el circo viene a la isla en un ferry o cuando estás cargando un elevador con un límite de capacidad de 5000 libras, pero simplemente no es una propiedad útil o psicológicamente sobresaliente en la mayoría de contextos.


    8. Muchos sistemas de información, aplicaciones y lenguajes de programación que trabajan con categorías jerárquicas aprovechan esta relación lógica para inferir propiedades heredadas cuando son necesarias en lugar de almacenarlas de manera redundante.


    9. De igual manera, las tiendas de ropa utilizan propiedades estáticas intrínsecas cuando presentan mercancía dispuesta de acuerdo con el color y el tamaño; propiedades estáticas extrínsecas cuando albergan exhibiciones de marca de mercancía; propiedades dinámicas intrínsecas cuando reservan una exhibición para mercancía de temporada, desde trajes de baño hasta botas de invierno; y propiedades dinámicas extrínsecas cuando se reserva un área de exhibición para “Today's Special.


    10. Aristóteles no los llamó categorías clásicas. Esa etiqueta fue otorgada unos 2300 años después por (Smith y Medin 1981).


    11. Todos usamos la palabra “sobre” con facilidad en el discurso ordinario, pero “acerca” ha generado una sorprendente cantidad de comentarios teóricos sobre su definición típicamente implícita, comenzando con (Hutchins 1977) y (Maron 1977) y continuada implacablemente por (Hjørland 1992, 2001).


    12. Los efectos de tipicidad y centralidad fueron estudiados por Rosch y otros en numerosos experimentos altamente influyentes en las décadas de 1970 y 1980 (Rosch 1975). Los buenos resúmenes se pueden encontrar en (Mervis y Rosch 1981), (Rosch 1999), y en el Capítulo 1 de (Rogers y McClelland 2008).


    13. Una fuente fácil de encontrar para la discusión de Wittgenstein sobre “juego” es (Wittgenstein 2002) en una colección de lecturas centrales para psicología cognitiva (Levitin 2002).


    14. La encuesta del filósofo que clasificó el libro #1 de Wittgenstein es reportada por (Lackey 1999).


    15. Podría ser posible definir “juego”, pero requiere de una gran abstracción que oscurece las pruebas “necesarias y suficientes”. “Jugar a un juego es dedicarse a una actividad dirigida a lograr un estado de cosas específico, utilizando únicamente los medios permitidos por reglas específicas, donde los medios permitidos por las reglas tienen un alcance más limitado de lo que serían en ausencia de las reglas, y donde la única razón para aceptarlo limitación es hacer posible dicha actividad. (Trajes 1967)


    16. La naturaleza exacta de la representación de categorías a la que se hace la comparación de similitud es un tema de debate continuo en la ciencia cognitiva. Es un prototipo, una tendencia central o promedio de las propiedades compartidas por los miembros de la categoría, o es uno o más ejemplares, miembros particulares que tipifican la categoría. ¿O tampoco, como argumentan los modeladores coneccionistas que ven las categorías como patrones de activación de red sin ninguna representación de categoría almacenada explícitamente? Afortunadamente, estas distinciones no importan para nuestra discusión aquí. Una revisión reciente es (Rips, Smith y Medin 2012).


    17. Otra situación en la que la similitud ha sido descrita como una explicación “mayormente vacía” para la categorización es con categorías abstractas o metáforas. Goldstone dice que “un trabajo poco gratificante y una relación que no se puede terminar pueden ser ambas cárceles metafóricas... y pueden parecer similares en que ambos evocan la sensación de estar atrapados... pero esta característica es casi tan abstracta como la categoría a explicar. (Goldstone 1994), p. 149.


    18. (Medin, Goldstone y Gentner 1993) y (Tenenbaum y Griffiths 2001).


    19. Debido a que el modelo de Tversky considera por separado los conjuntos de características no superpuestas, es posible capturar con precisión juicios de similitud cuando no son simétricos, es decir, cuando A se juzga más similar a B que B es a A. Este efecto de encuadre está bien establecido en la literatura psicológica y muchos algoritmos de aprendizaje automático ahora emplean medidas asimétricas. (Tversky 1974)


    20. Para una explicación detallada de la distancia y los modelos transformacionales de similitud, véase (Flach 2012), Capítulo 9. Hay muchas calculadoras en línea para la distancia Levenshein; http://www.let.rug.nl/kleiweg/lev/ también tiene una visualización convincente. Las “cadenas” a emparejar pueden ser ellas mismas transformaciones. La función “soundex” se usa muy comúnmente para determinar si dos palabras podrían ser diferentes ortografías del mismo nombre. “hash” los nombres en codificaciones fonéticas que tienen menos caracteres que las versiones de texto. Ver (Christen 2006) y http://www.searchforancestors.com/utility/soundex.html para probarlo tú mismo.


    21. Esta explicación de las diferencias experto-novato en categorización y resolución de problemas se propuso en (Chi et al 1981). Véase (Linhares 2007) para estudios de razonamiento abstracto realizados por expertos en ajedrez.


    22. (BarSalou 1983).


    23. La aparición de la categorización basada en la teoría es un evento importante en el desarrollo cognitivo que se ha caracterizado como un cambio de categorías “holísticas” a “analíticas” o de “propiedades superficiales” a “principios”. ” Véase (Carey y Gelman 1991) (Rehder y Hastie 2004).



    This page titled 7.3: Principios para crear categorías is shared under a not declared license and was authored, remixed, and/or curated by Robert J. Glushko.