Saltar al contenido principal
LibreTexts Español

8.1: Introducción (VIII)

  • Page ID
    98056
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    En Describiendo Relaciones y Estructuras discutimos diferentes tipos de relaciones semánticas y contrastamos relaciones abstractas entre categorías que definen una jerarquía semántica como

    Carne es-a Alimentación

    con relaciones concretas que involucran a personas específicas como miembros de la familia Simpson:

    Homero Simpson es-a Marido

    Cuando hacemos una afirmación de que una instancia en particular como Homero Simpson es miembro de clase, estamos clasificando la instancia.

    La clasificación, la asignación sistemática de recursos a categorías intencionales, es el foco de este capítulo. En Categorización: Describiendo clases y tipos de recursos, describimos categorías creadas por personas como modelos cognitivos y lingüísticos para aplicar conocimientos previos y discutimos un conjunto de principios para la creación de categorías y sistemas de categorías. Se explicó cómo las categorías culturales sirven de base sobre la que se fundamentan las categorías individuales e institucionales. Las categorías institucionales se crean con mayor frecuencia en dominios abstractos e intensivos en información, donde las categorías inequívocas y precisas permiten que la clasificación sea decidida y basada en principios. Las categorías computacionales heredadas por las técnicas de aprendizaje supervisado suelen ser tan interpretables como las creadas por las personas, pero las categorías creadas por técnicas de aprendizaje automático no supervisadas son patrones estadísticos que pueden o no ser interpretables.

    Un sistema de categorías y sus reglas o métodos de acceso asociados se suele llamar esquema de clasificación o simplemente las clasificaciones. Un sistema de categorías captura las distinciones y relaciones entre sus recursos que son más importantes en un dominio y para un contexto particular de uso, creando un modelo de referencia o hoja de ruta conceptual para sus usuarios. Esta clasificación crea la estructura y soporte para las interacciones que realizan los agentes humanos o computacionales. Por ejemplo, las bibliotecas y librerías de investigación no utilizan las mismas clasificaciones para organizar los libros, pero las categorías que cada una utiliza son adecuadas para sus tipos contrastantes de colecciones y los diferentes tipos de actividades de navegación y búsqueda que tienen lugar en cada contexto. De igual manera, las clasificaciones científicas para animales utilizadas por los biólogos contrastan con las utilizadas en las tiendas de mascotas porque estas últimas no tienen necesidad de la diferenciación precisa que posibilita la primera.

    Clasificación vs. categorización

    La clasificación requiere un sistema de categorías, por lo que no todos distinguen la clasificación de la categorización. Batley, por ejemplo, dice que la clasificación es “imponer algún tipo de estructura a nuestra comprensión de nuestro entorno”, una definición vaga que se aplica igualmente bien a la categorización. [1]

    En la disciplina de la organización, la definición de clasificación es más estrecha y formal. Los contrastes entre categorías culturales, individuales e institucionales en “El qué y el por qué de las categorías” arrojan una definición precisa de clasificación: La asignación sistemática de recursos a un sistema de categorías intencionales, a menudo institucionales. Esta definición destaca la intencionalidad detrás del sistema de categorías, los procesos sistemáticos para su uso, e implica los mayores requisitos de gobernanza y mantenimiento que están ausentes para las categorías culturales y la mayoría de las individuales.

    Clasificación vs. etiquetado

    La clasificación precisa y confiable es posible cuando las propiedades compartidas de una colección de recursos se utilizan de manera sistemática y basada en principios. Este método de clasificación es esencial para satisfacer fines institucionales y comerciales. Sin embargo, este grado de rigor puede ser excesivo para las clasificaciones personales y para las clasificaciones de recursos en contextos sociales o informales.

    En cambio, un enfoque más débil para organizar los recursos es utilizar cualquier propiedad de un recurso y cualquier vocabulario para describirlo, independientemente de lo bien que lo diferencie de otros recursos para crear un sistema de categorías. Este método de organización de recursos suele llamarse etiquetado (“Etiquetado de recursos basados en la web”), pero también se le ha llamado clasificación social. [2]

    El etiquetado se usa a menudo en los sistemas de organización personal, pero es social cuando sirve a objetivos para transmitir información, desarrollar una comunidad o administrar la reputación. Sin embargo, independientemente de su nombre, el etiquetado es popular para organizar y calificar fotos, sitios web, mensajes de correo electrónico u otros recursos basados en la web o descripciones basadas en la web de recursos físicos como tiendas y restaurantes.

    La distinción entre clasificación y etiquetado se vio borrosa cuando Thomas Vander Wal acuñó el término “folksonomía”, combinando “folk” y “taxonomía” (que es una clasificación; ver “Inclusión”) describir la colección de etiquetas para un sitio web o aplicación en particular. [3] Las folksonomías a menudo se muestran en forma de una nube de etiquetas, donde la frecuencia con la que se usa la etiqueta en todo el sitio determina el tamaño del texto en la nube de etiquetas. La nube de etiquetas emerge a través de la agregación ascendente de etiquetas de usuario y es una construcción estadística, más que una semántica. [4]

    El etiquetado parece insuficientemente basado en principios para ser considerado clasificación. Etiquetar una foto como “roja” o “auto” es un acto de descripción de recursos, no de clasificación, porque las otras etiquetas que servirían como clasificaciones alternativas no están especificadas. Además, cuando se siguen los principios de etiquetado, es probable que sean idiosincrásicos que no fueron predeterminados o a los que se llegó a través de un análisis de metas y requisitos.

    De manera notable, algunos usos de las etiquetas las tratan como etiquetas de categoría, convirtiendo el etiquetado en clasificación. Muchos sitios web y recursos animan a los usuarios a asignarles etiquetas “Me gusta” o “+1”, y debido a que estas etiquetas están predefinidas, son opciones de categoría en un sistema de clasificación implícito; por ejemplo, podemos considerar “Me gusta” como una alternativa a un “No me gustó lo suficiente ” categoría.

    Cuando los usuarios o comunidades establecen conjuntos de principios para regir sus prácticas de etiquetado, el etiquetado se parece aún más a la clasificación. Tal sistema de etiquetado puede llamarse tagsonomía, un neologismo que hemos inventado para describir el etiquetado más sistemático. Por ejemplo, una tagsonomía podría predeterminar etiquetas como categorías a asignar a contenidos particulares de una entrada de blog, o especificar el nivel de abstracción y granularidad para asignar etiquetas sin predeterminarlas (“Temas e implicaciones de diseño de categorías”). Algunas personas utilizan múltiples cuentas de usuario para la misma aplicación para establecer distintas personas o contextos (por ejemplo, colecciones de fotos personales vs. empresariales) como una forma de hacer que sus tagsonomías sean más distintas.

    Tomar estas decisiones sobre etiquetar contenido y formulario y aplicarlos en el proceso de etiquetado transforma un conjunto ad hoc de etiquetas en una tagsonomía de principios. Cuando el etiquetado se introduce en un entorno empresarial, los propósitos más pragmáticos y el etiquetado más sistemático —por ejemplo, mediante el uso de etiquetas de listas de departamentos o productos también tienden a crear una clasificación tagsonómica. [5]

    Etiquetar documentos por computadora”, o clasificación multietiqueta, es una manera simple de describir el modelado de temas, una técnica de aprendizaje no supervisada para organizar y resumir colecciones de documentos no estructurados mediante el descubrimiento de patrones o clústeres en las palabras que contienen. La intuición básica detrás del modelado de temas es que las palabras de un documento son indicios probabilísticos de lo que trata el documento; un documento que contiene palabras como “elección, gobierno y candidato” probablemente trata del tema “política”, mientras que palabras como “adorar, boda y matrimonio” son buenos indicios de un tema de “amor”. Los modelos de temas no son del todo etiquetados porque las palabras que identifican para describir documentos no son etiquetas atómicas o etiquetas asignadas explícitamente a documentos individuales. En cambio, los temas son más como temas que diferentes documentos tienen más o menos probabilidades de contener.

    Los modelos de temas se han utilizado para implementar interfaces de usuario para navegar por grandes colecciones de documentos porque permiten al usuario explorar usando temas en lugar de términos de búsqueda específicos. En humanidades digitales, los modelos temáticos se han utilizado para descubrir cambios en “lo que se escribe” por algún autor o recurso (como un periódico) a lo largo del tiempo. Las empresas de comercio web utilizan modelos temáticos para organizar libros o productos para sus motores de recomendación. [6]

    Clasificación vs Arreglo Físico

    A menudo hemos recalcado el principio en la disciplina de la organización de que las cuestiones lógicas deben separarse de las cuestiones de implementación. (Ver “El concepto de “principio organizativo””, “Diseño de la forma de descripción” y “La perspectiva de implementación”) Con clasificación separamos el acto conceptual de asignar un recurso a una categoría del acto posterior pero a menudo incidental de ponerlo en algunos ubicación de almacenamiento físico o digital. Este enfoque en la esencia lógica de la clasificación se expresa elegantemente en una definición de Gruenberg: La clasificación es “una habilidad de pensamiento de orden superior que requiere la fusión del ojo naturalista para las relaciones... con el deseo del lógico por el orden estructurado... el matemático compulsión para lograr resultados consistentes, predecibles... y el interés del lingüista en expresiones explícitas y tácitas de significado. [7]

    Tomar una perspectiva conceptual o cognitiva sobre la clasificación contrasta con mucho uso convencional en bibliotecología, donde la clasificación se asocia principalmente con la disposición de artículos tangibles en estantes, enfatizando la función de “estacionamiento” que realiza la función de “marcado” de identificar la categoría a la que pertenece el recurso. [8]

    Desde la perspectiva de la bibliotecología o de la curación de colecciones, parece innegable que cuando los recursos que se clasifican son cosas físicas o tangibles como libros, pinturas, animales o ollas, el resultado final de la actividad de clasificación es que algún recurso ha sido colocado en alguna ubicación física. Además, la colocación de los recursos físicos puede estar influenciada por el contexto físico en el que se organizan. Una vez colocado, el contexto físico a menudo encarna algunos aspectos de la organización cuando se organizan recursos similares o relacionados en ubicaciones cercanas. En bibliotecas y librerías, esta adyacencia facilita el descubrimiento fortuito de recursos, como bien sabe cualquiera que haya encontrado un libro interesante al navegar por las estanterías.

    Puede parecer natural identificar ubicaciones de almacenamiento con las clases utilizadas por el sistema de clasificación. Así como podríamos pensar en una ubicación en el zoológico como el “hábitat del león”, podemos poner un letrero de “QC” en una fila particular de estantes en una biblioteca donde se disponen libros sobre física.

    Sin embargo, una vez que ampliamos el alcance de la organización para incluir los recursos digitales, es claro que confiamos en sus clasificaciones lógicas cuando interactuamos con ellos, no si residen en una computadora en Berkeley o Bangalore. Es mejor enfatizar que un sistema de clasificación es ante todo una especificación para la disposición lógica de los recursos porque generalmente hay muchas asignaciones posibles y a menudo arbitrarias de referencias lógicas a ubicaciones físicas.

    Esquemas de clasificación

    Un esquema de clasificación es una realización de uno o más principios organizativos. Los recursos físicos suelen clasificarse según sus propiedades tangibles o perceptibles. Como comentamos en “Propiedades individuales” y “Propiedades múltiples”, cuando las propiedades solo toman un pequeño conjunto de valores discretos, surge naturalmente un sistema de clasificación en el que cada categoría se define por un valor de propiedad o alguna combinación particular de valores de propiedad. Los esquemas de clasificación en los que se definen explícitamente todas las categorías posibles a las que se pueden asignar recursos son enumerativos. Por ejemplo, la clasificación enumerativa para una colección personal de música grabada en medios físicos podría tener categorías para CD, DVD, álbumes de vinilo, cartuchos de 8 pistas, cinta de carrete a carrete y casetes de cinta; cada recurso musical encaja en una y sólo una de estas categorías.

    Cuando se consideran múltiples propiedades de recursos en una secuencia fija, cada propiedad crea otro nivel en el sistema de categorías y el esquema de clasificación es jerárquico o taxonómico. (Ver “Inclusión”.)

    Para los recursos de información, su torno suele ser más importante que sus propiedades físicas. Por ejemplo, un profesor que planee un nuevo curso podría organizar artículos candidatos para el plan de estudios en un conjunto fijo de categorías, una para cada tema potencial de la conferencia. Pero es más desafiante enumerar todos los temas o temas sobre los que podría tratarse una mayor colección de recursos. La Clasificación de la Biblioteca del Congreso (LCC) es un esquema jerárquico y enumerativo con un conjunto muy detallado de categorías temáticas porque los libros pueden tratarse de casi cualquier cosa. Se discute la “Clasificación Bibliográfica”.

    Además o en lugar de su aproximación, los recursos de información a veces se organizan utilizando propiedades intrínsecas como nombres de autor o fechas de creación. Nuestro profesor podría organizar principalmente su colección de artículos por nombre de autor, y cuando planifique un nuevo curso, podría poner los que seleccione para el programa de estudios en un sistema de clasificación con una categoría por cada conferencia programada.

    Debido a que los nombres y las fechas pueden tomar muchos valores, es poco probable que un principio de organización como el orden alfabético o cronológico enumere de antemano una categoría explícita para cada valor posible. En cambio, podemos considerar estos principios organizativos como la creación de un sistema de clasificación implícito o latente en el que las categorías se generan sólo según sea necesario. Por ejemplo, la categoría Q solo existe en un esquema alfabético si hay un recurso cuyo nombre comienza con Q.

    Muchos dominios de recursos tienen múltiples propiedades que podrían usarse para definir un esquema de clasificación. Por ejemplo, el vino puede clasificarse por tipo de uva (varietal), color, sabor, precio, enólogo, región de origen (denominación), estilo de mezcla y otras propiedades. Además, las personas difieren en sus conocimientos o preferencias sobre estas propiedades; algunas personas eligen el vino en función de su precio y varietal, mientras que otras comparan estudiosamente enólogos y denominaciones. Cada orden de considerar las propiedades crea una clasificación jerárquica diferente, y el uso de todas ellas crearía un sistema muy profundo y difícil de manejar. Además, podrían requerirse muchas jerarquías diferentes para satisfacer preferencias divergentes. Un esquema de clasificación alternativo para dominios como estos es la clasificación facetada, un tipo de sistema de clasificación que toma un conjunto de propiedades de recursos y luego genera solo aquellas categorías para combinaciones que realmente ocurren.

    Los tipos de facetas más comunes son enumerativas (mutuamente excluyentes); booleanas (sí o no); jerárquicas o taxonómicas (contención lógica); y espectro (un rango de valores numéricos). Discutimos la clasificación facetada en detalle (en “Clasificación facetada”) porque se utiliza con mucha frecuencia en las clasificaciones en línea. Los esquemas facetados permiten una búsqueda y navegación más fáciles de grandes colecciones de recursos como las de sitios minoristas y museos que los esquemas enumerativos jerárquicos. En bibliotecología un sistema de clasificación que construye categorías por combinación de facetas a veces también se llama analítico-sintético.

    La Clasificación Decimal Dewey (DDC) es un sistema de clasificación altamente enumerativo que también utiliza propiedades facetadas; lo discutiremos más en “Clasificación Bibliográfica”.

    Clasificación y Estandarización

    Las clasificaciones imponen orden a los recursos. Los estándares hacen lo mismo al hacer distinciones, ya sea implícita o explícitamente, entre formas “estándar” y “no estándar” de crear, organizar y usar recursos. La clasificación y estandarización no son idénticas, pero están estrechamente relacionadas. Algunas clasificaciones se convierten en estándares y algunas definen nuevas clasificaciones. Las categorías institucionales (“Categorías Institucionales”) son de dos tipos amplios.

    Taxonomías Institucionales

    Las taxonomías institucionales son clasificaciones diseñadas para hacer más probable que las personas o los agentes computacionales se organicen e interactúen con los recursos de la misma manera. Entre los miles de estándares publicados por la Organización Internacional de Normalización (ISO) se encuentran muchas taxonomías institucionales que rigen la clasificación de recursos y productos en agricultura, aviación, construcción, energía, salud, tecnología de la información, transporte y casi todos los sectores industriales. [9]

    Las taxonomías institucionales son especialmente importantes en las bibliotecas y la gestión del conocimiento. La Clasificación Decimal Dewey (DDC) y la Clasificación de la Biblioteca del Congreso (LCC) permiten a diferentes bibliotecas organizar libros en las mismas categorías, y el Manual Diagnóstico y Estadístico de Trastornos Mentales (DSM) en psicología clínica permite a diferentes médicos asignar pacientes a las mismas categorías diagnósticas y de seguros. [10]

    Semántica Institucional

    Los sistemas de semántica institucional ofrecen abstracciones o componentes de información definidos con precisión (“Componentes de Identidad e Información”) necesarios para garantizar que la información pueda ser intercambiada y utilizada de manera eficiente. Organizar sistemas que utilizan diferentes modelos de información a menudo no pueden compartir y combinar información sin una negociación tediosa y una reelaboración excesiva.

    Automatizar transacciones con proveedores y clientes en una cadena de suministro requiere que todas las partes utilicen el mismo formato de datos o formatos que puedan transformarse para que sean interoperables. A menudo es posible adaptar o reemplazar estas aplicaciones para permitir una interoperabilidad eficiente, y generalmente es deseable que la empresa desarrolle o adopte estándares empresariales para modelos de intercambio de información en lugar de pagar los costos de transacción recurrentes para integrar o transformar formatos incompatibles .

    La semántica estándar es especialmente importante en industrias o mercados que tienen efectos significativos en la red donde el valor de un producto depende del número de productos interoperables o compatibles, estos incluyen gran parte de las economías de información y servicios.

    Un ejemplo de un sistema de semántica institucional es el Lenguaje Universal de Negocios (UBL), una biblioteca de alrededor de 2000 “bloques de construcción” semánticos para conceptos comunes como “Dirección”,Elemento”,Pago” y “Partido” a lo largo con casi 100 tipos de documentos ensamblados a partir de los componentes estándar. [11]

    Especificaciones vs. estándares

    Implementar un sistema de organización de gran alcance y complejidad de manera robusta y mantenible requiere descripciones precisas de los recursos que contiene, sus formatos, las clases, las relaciones, las estructuras y colecciones en las que participan, y los procesos que aseguran su uso eficiente y efectivo. Descripciones rigurosas como estas a menudo se llaman “especificaciones” y existen prácticas bien establecidas para desarrollar buenas.

    Existe una distinción sutil pero crítica entre “especificaciones” y “estándares”. ” Cualquier persona, empresa o grupo ad hoc de personas o firmas puede crear una especificación y luego usarla o intentar que otros la usen. [12] En contraste, un estándar es una especificación publicada que se desarrolla y mantiene por consenso de todos los actores relevantes en algún dominio siguiendo un proceso definido y transparente, generalmente bajo los auspicios de una organización de estándares reconocida. [13] Además, las implementaciones de estándares a menudo están sujetas a pruebas de conformidad que establecen la integridad y precisión de la implementación. Esto significa que los usuarios pueden decidir implementar la especificación ellos mismos o elegir entre otras implementaciones conformes.

    El rigor y transparencia adicionales cuando las especificaciones se desarrollan y mantienen a través de un proceso de estándares a menudo las hace más justas y les da más legitimidad. Los gobiernos a menudo requieren o recomiendan estos estándares de jure, especialmente aquellos que son “abiertos” o “libres de regalías” porque generalmente son apoyados por múltiples proveedores, minimizando el costo de adopción y maximizando su longevidad.

    Por ejemplo, el trabajo sobre UBL se ha desarrollado desde hace más de una década en un comité técnico bajo los auspicios de un consorcio de desarrollo de estándares llamado Organización para el Avance de las Normas de Información Estructurada (OASIS), que ha desarrollado decenas de estándares para servicios web e industrias intensivas en información.

    A pesar de estas importantes distinciones entre “especificaciones” y “estándares”, sin embargo, en el uso convencional “estándar” es a menudo simplemente un sinónimo de “especificación dominante o ampliamente adoptada. ” Estos estándares de facto, en contraste con los estándares de jure creados por las organizaciones de estándares, suelen ser creados por la firma o firmas dominantes en una industria, por una nueva firma que es la primera en utilizar una nueva tecnología o método innovador, o por una entidad sin fines de lucro como una fundación que se enfoca en un dominio en particular. [14]

    Los estándares de facto y los estándares ad hoc a menudo coexisten y compiten en “guerras de estándares”, especialmente en dominios intensivos en información e industrias con rápida innovación. Las “guerras” de estándares tienden a ocurrir cuando diferentes firmas o grupos de firmas desarrollan dos o más estándares que tienden a atender las mismas necesidades. No es sorprendente que los estándares competidores a menudo sean incompatibles a propósito. Al principio esto permite que cada estándar atraiga clientes con funciones no habilitadas por el otro, pero termina encerrándolos imponiendo costos de conmutación. Los ejemplos actuales incluyen Google vs. Apple en teléfonos móviles y Kindle versus Apple en lectores de libros electrónicos. [15]

    Por ejemplo, la Clasificación Decimal Dewey (DDC) es el sistema de clasificación de bibliotecas más utilizado en el mundo, y la mayoría de la gente lo trata como un estándar. De hecho, la Asociación Americana de Psiquiatría (APA) y le gana a la APA muchos millones de dólares al año.

    En contraste, los estándares de jure incluyen la Clasificación de la Biblioteca del Congreso (LCC), desarrollada bajo los auspicios del gobierno de Estados Unidos, la familiar [16]

    En consecuencia, aunque sería técnicamente correcto argumentar que “si bien todas las normas son especificaciones, no todas las especificaciones son estándares”, esta distinción es difícil de mantener en la práctica.

    Clasificaciones por mandato

    A menudo los gobiernos imponen normas para proteger los intereses de sus ciudadanos coordinando o facilitando actividades que de otro modo no serían posibles o seguras. Algunos de ellos se refieren principalmente a la seguridad pública o de los productos y solo son tangencialmente relevantes para los sistemas de organización de la información. Otros son muy relevantes, especialmente aquellos que especifican los formatos y el contenido del intercambio de información; muchos gobiernos europeos requieren que las empresas que hacen negocios con el gobierno adopten [17]

    Otros estándares gubernamentales que son importantes en los sistemas de organización son aquellos que expresan requisitos para la clasificación y retención de información de auditoría para actividades financieras, como la Ley Sarbanes-Oxley, o para la no retención de información personal, como [18]


    1. (Batley 2005 p. 1).


    2. (Hammond et al. 2004) señalan que el enfoque “no estructurado (o mejor, estructurado libre) para la clasificación con usuarios asignando sus propias etiquetas se conoce de diversas maneras como folksonomía, clasificación folclórica, etnoclasificación, clasificación distribuida o clasificación social.


    3. Thomas Vander Wal inventó el término “folksonomía” en 2004, y el término rápidamente ganó tracción. Su relato personal de la creación y dispersión del término es (Vander Wal 2007).


    4. Ver (Halvey y Keane 2007), (Sinclair y Cardrew-Hall 2007)) para análisis de la usabilidad de diferentes presentaciones, y (Kaser y Lemire 2007) para algoritmos para dibujar nubes de etiquetas.


    5. Véase (Millen, Feinberg y Kerr 2006), (John y Seligmann 2006).


    6. Las técnicas estadísticas utilizadas en los modelos temáticos son intimidantes; para simplificar enormemente, los modelos temáticos comienzan con una matriz de documento x término y extraen temas reduciendo la dimensionalidad a través de técnicas de álgebra lineal. (Bleu 2012) es una introducción relativamente fácil.


    7. Gruenberg escribió esta definición hace más de una década como estudiante de doctorado de la Universidad de Illinois en un artículo inédito titulado Faceted Classification, Facet Analysis, and the Web que fue encontrado por una búsqueda en la web del primer autor de este capítulo en 2005. Cuando este capítulo se estaba escribiendo varios años después, el papel ya no estaba en la web, sino que Matthew Beth localizó una copia en Illinois en un disco de respaldo.


    8. Esto se refleja en los números de llamada de la biblioteca, que asignan un número único a los libros para designar el orden en que se archivan. La mayoría de las bibliotecas estadounidenses utilizan un sistema de clasificación como parte de su número de llamada, componiéndolo a partir de un número de clase de la clasificación y un identificador único (derivado del nombre y título del autor), que identifica el libro dentro de la clase, a menudo usando un sistema llamado números de cortador. Ver http://www.itsmarc.com/crs/mergedProjects/cutter/cutter/general_information_cutter.htm.


    9. La organización más “estándar” de todas las normas es la Organización Internacional de Normalización (ISO), cuyos miembros son a su vez organizaciones nacionales de normalización, lo que da como resultado a los casi 20,000 estándares ISO los más amplios y la mayor cobertura global. Ver http://ISO.org. Además, hay decenas de otros organismos de estándares nacionales y específicos de la industria cuyo trabajo es potencialmente relevante para organizar sistemas del tipo discutido en este libro. Nos encontramos con este tipo de estándares todos los días en códigos para países, monedas y aeropuertos, en formatos de archivo, en códigos de barras de productos y en muchos otros contextos.


    10. Clasificación Decimal Dewey: www.oclc.org/Dewey/DDC.

      De igual manera, el DSM es mantenido y publicado por la Asociación Americana de Psiquiatría (APA) y gana los muchos millones de dólares al año.


    11. (OASIS 2006). Todo el trabajo terminado de OASIS está disponible gratuitamente en https://www.oasis-open.org; el comité UBL está en https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=ubl.


    12. Un pequeño número de personas a menudo puede ponerse de acuerdo de manera informal sobre un sistema de organización que satisfaga las necesidades de cada participante. Pero cada nueva persona suele traer nuevos requisitos y no es factible resolver cada desacuerdo entre cada par de participantes. En cambio, para un sistema de organización a gran escala, las decisiones suelen ser tomadas por entidades que tienen la autoridad para coordinar acciones y prevenir conflictos imponiendo una única solución a todos los participantes. (Rosenthal, Seligman y Renner 2004) llaman a esto la compensación de “persona-concepto”, que podemos parafrasear ya que “algunas personas pueden ponerse de acuerdo mucho, pero mucha gente solo puede ponerse de acuerdo un poco.

      Esta autoridad puede provenir de muchas fuentes diferentes, pero pueden clasificarse aproximadamente como “autoridad del poder” y “autoridad del consenso”. ” A menudo el dominio económico de una firma le permite controlar cómo se hacen los negocios en su industria. Una parte clave de ello es establecer especificaciones para los formatos de datos y esquemas de clasificación en los sistemas de organización, lo que generalmente significa requerir que otras empresas utilicen las desarrolladas por la firma dominante para su propio uso. Esto asegura la eficiencia continua de sus propios procesos de negocio al tiempo que dificulta que otras firmas desafíen su poder de mercado.

      En contraste, el consenso es el mecanismo de autoridad plasmado en el funcionamiento de la comunidad de código abierto, donde la libertad de ver y cambiar los formatos de datos y el código que los utiliza fomenta la cooperación y la adopción. El consenso también subyace a la autoridad de las actividades de estándares voluntarios, donde las empresas trabajan juntas bajo los auspicios de un organismo de normalización y acuerdan seguir sus procedimientos para crear, ratificar e implementar normas.


    13. Los órganos normativos internacionales y nacionales derivan su autoridad de la autoridad de los gobiernos que los crearon. Pero las organizaciones de estándares posiblemente derivan la mayor parte de su autoridad del poder colectivo de sus miembros, porque muchas organizaciones de estándares influyentes como OASIS, W3C, OMG e IETF no están fletadas ni patrocinadas por gobiernos. Además, las empresas suelen crear organizaciones ad hoccuasi-estándares” o “comunidades de interés” para facilitar actividades cooperativas de elaboración de normas a relativamente corto plazo que en el primer caso estarían prohibidas por consideraciones antimonopolio . Por último, en el extremo “ligero” del continuo de elaboración de normas, la codificación de modelos de información simples y comúnmente utilizados como “microformatos” depende de la autoridad que surge de la colaboración de individuos más que de empresas.


    14. A menudo, un estándar evoluciona a partir de una especificación existente presentada a una organización de estándares por la firma que la creó. En otros casos, las especificaciones utilizadas por una empresa dominante se convierten en un estándar de facto por otras firmas de su industria, y nunca se somete a un proceso formal de elaboración de estándares.


    15. Véase (Shapiro y Varian, 1998).


    16. Aun así, el LCC no es estándar “abierto”. Puedes navegar por las clasificaciones en el sitio de LOC, pero para empaquetarlas como un libro o recurso digital completo tienes que pagarlas.


    17. Los gobiernos tienen horizontes inherentemente largos para sus acciones, necesitan servir a todos los ciudadanos de manera justa y sin discriminación, y (deben tratar de) minimizar el costo para los contribuyentes. Cada uno de estos principios es un argumento independiente a favor de las normas y tomados en conjunto hacen uno muy fuerte. En efecto, uno de los objetivos fundacionales en la Constitución de Estados Unidos es proteger el interés público, y esto se habilita en el Artículo I, Sección 8 al otorgar al Congreso la facultad de establecer estándares “de Pesos y Medidas” para facilitar el comercio. Establecer estándares es un papel clave del Instituto Nacional de Estándares y Tecnología (NIST), parte del Departamento de Comercio, y otros departamentos tienen responsabilidades y agencias similares que establecen estándares, como el Administración de Alimentos y Medicamentos (FDA) en el Departamento de Salud y Servicios Sociales. Además, organismos gubernamentales independientes como la Comisión Federal de Comunicaciones (FCC) y la Comisión Federal de Comercio (FTC) establecen numerosos estándares que son relevantes para la organización de la información sistemas. Y por supuesto, la Biblioteca del Congreso (LOC) mantiene procedimientos y estándares necesarios “para sostener y preservar una colección universal de conocimientos... para las generaciones futuras” (LOC.gov/about).


    18. La Ley Sarbanes-Oxley es la Ley Pública de Estados Unidos 107-204, http://www.sec.gov/about/laws/soa2002.pdf.

      La fuente definitiva de la Ley de Portabilidad y Responsabilidad de Seguros Médicos (HIPAA) es el Departamento de Salud y Servicios Humanos de Estados Unidos, http://www.hhs.gov/ocr/privacy/hipaa/understanding/index.html.

      La fuente definitiva de la Ley de Derechos Educativos y Privacidad Familiar (FERPA) es el Departamento de Educación de Estados Unidos, http://www2.ed.gov/policy/gen/guid/fpco/ferpa/index.html.

      Cumplir con regulaciones gubernamentales como estas puede ser costoso y difícil, y muchas empresas, especialmente las más pequeñas, se quejan del costo. Por otro lado, se puede argumentar que invertir en un sistema riguroso de organización de la información puede aportar ventajas competitivas, convirtiendo la carga de cumplimiento en un arma competitiva (Taylor 2006).



    This page titled 8.1: Introducción (VIII) is shared under a not declared license and was authored, remixed, and/or curated by Robert J. Glushko.