Saltar al contenido principal
LibreTexts Español

5.3: El proceso de descripción de recursos

  • Page ID
    98104
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Preferimos el concepto general de descripción de recursos sobre los más especializados de descripción bibliográfica y metadatos porque facilita ver los temas que atraviesan los dominios donde esos términos dominan. Además, nos permite proponer un proceso más estándar que podamos aplicar ampliamente al uso de descripciones de recursos en sistemas de organización. Un vocabulario compartido permite compartir lecciones y mejores prácticas.

    El proceso de descripción de recursos implica siete pasos interdependientes e iterativos. Comenzamos con un resumen genérico del proceso para sentar las bases para una discusión detallada paso a paso.

    1. Identificar los recursos a describir es el primer paso; este tema se trata en detalle en “Identidad de recursos”. El dominio y alcance de los recursos circunscriben las propiedades descriptibles y los posibles propósitos a los que podrían servir las descripciones. El enfoque de recursos determina cuáles son los recursos de información primarios y cuáles son tratados como las descripciones de recursos correspondientes. Dos decisiones importantes en esta etapa son la granularidad de la descripción ¿estamos describiendo recursos individuales o colecciones de ellos? y el nivel de abstracción ¿estamos describiendo instancias de recursos, partes de ellas o tipos de recursos?

    2. Generalmente, el propósito de la descripción de los recursos es apoyar las actividades comunes a todos los sistemas de organización: seleccionar, organizar, interactuar y mantener los recursos, como vimos en Actividades en Sistemas Organizadores. El dominio de recursos particular y el contexto en el que se crean y utilizan las descripciones impone requisitos y restricciones más específicos a los fines que la descripción del recurso puede servir.

    3. Una vez determinados los propósitos de descripción en términos de actividades e interacciones, se pueden identificar las propiedades específicas de los recursos que se necesitan para habilitarlas. El objetivo de la descripción no es ser exhaustiva; siempre hay más propiedades posibles de las que se pueden describir razonablemente. En cambio, el desafío es usar las propiedades que sean más robustas y confiables para soportar las interacciones deseadas.

    4. Este paso incluye varias decisiones lógicas y semánticas sobre cómo se describirán las propiedades de los recursos. ¿Qué términos o nombres de elementos deben usarse para identificar las propiedades de los recursos que hemos elegido describir? ¿Existen reglas o restricciones sobre los tipos de datos o valores que las descripciones de propiedades pueden asumir? Al tratar con descripciones numéricas, sus tipos de datos y niveles de medición limitan los tipos de procesamiento a los que pueden someterse. Los datos nominales, ordinales, de intervalos y proporciones están limitados a transformaciones particulares basadas en lo que representan. Un buen vocabulario descriptivo será fácil de asignar al crear descripciones de recursos y fácil de entender al usarlos.

    5. Las decisiones lógicas y semánticas sobre el vocabulario descriptivo son cosificadas por decisiones sobre la notación, sintaxis y estructura de las descripciones. Tomadas en conjunto, estas decisiones determinan colectivamente lo que llamamos la forma o codificación de las descripciones de los recursos. La implementación de las descripciones implica decisiones sobre cómo y dónde se almacenan y la tecnología utilizada para crearlas, editarlas, almacenarlas y recuperarlas.

    6. Las descripciones de los recursos son creadas por individuos, por grupos informales o formales de personas, o por medios automatizados o computacionales. Algunos tipos de descripciones solo pueden ser creadas por personas, algunos tipos de descripciones solo pueden ser creadas por técnicas automatizadas o algorítmicas, y algunas se pueden crear de cualquier manera.

    7. Las descripciones de los recursos deben ser evaluadas con respecto a sus fines previstos. Los resultados de esta evaluación ayudarán a determinar cuáles o los pasos anteriores deben rehacerse.

    Las siguientes siete subsecciones discuten cada uno de estos pasos en detalle. Una guía de referencia rápida es Figura: El proceso de descripción de recursos.

    El proceso de describir los recursos

    Este gráfico resume el proceso de descripción de los recursos, enumerando siete pasos y algunos de los puntos de decisión relacionados.

    El proceso de descripción de los recursos consta de siete pasos: Determinar el alcance y el enfoque, determinar el propósito, identificar las propiedades de los recursos, diseñar el vocabulario descriptivo, diseñar la forma de descripción y la implementación, crear las descripciones y evaluar el descripciones.

    Cuán explícito y sistemático debe ser cada paso depende del dominio y alcance de los recursos, y especialmente de los usuarios previstos del sistema organizador. Si miramos con atención, podemos ver que la mayoría de estos pasos se dan incluso en contextos muy informales, como los niños jugando con bloques de Lego con los que iniciamos este capítulo. El objetivo de construir cosas con los bloques lleva a los chicos a identificar qué propiedades son más útiles para analizar. Desarrollan descripciones de los bloques que capturan los valores específicos de las propiedades relevantes. Por último, evalúan sus descripciones utilizándolas cuando juegan juntos; de inmediato se hace evidente que una descripción no está cumpliendo su propósito cuando un niño le entrega un bloque a otro que no era el que pensó que había pedido.

    En contraste, un escenario de toma de imágenes implica un proceso mucho más explícito y sistemático de descripción de recursos. Las propiedades de los recursos, el vocabulario descriptivo y el formulario de descripción utilizados automáticamente por una cámara digital fueron elegidos por una asociación de la industria y publicados como una especificación técnica implementada por fabricantes de cámaras y teléfonos móviles en todo el mundo.

    Las descripciones de recursos utilizadas por bibliotecas, archivos y museos se crean típicamente de una manera aún más explícita y sistemática. Al igual que las descripciones de la foto digital, las propiedades, el vocabulario y la forma de las descripciones utilizadas por sus sistemas de organización se rigen por estándares. Sin embargo, no hay equivalente a la cámara digital que pueda crear estas descripciones automáticamente. En cambio, profesionales altamente capacitados los crean meticulosamente.

    Una gran cantidad de recursos y sus descripciones asociadas en los sistemas de organización empresarial y científica son creados por procesos automatizados o computacionales, por lo que el proceso de describir recursos individuales no es en absoluto así en bibliotecas y otras instituciones de memoria. Sin embargo, el proceso para diseñar los modelos de datos o esquemas para la clase de recursos que se generarán es igualmente sistemático y generalmente lo realizan analistas de datos altamente calificados y modeladores de datos.

    Determinar el alcance y el enfoque

    ¿Qué recursos queremos describir? Como vimos en Recursos en Sistemas Organizadores, determinar lo que se tratará como un recurso separado no siempre es fácil, especialmente para recursos con partes componentes y para recursos de información donde la propiedad más importante es su contenido, que no es directamente perceptible. Identificar lo que quieres describir con la mayor precisión de práctica es el primer paso para crear una descripción útil.

    En “Enfoque de recursos”, introdujimos el contraste entre los recursos primarios y los recursos descriptivos, a los que llamamos enfoque de recursos. Determinar el enfoque de recursos va de la mano con determinar qué recursos pretendemos describir; estas decisiones a menudo arbitrarias hacen una gran diferencia en la naturaleza y el alcance de la descripción de los recursos. Los metadatos de una persona son los datos de otra persona.

    • Para un bibliotecario, el precio de un libro podría ser solo un atributo más que forme parte del registro del libro.

    • Para un contador en una librería, el precio de ese libro —tanto el costo para comprar el libro como el precio al que luego se vende a los clientes es información crítica para mantenerse en el negocio.

    • En un contexto de registros médicos, el proveedor de seguros de un paciente no le preocupa mucho al médico, sino a la persona responsable de facturar, es central. Para la enfermera, los signos vitales actuales del paciente pueden ser de mayor importancia, mientras que para el médico, puede ser más importante entender cómo esos datos en conjunto sirven para indicar un pronóstico a más largo plazo de la salud del paciente.

    • Un científico que estudia anatomía comparada conserva especímenes de animales y registra descripciones físicas detalladas sobre ellos, pero un científico que estudia ecología o migración descarta los especímenes y se enfoca en describir el contexto en el que se encontraba el espécimen ubicado.

    Describir instancias o describir colecciones

    Es más sencillo pensar en una descripción de un recurso como asociada a otro recurso individual. Como discutimos en Recursos en Sistemas Organizadores, es un reto determinar qué tratar como un recurso individual cuando los recursos son en sí mismos objetos o sistemas compuestos por otras partes o recursos. Por ejemplo, a veces describimos a un equipo de fútbol como un solo recurso y en otras ocasiones nos enfocamos en cada jugador individual. Sin embargo, después de decidir sobre la granularidad de los recursos, la pregunta sigue siendo si cada recurso necesita una descripción separada.

    Las bibliotecas y museos se especializan en la curaduría de descripciones de recursos sobre las instancias en sus colecciones. Las descripciones de recursos también se aplican a clases o colecciones de recursos, porque una colección también es un recurso (“El concepto de “colección”). A los archivos y colecciones especiales de mapas se les suele asignar descripciones de recursos, pero cada documento o mapa contenido en la colección no necesariamente tiene su propia descripción bibliográfica. Del mismo modo, los conjuntos de datos empresariales y científicos se describen invariablemente en granularidad a nivel de colección porque a menudo se analizan en su totalidad.

    Además, la granularidad de la descripción de una colección de recursos tiende a diferir para diferentes usuarios o propósitos. Un inversionista que posee muchas acciones diferentes se enfoca en sus precios individuales, mientras que otros inversionistas ponen su dinero en fondos indexados que combinan todos los precios separados en un solo valor.

    Muchas páginas web, especialmente catálogos de productos de comercio electrónico y sitios de noticias, se ensamblan y personalizan dinámicamente a partir de una gran cantidad de recursos y servicios de información que se identifican y describen por separado en los sistemas de administración de contenido y entrega de contenido. Sin embargo, una colección de recursos altamente compleja que se reúne en una sola página se trata como un solo recurso cuando esa página aparece en una lista de resultados de motores de búsqueda. Además, todas las páginas generadas por separado pueden recibir una sola descripción cuando un usuario crea un marcador para facilitar el regreso a la página principal del sitio.

    Abstracción en Descripción de Recursos

    También podemos asociar descripciones de recursos con todo un tipo o dominio de recursos. (Consulte “Preservar tipos de recursos” y “Dominio de recursos”.) Una colección de descripciones de recursos es mucho más útil cuando cada recurso se describe usando elementos de descripción comunes o términos que se aplican a cada recurso. Un esquema (o modelo, o estándar de metadatos) especifica el conjunto de descripciones que se aplican a todo un tipo de recurso. En ocasiones, este esquema, modelo o estándar se infiere o se impone a una colección de recursos existentes para garantizar definiciones más consistentes, pero más a menudo, se usa como especificación cuando los recursos se crean o generan en primer lugar. (Ver ¿Qué pasa con “Crear” Recursos? en “Introducción”.)

    Una base de datos relacional, por ejemplo, se conceptualiza fácilmente como una colección de registros organizados como una o más tablas, teniendo cada registro en su propia fila un número de campos o atributos que contienen algún tipo de contenido prescrito. Cada registro o fila en la tabla de base de datos es una descripción de un recurso —un empleado, un producto, cualquier cosa y los valores de atributo individuales, organizados por las columnas y filas de la tabla, son partes distintas de la descripción para alguna instancia de recurso en particular, como empleado 24 o producto 8012C. [1]

    Los recursos de información que comúnmente llamamos documentos son, por su naturaleza, menos homogéneos en contenido y estructura que los que se pueden administrar en bases de datos. Los esquemas de documentos, comúnmente representados en SGML o XML, generalmente permiten una mezcla de elementos descriptivos similares a datos y textuales.

    [2]

    Alcance, escala y descripción del recurso

    Si solo tuviéramos una cosa que describir, podríamos usar una sola palabra para describirlo: “eso. ” No necesitaríamos distinguirlo de ninguna otra cosa. Un segundo recurso implica al menos un término más en el lenguaje descriptivo: “no lo. ” Sin embargo, a medida que crece una colección, las descripciones deben volverse más complejas para distinguir no sólo entre, sino también entre recursos.

    Cada elemento o término en un lenguaje de descripción crea una dimensión, o eje, a lo largo del cual se pueden distinguir los recursos, o bien define un conjunto de preguntas sobre los recursos. Las distinciones y preguntas que surgen con frecuencia tienen que ser fáciles de abordar, tales como:

    • ¿Cuál es el nombre del recurso?

    • ¿Quién lo creó?

    • ¿Qué tipo de contenido o materia contiene?

    Por lo tanto, a medida que crece una colección, el lenguaje para describir los recursos debe volverse más riguroso, y las descripciones creadas cuando la colección era pequeña a menudo requieren revisión porque ya no son adecuadas para los fines previstos. [3]

    Esta coevolución del alcance descriptivo y la complejidad de la descripción es fácil de ver en las descripciones bibliográficas altamente complejas creadas por catalogadores profesionales. Los estándares de catalogación de las Reglas de Catalogación Angloamericanas (AACR2) de uso común distinguen 11 categorías diferentes de recursos y especifican varios cientos de elementos descriptivos. AACR2 ha sido recientemente reemplazada por los estándares de Descripción y Acceso a Recursos (RDA), que hacen distinciones precisas sobre el contenido, el tipo de medio y el portador (tecnología). [4]

    Debido a que la tarea de descripción de recursos bibliotecarios ha sido estandarizada a nivel nacional e internacional, el trabajo de catalogación se distribuye entre muchos descriptores cuyos resultados se comparten. El principio de estandarización ha sido la base de la descripción bibliográfica centralizada desde hace un siglo.

    La descripción centralizada de recursos por profesionales calificados trabaja para bibliotecas, pero incluso en los primeros días de la web, muchos bibliotecólogos y futuristas de autoría web reconocieron que este enfoque no escalaría para describir los recursos web. En 1995, se propuso el conjunto de elementos de metadatos Dublin Core (DC) con solo 15 elementos como un vocabulario descriptivo mucho más simple que las personas no capacitadas como catalogadores profesionales podrían usar. Desde entonces, la iniciativa Dublin Core ha sido muy influyente en inspirar a muchas otras comunidades a crear vocabularios de descripción minimalistas, a menudo simplificando vocabularios que habían sido ideados por profesionales para su uso por no profesionales. [5]

    Por supuesto, un vocabulario descriptivo más simple hace menos distinciones que uno complejo; reemplazando “autor”, “artista”,compositor” y muchas otras descripciones de la persona o recurso no humano responsable del contenido intelectual de un recurso por solo “ creator” (como lo hace Dublin Core) resulta en una pérdida sustancial de precisión cuando se crea la descripción y puede causar malentendidos cuando se reutilizan las descripciones. [6]

    Los impactos negativos del creciente alcance y escala en la descripción de los recursos a veces pueden evitarse si se contempla el alcance y la escala finales del sistema organizador cuando se está creando. No sería inteligente para un negocio con clientes en seis estados de Estados Unidos crear un campo de dirección en su base de datos de clientes que solo manejara esos seis estados; un diseño más extensible permitiría cualquier estado o provincia e incluiría un código de país. En general, sin embargo, así como hay problemas para adaptar un vocabulario simple a medida que aumentan el alcance y la escala, diseñar y aplicar descripciones de recursos que funcionen para una colección grande y en continuo crecimiento puede parecer demasiado trabajo cuando la colección en cuestión es pequeña.

    Los desafíos que surgen con los vocabularios de gran descripción se transforman cuando las descripciones de recursos son creadas y asignadas por algoritmos informáticos. Un gran conjunto de datos puede contener muchos miles de descripciones para cada recurso, pero claramente la computadora no tiene dificultades cognitivas para generarlas o utilizarlas. Sin embargo, los modelos de computadora con tantas características pueden ser difíciles de entender y confiar para la gente.

    Determinación de los Propósitos

    La descripción de los recursos sirve para muchos propósitos, y la combinación de propósitos y los tipos de descripciones resultantes en cualquier sistema de organización en particular depende del alcance y la escala de los recursos que se organizan. Podemos identificar y clasificar los propósitos más comunes utilizando las cuatro actividades que ocurren en cada sistema de organización: seleccionar, organizar, interactuar y mantener recursos (ver Actividades en Sistemas Organizadores). La descripción del recurso también tiene un propósito más abierto en la creación de sentido y la ciencia (ver “Descripción del recurso para Sensemaking and Science”); observamos y describimos el mundo para dar sentido a nuestras experiencias y predecir observaciones futuras.

    Descripción del recurso para apoyar la selección

    Definir la selección como el proceso mediante el cual los recursos son identificados, evaluados y luego agregados a una colección en un sistema de organización enfatiza las descripciones de recursos creadas por alguien que no sea la persona que los está usando. Podemos distinguir varias formas diferentes en las que la descripción del recurso admite la selección:

    Descubrimiento

    ¿Qué recursos disponibles podrían agregarse a una colección? Los nuevos recursos suelen aparecer en directorios, registros o catálogos. Algunos tipos de recursos son seleccionados y adquiridos automáticamente a través de suscripciones o contratos.

    Capacidad y compatibilidad

    ¿El recurso cumplirá con los requisitos funcionales o de interoperabilidad? Los recursos intensivos en tecnología suelen tener numerosos tipos especializados de descripciones que especifican sus funciones, desempeño, confiabilidad y otras “-ilidades” que determinan si encajan con otros recursos en un sistema de organización. [7] Algunos servicios tienen cualidades de niveles de servicio, términos y condiciones, o interfaces documentadas en descripciones de recursos que afectan su compatibilidad e interoperabilidad. Algunos recursos tienen restricciones de licencia o uso que podrían impedir que los recursos se utilicen efectivamente para los fines previstos. Las decisiones sobre la “selección de personas” se están volviendo más basadas en datos, y los equipos deportivos, los empleadores de negocios y los sitios de citas ahora se basan en estadísticas predictivas para encontrar a la mejor persona.

    Autentificación

    ¿El recurso es lo que dice ser? (“Autenticidad”) Las descripciones de recursos que pueden admitir la autenticación incluyen las tecnológicas como marcas de tiempo, marcas de agua, cifrado, sumas de verificación y firmas digitales. El historial de propiedad o custodia de un recurso, llamado su procedencia (“Procedencia”), a menudo se establece a través de la asociación con registros de ventas o impuestos. Los certificados de importación y exportación asociados al recurso podrían ser requeridos para cumplir con leyes diseñadas para evitar el robo de antigüedades o la transferencia de tecnología o información con implicaciones de seguridad nacional o política exterior.

    Avalúo

    ¿Cuál es el valor de este recurso? ¿Cuál es su costo? ¿A qué tasa se deprecia? ¿Tiene una vida útil? ¿Tiene calificaciones, clasificaciones o medidas de calidad asociadas? Además, ¿cuál es la calidad de esas calificaciones, clasificaciones y medidas?

    También consideramos la perspectiva de la persona que crea la descripción del recurso y su propósito principal, que a menudo es fomentar la selección del recurso por otra persona. El marketing de productos se trata de idear nombres y descripciones para hacer que un recurso sea distintivo y atractivo en comparación con las alternativas. Durante muchos años las ciruelas pasas fueron promovidas como un suplemento dietético que las personas (especialmente las viejas) necesitan para “mantener la regularidad. ” Pero después de que la California Prune Board (el mayor proveedor del mundo) las cambió de nombre como “ciruelas secas” y comenzó a comercializarlas como refrigerios (y al mismo tiempo renombrarse a sí misma como la Junta de Ciruela Seca de California) las ventas aumentaron significativamente. [8]

    Muchos países requieren que los bienes importados estén etiquetados con su país u origen. Los consumidores suelen utilizar esta propiedad en descripciones de recursos como un indicador de alta calidad, como lo harían con los relojes suizos, las modas francesas o italianas, o el tocino canadiense. Alternativamente, los consumidores podrían querer comprar bienes nacionales o de origen local por patriotismo económico o cumplir con las regulaciones de adquisiciones. No en vano, cuando los consumidores ven el origen de una manera positiva, esta información es conspicua y fácil de leer. En contraste, cuando los consumidores ven el origen de manera menos positiva, tal vez como una advertencia de bienes de baja calidad, es probable que el proveedor haga que la información de origen sea lo más discreta posible legalmente, o incluso podría tergiversar los bienes como nacionales. [9]

    Esta tergiversación también es omnipresente en las citas online, aunque la cantidad de tergiversación debe equilibrarse con los objetivos de la relación y las posibilidades de que se descubra el engaño. [10]

    Descripción del recurso para apoyar la organización

    Hemos definido la organización como especificar los principios para describir y organizar los recursos para crear las capacidades en las que se basan las interacciones. Esta definición trata la creación de descripciones de recursos y su uso para organizar recursos para interacciones como actividades separadas y secuenciales. Esto es más fácil de ver cuando las personas asignan palabras clave y clasificaciones a documentos, o cuando los sensores producen datos, y estas descripciones de recursos se utilizan posteriormente para permitir la recuperación de documentos o el análisis de datos. Un empleado de una tienda departamental podría ordenar las camisas de vestir en una mesa de exhibición usando etiquetas que describan sus marcas, tallas y otras propiedades. Las reglas que rigen la recopilación, integración y análisis de la información personal también son descripciones de recursos que influyen en la organización de los recursos de información.

    Sin embargo, aunque la descripción de los recursos y la organización de los recursos sean lógicamente separables, a veces se entrelazan. Cuando arreglas tu propia ropa, no usas descripciones explícitas de recursos y, en cambio, confías en las implícitas sobre propiedades fácilmente percibidas como el color, la forma y el material de composición. Cuando los algoritmos en lugar de personas analizan textos para identificar características descriptivas para aplicaciones como recuperación de información, clasificación de spam y análisis de sentimientos, las descripciones de recursos y la organización de recursos evolucionan conjuntamente, a menudo continuamente a medida que el algoritmo se adapta y aprende con cada nuevo recurso describe. Esta estrecha conexión entre la descripción de recursos y la organización de recursos también se explota en la organización de sistemas que utilizan registros de uso de registros de sesión, navegación o descarga de actividades como recursos de interacción, vinculándolos a pagos por usar los recursos o analizarlos para influir en la selección y organización de recursos en futuras interacciones personalizadas. (Ver “El concepto de “recurso de interacción””)

    Descripción del Recurso para Apoyar Interacciones

    La mayoría de las discusiones sobre los propósitos de las descripciones de recursos y metadatos enfatizan las interacciones que se basan en descripciones de recursos que han sido asignadas intencional y explícitamente. Los Requisitos Funcionales para Registros Bibliográficos (FRBR), definidos por los bibliotecólogos, especifican las cuatro interacciones de Encontrar, Identificar, Seleccionar y Obtener recursos, pero estos se aplican genéricamente a los sistemas de organización, no solo a los de las bibliotecas. [11]

    Encontrar

    ¿Qué recursos están disponibles que “corresponden a los criterios de búsqueda declarados por el usuario” y así pueden satisfacer una necesidad de información? Antes de que existieran catálogos en línea y bibliotecas digitales, encontramos recursos haciendo referencia a catálogos de descripciones de recursos impresos incorporando el título, autor y términos de tema como puntos de acceso a la colección; las descripciones de temas fueron las ayudas de búsqueda más importantes cuando el usuario no tenía recurso particular en mente. Los usuarios modernos aceptan que la indexación computarizada hace posible la búsqueda no solo sobre todo el recurso de descripción, sino a menudo sobre todo el contenido del recurso primario. Las empresas buscan en directorios descripciones de las capacidades de la compañía para encontrar socios potenciales, y también buscan descripciones de interfaces de aplicaciones (API) que les permitan intercambiar información de manera automatizada.

    Identificar

    Otro propósito de la descripción del recurso es permitir a un usuario confirmar la identidad de un recurso específico o distinguir entre varios que tienen algunas descripciones superpuestas. En contextos bibliográficos, esto podría significar encontrar el recurso que se identifica por su cita. Descripciones de recursos procesables por computadora como códigos de barras, [12]

    Seleccionando

    Seleccionar en este contexto significa la actividad del usuario de usar descripciones de recursos para apoyar una elección de recurso de una colección, no la actividad institucional de seleccionar recursos para la colección en primer lugar. Los motores de búsqueda suelen utilizar un breve “fragmento de texto” con los términos de consulta resaltados como descripciones de recursos para apoyar la selección. Las personas a menudo seleccionan recursos con las menores restricciones de uso como se describe en una licencia Creative Commons. [13] Una empresa puede seleccionar un proveedor o distribuidor que utilice el mismo estándar o modelo de referencia de la industria para describir sus productos o procesos de negocio porque es casi seguro que reducirá el costo de hacer negocios con ese socio comercial. [14]

    Obtención

    Los recursos físicos a menudo requieren un esfuerzo significativo para obtenerlos después de haber sido seleccionados. Tomar un autobús o avión implica coordinar su ubicación y hora actuales con la hora y ubicación en la que el recurso está disponible. Con recursos de información en forma física, obtener un recurso seleccionado generalmente significaba un recorrido por las pilas de la biblioteca. Con recursos de información digital, un motor de búsqueda devuelve una lista de los identificadores de recursos a los que se puede acceder con solo otro clic, por lo que se necesita poco esfuerzo para pasar de seleccionar entre los resultados de la consulta a obtener el recurso primario correspondiente. [15]

    Elaine Svenonius propuso agregar una quinta tarea llamada Navegación a la [16]

    Navegación o Explora

    Si los usuarios no son capaces de especificar sus necesidades de información de una manera que la funcionalidad de búsqueda requiere, deberían poder usar descripciones relacionales y estructurales entre los recursos para navegar de cualquier recurso a otros que podrían ser mejores. Svenonius enfatiza la generalización, agregación y relaciones derivacionales. [17] Pero en principio, cualquier relación o propiedad podría servir como la “carretera” de navegación entre los recursos.

    Lo que algunos autores llaman “metadatos estructurales” se puede utilizar para apoyar las tareas relacionadas de moverse dentro de recursos digitales de varias partes como libros electrónicos, donde cada página podría tener asociada información sobre páginas anteriores, siguientes y otras relacionadas. Documentos descritos utilizando [18]

    Descripción del recurso para apoyar el mantenimiento

    Muchos tipos de descripciones de recursos que admiten la selección (“Descripción del recurso para apoyar la selección”) también son útiles a lo largo del tiempo para apoyar el mantenimiento de un recurso específico y la colección a la que pertenecen. En particular, la información técnica sobre los formatos de recursos y la tecnología (software, computadoras u otros) necesarios para usar los recursos, y la información necesaria para garantizar la integridad de los recursos a menudo se denomina “metadatos de preservación” en un contexto de mantenimiento. [19]

    Las descripciones de recursos que están más exclusivamente asociadas con las actividades de mantenimiento incluyen información de versión y efectividad, o información de vida útil. Los programas de mantenimiento del equipo suelen estar relacionados con el número de millas recorridas (indicado por el odómetro de un automóvil), el número de horas operadas (almacenadas por muchos motores), el número de páginas impresas u otra información fácilmente registrada sobre el uso de recursos o interacciones. Con recursos inteligentes ahora capaces de capturar, analizar y comunicar más datos sobre el rendimiento en tiempo real, ahora es posible una predicción y programación más sofisticadas de los trabajos de mantenimiento. También es más fácil identificar los recursos que no se están utilizando tanto como se esperaba, lo que podría implicar que ya no son necesarios y así pueden archivarse o descartarse de manera segura.

    Descripción del recurso para Sensemaking and Science

    Hasta ahora en “Determinar los propósitos”, hemos discutido cómo se utilizan las descripciones de recursos para realizar tareas bien definidas dentro de un sistema de organización existente. Sin embargo, existe un propósito más amplio y menos definido de descripción de recursos que es más antiguo y fundamental: el uso de descripciones de recursos como materia prima para dar sentido al mundo.

    Durante miles de años, incluso antes de la invención del lenguaje escrito, las personas han recopilado sistemáticamente cosas, información sobre esas cosas y observaciones de todo tipo para entender cómo funciona su mundo. Los humanos paleolíticos hicieron pinturas rupestres que representan los resultados de cacerías y migraciones de animales; los antiguos egipcios registraron las inundaciones anuales del río Nilo en tallas de piedra; y los astrónomos babilónicos, egipcios, chinos y mesoamericanos organizaron observaciones lunares, solares y planetarias como calendarios comenzando hace unos cinco mil años.

    Estos diversos esfuerzos para imponer sentido a la experiencia registrando, analizando, organizando y reorganizando las observaciones pueden describirse colectivamente como “sensemaking”. (Ver la barra lateral, Sensemaking and Organizing.)

    Algunos aspectos de la creación de sentido están cableados por la evolución, lo que ha dado a nuestro cerebro poderosos mecanismos que simplifican y organizan automáticamente los datos perceptuales que obtenemos del mundo (ver la barra lateral Principios Gestalt). Pero esta toma de sentido automática está dominada y amplificada por la toma de sentido intencional.

    La toma de sentido intencional tiene lugar cuando se siguen conscientemente métodos sistemáticos estadísticos, experimentales y científicos para extraer y organizar el conocimiento a partir de colecciones de muestras, observaciones o mediciones. Es fundamental reconocer aquí que los contenidos de estas colecciones representan elecciones hechas sobre qué recolectar, porque la mayoría de las cosas y la mayoría de los fenómenos tienen muchísimas descripciones o propiedades que podrían grabarse sobre ellas.

    Después de que se hayan recolectado cosas o datos, los métodos estadísticos resumen los valores de las propiedades en una colección o conjunto de datos y las relaciones entre ellos. Dar sentido a una sola colección o conjunto de datos determinando las propiedades que contrastan y clasifican las instancias es el comienzo hacia el objetivo más importante de comprender el conjunto o población más grande de la que la colección inicial es solo una muestra. No hay mejor ejemplo de esto que la tabla periódica de elementos desarrollada por Mendeleev en 1869, quien organizó elementos conocidos en base a sus propiedades químicas comunes y luego predijo con éxito algunas propiedades de otras aún no descubiertas.

    Los modelos computacionales desarrollados a partir del conjunto de datos inicial pueden predecir observaciones futuras. Los modelos de clasificación asignan una nueva instancia a una categoría (por ejemplo, mensaje spam o no spam, Madison o Hamilton como autor, escena exterior o interior); los modelos de regresión predicen un valor específico de alguna medición (dada una descripción de una nueva película, ¿cuánto dinero ganará?) ; los modelos de regresión ordinal predicen valores para medidas no métricas (¿cuánto le gustará la película?). Los métodos experimentales para la prueba de hipótesis ayudan a desarrollar y refinar modelos de cualquier tipo variando sistemáticamente las condiciones bajo las cuales se hacen las observaciones para descubrir cómo cambian los resultados en diferentes situaciones.

    Un desafío fundamental en la creación de sentido y modelado es encontrar un equilibrio entre los objetivos en competencia de comprender una colección o conjunto de datos en particular y poder aplicar ese entendimiento a nuevas instancias. Los modelos pueden diferir en el número de descripciones de recursos que utilizan como parámetros, y es fácil y tentador sobreajustar un modelo usando más parámetros que capturan variaciones aleatorias en las observaciones. El sobreajuste produce una precisión espuria en la reproducción de las observaciones originales, pero hace que los modelos sean menos generalizables.

    El nivel más alto de sensemaking es la creación de modelos científicos o teorías que propongan mecanismos interpretables y causales para las observaciones. Y así como la toma de sentido automática crea explicaciones simples, los científicos generalmente prefieren teorías más simples, una heurística conocida como Navaja de Occam, o la ley de la parsimonia. Aunque las teorías complejas a veces pueden ser más precisas, las teorías más simples producen predicciones más comprobables, lo que facilita verificar o refinar la teoría. El famoso principio de Occam, expresado hace ocho siglos, es preferir modelos que hagan la menor cantidad de supuestos, a menudo medidos en términos del número de parámetros o variables necesarios para hacer una predicción. [21] [22] [23]

    Identificación de Propiedades

    Una vez establecidos los propósitos de descripción, necesitamos identificar las propiedades específicas de los recursos que puedan satisfacer esos fines. Hay cuatro razones por las que esta tarea es más difícil de lo que parece inicialmente.

    • Primero, cualquier recurso en particular puede necesitar muchas descripciones de recursos, todas las cuales se relacionan con diferentes propiedades, dependiendo de las interacciones a soportar y el contexto en el que tienen lugar. Seleccionar personas para un equipo de basquetbol se enfoca en sus propiedades físicas como la altura, la fuerza, la capacidad de saltar y la coordinación. Las selecciones para un equipo de debate estarán más preocupadas por sus propiedades verbales e intelectuales.

    • Segundo, los diferentes tipos de recursos necesitan incorporar diferentes propiedades en sus descripciones. Para los recursos de un museo, estos pueden incluir materiales y dimensiones de obras de arte; para archivos y servicios administrados por un administrador de red, estos incluyen permisos de control de acceso; para libros electrónicos o DVD, incluirían la gestión de derechos digitales ( DRM) que expresa lo que se puede y no se puede hacer con el recurso.

    • Tercero, como mencionamos brevemente en “Alcance, Escala y Descripción del Recurso”, qué propiedades participan en las descripciones de los recursos depende de quién esté haciendo la descripción. Tiene poco sentido esperar distinciones e interpretaciones de grano fino sobre las propiedades de personas que carecen de formación en la disciplina de la organización. Volveremos a esta compensación en “Creación de descripciones de recursos” y nuevamente en “Describiendo recursos museísticos y artísticos”.

    • Cuarto, lo que podría parecer la misma propiedad a nivel conceptual podría ser muy diferente a nivel de implementación. Muchos recursos tienen una descripción del recurso que es un sustituto o un resumen del recurso primario. Para fotos, pinturas y otros recursos cuya apariencia es su esencia, una descripción resumida apropiada puede ser una foto más pequeña y de resolución reducida del original. Este sustituto es simple de crear y fácil para los usuarios relacionarse con el recurso principal. Por otro lado, destilar un texto hasta un breve resumen o resumen es una habilidad en sí misma. Los recursos basados en el tiempo brindan mayores desafíos para el resumen. ¿El resumen de una película debe ser un resumen textual de la trama, un clip significativo de la película, un resumen de video o algo más en conjunto?

      Esta brecha de implementación suele ser muy grande para las propiedades sobre las personas porque las personas no son tan fáciles de medir como la mayoría de los tipos de recursos. Las empresas necesitan cuantificar el interés de una persona en sus productos para predecir qué precio estarían dispuestas a pagar, pero el “interés” no se puede medir directamente. En cambio, las predicciones se basan en medidas de proxy para “interés”, como cuánto tiempo miró el cliente la página web del producto y si también miraba la página web de un competidor.

    Dos dimensiones importantes para comprender y contrastar las propiedades de los recursos utilizadas en las descripciones y los principios de organización son: esencia de propiedad, ya sea que las propiedades estén intrínsecamente o extrínsecamente asociadas con el recurso, y; persistencia de propiedades, ya sea las propiedades son estáticas o dinámicas. Tomadas en conjunto estas dos dimensiones producen cuatro categorías de propiedades, como se ilustra en la Figura: Esencia de propiedad x Persistencia: Cuatro Categorías de Propiedades. Estas cuatro categorías proporcionan un marco útil para pensar en las propiedades de los recursos, aunque, a veces, la clasificación de las propiedades sea discutible. [24]

    Esencia de propiedad x persistencia:
    Cuatro Categorías de Propiedades

    Matriz de “Esencia de Propiedad” (Intrínseca vs Extrínseca) y “Persistencia de Propiedad” (Dinámica vs Estática). Aquí se resumen las definiciones y ejemplos del texto.

    Las distinciones de persistencia de propiedad y esencia de propiedad se combinan para distinguir cuatro categorías de propiedades: estática intrínseca, estática extrínseca, dinámica intrínseca y propiedades dinámicas extrínsecas.

    Propiedades estáticas intrínsecas

    Las propiedades intrínsecas o implícitas son inherentes al recurso y a menudo pueden percibirse o experimentarse directamente. Las propiedades estáticas no cambian sus valores con el tiempo. La especie de un animal, el material de composición de una silla de madera y el diámetro de una rueda son todas propiedades estáticas que no cambian sus valores con el tiempo. Las propiedades estáticas como el color o la forma se utilizan a menudo para describir y organizar los recursos físicos.

    Las propiedades físicas intrínsecas suelen ser solo parte de las descripciones de los recursos. En muchos casos, las propiedades físicas describen solo la capa superficial de un recurso, revelando poco sobre qué es algo o su propósito original previsto, qué significa, o cuándo y por qué fue creado. El autor de una canción y el contexto de su creación son otros ejemplos de propiedades intrínsecas y estáticas de los recursos que no son directamente perceptibles.

    Las descripciones intrínsecas a menudo se extraen o calculan mediante procesos computacionales. Por ejemplo, un programa de computadora podría calcular la frecuencia y distribución de palabras en algún documento en particular. Del mismo modo, las firmas visuales o las huellas digitales de audio son descripciones intrínsecas (“Describiendo recursos no textuales”).

    Algunas relaciones entre recursos son intrínsecas y estáticas, como la relación padre-hijo o la relación de hermanos entre dos hijos con los mismos padres. Las relaciones parte-enteras o composicionales para recursos con partes también son propiedades estáticas intrínsecas que se utilizan a menudo en las descripciones de recursos. Sin embargo, es mejor evitar tratar las relaciones de recursos como propiedades, y en su lugar expresarlas como relaciones. Describiendo Relaciones y Estructuras analiza con gran detalle las relaciones semánticas parcialmente enteras y otras relaciones semánticas.

    Propiedades estáticas extrínsecas

    Las propiedades extrínsecas o explícitas se asignan a un recurso en lugar de ser inherentes a él. El nombre o identificador de un recurso suele ser arbitrario pero una vez asignado no suele cambiar. Organizar los recursos según el orden alfabético o numérico de sus identificadores descriptivos es un principio común de organización. Los números de clasificación y las partidas temáticas asignadas a los recursos bibliográficos son propiedades estáticas extrínsecas, así como los números de serie estampados o adjuntos a los productos manufacturados.

    Para los recursos de información que tienen una forma digital, las propiedades de sus versiones impresas o renderizadas pueden no ser intrínsecas. Algunos formatos de texto separan completamente el contenido de la presentación, y como resultado, las hojas de estilo pueden cambiar radicalmente la apariencia de un documento impreso o página web sin alterar el recurso principal de ninguna manera. Por ejemplo, si se aplicara un estilo diferente a este párrafo para resaltarlo en negrita o fundido en fuente de 24 puntos, su contenido seguiría siendo el mismo.

    Propiedades dinámicas intrínsecas

    Las propiedades dinámicas intrínsecas cambian con el tiempo. Características personales del desarrollo como la estatura y el peso de una persona, el dominio de las habilidades o la capacidad intelectual, por ejemplo. Debido a que estas propiedades no son estáticas, generalmente se emplean únicamente para organizar recursos cuya pertenencia a la colección es de duración limitada. Los programas deportivos o ligas que segregan a los participantes por edad o años de experiencia están utilizando propiedades dinámicas intrínsecas para describir y organizar los recursos.

    Propiedades dinámicas extrínsecas

    Las propiedades dinámicas extrínsecas son arbitrarias de muchas maneras y pueden cambiar porque se basan en el uso, el comportamiento o el contexto. El actual propietario o ubicación de un recurso, su frecuencia de acceso, la frecuencia conjunta de acceso con otros recursos, su popularidad actual o prominencia cultural, o su ventaja competitiva sobre los recursos alternativos son propiedades típicas extrínsecas y dinámicas que se utilizan en la descripción de los recursos. Un libro de actualidad descrito como un best seller un año podría encontrarse en el contenedor de ventas de descuento unos años después. El promedio de calificaciones de un estudiante es una propiedad dinámica extrínseca.

    Las propiedades dinámicas extrínsecas son características útiles para los científicos de datos que realizan modelos de predicción o clasificación. Tu ubicación actual, lo que acabas de comprar y el lugar que lo compraste pueden verse como manifestaciones de preferencias y valores inobservables. Las huellas dactilares que se encuentran en el pomo de una puerta en la escena del crimen son una propiedad dinámica extrínseca asociada a la puerta, y detectives inteligentes las analizarían junto con otros recursos de interacción que descubrieron con el objetivo de identificar a la persona para quien las huellas dactilares son propiedades estáticas intrínsecas.

    Muchas relaciones entre recursos son propiedades extrínsecas y dinámicas, como la del mejor amigo.

    Las propiedades contextuales son aquellas relacionadas con la situación o contexto en el que se describe un recurso. Dey define el contexto como “cualquier información que caracterice una situación relacionada con las interacciones entre usuarios, aplicaciones y el entorno circundante. [25] Esta definición abierta implica un gran número de propiedades contextuales que podrían usarse en una descripción; definiciones de contexto más nítidas pueden ser “ubicación + actividad” o “quién, cuándo, dónde, por qué. ” Dado que los cambios de contexto, los descriptores basados en contexto pueden ser apropiados cuando se asignan pero pueden tener persistencia y efectividad limitadas (“Recursos a lo largo del tiempo”); la descripción de un documento como “recepción de una compra reciente” no será útil por mucho tiempo.

    Las citas de un recurso de información por otro son descripciones estáticas extrínsecas cuando están en forma impresa, pero cuando se publican en bibliotecas digitales suele darse el caso de que “citado por” es una descripción dinámica del recurso. Del mismo modo, cualquier enlace particular de una página web a otra es una descripción estática extrínseca, pero debido a que muchas páginas web en sí mismas son altamente dinámicas, también podemos considerar los enlaces como dinámicos también. Las citas y los enlaces web se discuten con más detalle en Describir relaciones y estructuras.

    Los recursos a menudo se describen con propiedades culturales que derivan del lenguaje o cultura convencional, muchas veces por analogía, porque pueden ser altamente evocadores y memorables. [27]

    A veces una descripción cultural sobrevive a su prominencia, perdiendo su poder para evocar otra cosa que no sea desconcierto sobre lo que podría significar. [28]

    Para los chicos de Lego, actuales con las últimas películas de Star Wars, “sable de luz” era solo la descripción obvia para un tubo largo de neón con asa. Sin embargo, alguien que no esté familiarizado con la franquicia de Star Wars podría no entender “sable de luz”, y describiría la pieza de alguna otra manera.

    Diseñando el vocabulario de descripción

    Después de haber determinado las propiedades a utilizar en las descripciones de recursos, necesitamos diseñar el vocabulario descriptivo: el conjunto de palabras o valores que representan las propiedades. “Naming Resources” discutió los problemas de nomenclatura y propuso principios para los buenos nombres, y dado que los nombres son una descripción de recursos muy importante, gran parte de lo que dijimos allí se aplica generalmente al diseño del vocabulario descriptivo.

    Sin embargo, debido a que el vocabulario descriptivo en su conjunto es mucho más que solo el nombre del recurso, necesitamos proponer principios o pautas adicionales para este paso. Además, surgen algunas nuevas preguntas de diseño cuando consideramos todas las descripciones de recursos como un conjunto cuyas descripciones separadas son creadas por muchas personas durante algún período de tiempo.

    Principios de Buena Descripción

    En La Fundación Intelectual de la Organización de la Información, Svenonius propone un conjunto de principios o “directivas para el diseño” de un lenguaje de descripción. [29] Sus principios, enmarcados en el estrecho contexto de las descripciones bibliográficas, generalmente se aplican a la amplia gama de tipos de recursos que consideramos en este libro.

    Comodidad para el Usuario

    Elija términos descriptivos pensando en el usuario; es probable que sean términos de uso común entre el público objetivo.

    Representación

    Utilice descripciones que reflejen cómo se describen los recursos; asuma que las autodescripciones son precisas.

    Suficiencia y Necesidad

    Las descripciones deben tener suficiente información para servir a sus fines y no contener información que no sea necesaria para algún propósito; esto podría implicar excluir algunos aspectos de las autodescripciones que son insignificantes.

    Estandarización

    Estandarice las descripciones en la medida de lo práctico, pero también use alias para permitir términos de uso común.

    Integración

    Prefiere las mismas propiedades y términos para todo tipo de recursos.

    Cualquier conjunto de principios generales de diseño enfrenta dos desafíos.

    • La primera es que la implementación de cualquier principio requiere muchas opciones adicionales y específicas dependientes del contexto para las cuales el principio general ofrece poca orientación. Por ejemplo, ¿cómo se aplica el principio de Estandarización si ya existen múltiples estándares en algún dominio de recursos? ¿Cuál de las normas competidoras debería adoptarse y por qué?

    • El segundo reto es que los principios generales a veces pueden llevar a consejos contradictorios. La recomendación de Conveniencia del Usuario de elegir términos descriptivos de uso común falla si la comunidad de usuarios incluye tanto a personas comunes como a científicos que utilizan términos diferentes para los mismos recursos; ¿cuyo “uso común” debería prevalecer?

    ¿Quién usa las descripciones?

    Centrarse en el usuario de las descripciones. Esta es una idea central que no podemos exagerar porque está implícita en cada paso del proceso de descripción del recurso. Todos los principios de diseño de la sección anterior comparten la idea de que el diseño del vocabulario descriptivo debe centrarse en el usuario de las descripciones. ¿Los recursos que se organizan son personales, para fines personales y en su mayoría privados? En ese caso, las propiedades descriptivas y términos pueden ser altamente personales o idiosincrásicos y aún seguir los principios de diseño.

    De igual manera, cuando los usuarios de recursos comparten conocimientos relevantes, o se encuentran en un contexto en el que pueden comunicarse y negociar, si es necesario, para identificar los recursos, sus descripciones de recursos pueden permitirse ser menos precisas y rigurosas de lo que de otra manera necesitarían ser. Esto ayuda a explicar las curiosas descripciones en la historia de Lego con la que comenzamos este capítulo. Los chicos que jugaban con los bloques se platicaban entre ellos con los Legos frente a ellos. Si no hubieran podido ver los bloques de los que hablaban los demás, o si tuvieran que describir sus juguetes a alguien que nunca antes había jugado con Legos, sus descripciones habrían sido bastante diferentes.

    Más a menudo, sin embargo, las descripciones de recursos no pueden asumir este grado de contexto compartido y deben diseñarse para categorías de usuarios en lugar de usuarios individuales: usuarios de bibliotecas que buscan libros, empleados comerciales o clientes que utilizan catálogos de piezas y productos, científicos analizando los conjuntos de datos de experimentos o simulaciones. En cada una de estas situaciones, las descripciones de los recursos deberán ser entendidas por personas que no las crearon, por lo que el diseño del vocabulario descriptivo necesita ser más deliberado y sistemático para asegurar que sus términos sean inequívocos y suficientes para garantizar una interpretación confiable y libre de contexto. Un solo individuo rara vez tiene la amplitud de conocimiento de dominio y experiencia con los usuarios necesarios para idear un vocabulario descriptivo que pueda satisfacer a diversos usuarios con diversos propósitos. En cambio, muchas personas que trabajan juntas suelen desarrollar el vocabulario descriptivo requerido. Llamamos a los resultados vocabularios institucionales, para contrastarlos con los individuales o culturales. (Discutiremos este contraste más a fondo en Categorización: Describiendo clases y tipos de recursos)

    Todo el mundo sabe algo sobre los árboles, pero algunas personas saben más que otras, y su particular experiencia y perspectiva influyen en cómo describen a los árboles. ¿Qué tipo de propiedades y descripciones utilizarían los universitarios? ¿Por botánicos de investigación? ¿Por paisajistas? ¿Por trabajadores de mantenimiento del parque? ¿Por indígenas que viven en selvas tropicales?

    Algunas descripciones de recursos están diseñadas para ser utilizadas por máquinas, lo que aparentemente reduce la importancia de los principios de diseño que consideran las preferencias del usuario o los usos comunes. Sin embargo, incluso si los recursos son descritos y organizados por algoritmos, cuando las personas necesitan explicar las clasificaciones y predicciones que producen los algoritmos, las descripciones de recursos que son comprensibles y de fácil comunicación son preferibles a las estadísticamente óptimas. Además, los principios de estandarización e integración se vuelven más importantes para la comunicación entre máquinas para permitir un procesamiento eficiente, la reutilización de datos y software, y una mayor interoperabilidad entre los sistemas de organización. [30]

    Vocabularios Controlados y Reglas de Contenido

    Como definimos en “Usar Vocabularios Controlados”, un vocabulario controlado es un conjunto fijo o cerrado de términos descriptivos en algún dominio con definiciones precisas que se utilizan en lugar del vocabulario que la gente usaría de otra manera. Por ejemplo, en lugar de los términos populares para las descripciones de enfermedades o síntomas, los investigadores médicos y los hospitales docentes pueden usar el vocabulario controlado por los Encabezados de Materias Médicas (MeSH) de la Biblioteca Nacional de Medicina. [31]

    Podemos distinguir una progresión del control del vocabulario: un glosario es un conjunto de términos permitidos; un tesauro es un conjunto de términos dispuestos en una jerarquía y anotados para indicar términos que son preferidos, más amplios o más estrechos que otros términos; una ontología expresa las relaciones conceptuales entre los términos en un lenguaje formal basado en la lógica para que puedan ser procesados por computadoras. Diremos más sobre ontologías en Describir relaciones y estructuras.

    Las reglas de contenido son similares a los vocabularios controlados porque también limitan los posibles valores que se pueden usar en las descripciones. En lugar de especificar un conjunto fijo de valores, las reglas de contenido suelen restringir las descripciones exigiendo que sean de un tipo de datos determinado (entero, booleano, fecha, etc.). Los valores posibles están restringidos por expresiones lógicas (por ejemplo, un valor debe estar entre 0 y 99) o expresiones regulares (por ejemplo, debe ser una cadena de longitud 5 que debe comenzar con un número). Las reglas de contenido como estas se utilizan para asegurar descripciones válidas cuando las personas las ingresan en formularios web u otras aplicaciones.

    Control de vocabulario como reducción de dimensionalidad

    En la mayoría de los casos, un vocabulario controlado es un subconjunto del vocabulario natural o incontrolado, pero a veces es un nuevo conjunto de términos inventados. Esto puede sonar extraño hasta que consideremos que el objetivo de un vocabulario controlado es reducir el número de términos descriptivos asignables a un recurso. Dicho de esta manera, el problema es el de la reducción de la dimensionalidad, transformando un espacio de alta dimensión en uno de menor dimensión. La reducción del número de componentes en una descripción multidimensional se puede lograr mediante muchas técnicas estadísticas diferentes que van por nombres como “extracción de características”,análisis de componentes principales”,descomposición ortogonal”,análisis semántico latente”, ” “escalado multidimensional” y “análisis factorial. [32]

    Estas técnicas pueden sonar imponentes y son computacionalmente complejas, pero todas tienen el mismo concepto simple en su núcleo, que las características o propiedades que describen algún recurso suelen estar altamente correlacionadas. Por ejemplo, un documento que contiene la palabra “coche” es más probable que contenga las palabras “conductor” y “tráfico” que un documento que no lo haga. Correlaciones similares existen entre las características visuales utilizadas para describir las imágenes y las características acústicas que describen la música. Las técnicas de reducción de dimensionalidad analizan las correlaciones entre las descripciones de recursos para transformar un gran conjunto de descripciones en un conjunto mucho más pequeño de descripciones no correlacionadas. De alguna manera esto implementa el principio de Suficiencia y Necesidad que mencionamos en “Principios de Buena Descripción” porque elimina dimensiones descriptivas o propiedades que no contribuyen mucho a distinguir los recursos.

    Aquí hay un ejemplo demasiado simplificado que ilustra la idea. Supongamos que tenemos una colección de recursos, y cada recurso descrito como “grande” también se describe como “rojo”, y cada recurso “pequeño” también es “verde”. ” Esta correlación perfecta entre el color y el tamaño significa que cualquiera de estas propiedades es suficiente para distinguir las cosas “rojas grandes” de las “pequeñas verdes”, y no necesitamos algoritmos inteligentes para resolverlo. Pero si tenemos miles de propiedades y las correlaciones son sólo parciales, necesitamos los sofisticados enfoques estadísticos para elegir el conjunto óptimo de propiedades descriptivas y términos, y en algunas técnicas las dimensiones que quedan se denominan “latentes” o “sintéticas” porque son estadísticamente óptimas pero no se asignan directamente a las propiedades de los recursos.

    Diseñar el formulario de descripción

    Por este paso en el proceso de descripción de recursos hemos tomado numerosas decisiones importantes sobre qué recursos describir, los fines para los que estamos describiendo, los mismos, y las propiedades y términos que usaremos en las descripciones. En la medida de lo posible, hemos descrito los pasos a nivel conceptual y pospuesto la discusión de consideraciones de implementación sobre la notación, sintaxis y despliegue de las descripciones de recursos por separado o en paquetes. Separar el diseño de las preocupaciones de implementación es una idealización del proceso de descripción de recursos, pero es más fácil aprender y pensar en la descripción de los recursos y organizar los sistemas si lo hacemos. Discutimos estos temas de implementación en Las formas de descripciones de recursos.

    A veces tenemos que enfrentar tecnología heredada, relaciones comerciales existentes o potenciales, regulaciones, conformidad con estándares, requisitos de desempeño u otros factores que tienen implicaciones sobre cómo las descripciones de recursos deben o deben implementarse, almacenarse y administrarse. Tomaremos esta perspectiva más pragmática en The Organizing System Roadmap, The Organizing System Roadmap, pero hasta entonces, seguiremos enfocándonos en temas de diseño y diferiremos la discusión de las opciones de implementación.

    Creación de descripciones de recursos

    Las descripciones de los recursos pueden ser creadas por profesionales, por los autores o creadores de recursos, por usuarios, o por medios computacionales o automatizados.

    Desde la perspectiva tradicional de la bibliotecología y la ciencia de la información con su énfasis en la descripción bibliográfica, estos modos de creación implican diferentes niveles de complejidad descriptiva y sofisticación; Taylor y Joudrey sugieren que los profesionales crean descripciones ricas, los usuarios no capacitados crean en el mejor de los casos los estructurados y los procesos automatizados crean otros simples.

    Esta clasificación refleja un sesgo disciplinario e histórico más que la realidad. Las descripciones de recursos “simples” son “no más que datos extraídos del propio recurso... el enfoque del motor de búsqueda para organizar la web a través de técnicas de indexación automatizadas. [33]

    Podría ser justo describir una implementación de índice invertido de un modelo booleano de recuperación de información como simple, pero es claramente incorrecto considerar lo que hacen Google y otros motores de búsqueda para describir y recuperar recursos web como simple. [34]

    Una mejor noción de los niveles de descripción de los recursos es aquella basada en la cantidad de interpretación impuesta por la descripción, un enfoque que se centra en las descripciones mismas más que en sus métodos de creación. Discutiremos este tipo de enfoque en “Describiendo los recursos museísticos y artísticos” en el contexto de describir los recursos museísticos y artísticos.

    Las descripciones de recursos creadas profesionalmente, las descripciones creadas por el autor o el usuario y las descripciones computacionales o automatizadas tienen fortalezas y limitaciones que imponen compensaciones. Una solución natural es tratar de combinar aspectos deseables de cada uno en enfoques híbridos. Por ejemplo, el vocabulario para un nuevo dominio de recursos puede surgir del etiquetado por parte de los usuarios finales, pero luego ser refinado por profesionales, los clasificadores laicos pueden crear descripciones con la ayuda de herramientas de software que sugieren posibles términos, o el software que crea descripciones puede mejorarse entrenándolo con humanos- descripciones generadas, una forma de aprendizaje supervisado (ver “Categorías creadas por Clustering”).

    A menudo, las descripciones de recursos existentes pueden o deben transformarse o mejorarse para satisfacer las necesidades continuas de un sistema de organización y, a veces, estos procesos pueden automatizarse. Diferenciaremos la discusión de esas situaciones a Interacciones con Recursos. En la discusión que sigue nos enfocamos en la creación de nuevas descripciones de recursos donde aún no existen.

    Descripción del recurso por profesionales

    Antes de que la web hiciera posible que casi cualquier persona creara, publicara y describiera sus propios recursos y describiera aquellos creados y publicados por otros, la descripción de los recursos generalmente la realizaban profesionales en contextos institucionales. Los indexadores y catalogadores profesionales describieron los recursos bibliográficos y museísticos después de haber sido capacitados para aprender los conceptos, vocabularios descriptivos controlados y los estándares relevantes. En dominios de sistemas de información, analistas profesionales de datos y procesos, escritores técnicos y otros crearon descripciones igualmente rigurosas después de recibir capacitación análoga. Hemos llamado a este tipo de descripciones de recursos institucionales para resaltar el contraste entre las creadas según estándares y las creadas informalmente de manera ad hoc, especialmente por individuos no entrenados o indisciplinados. [35]

    Descripción del recurso por autores o creadores

    Se puede presumir que el autor o creador de un recurso comprende las razones por las cuales y los fines para los que se puede utilizar el recurso. Y, presumiblemente, la mayoría de los autores quieren ser leídos, por lo que describirán sus recursos de manera que atraerán y serán útiles para sus usuarios previstos. Sin embargo, es poco probable que estas descripciones utilicen los vocabularios controlados y estándares que utilizarían los catalogadores profesionales.

    Descripción del recurso por los usuarios

    La web actual contiene una asombrosa cantidad de recursos, la mayoría de los cuales son recursos de información primaria publicados como contenido web, pero muchos otros son recursos que representan recursos físicosen el mundo”. La mayoría de estos recursos están siendo descritos por sus usuarios y no por profesionales o por sus autores. Estos usuarios “en general” suelen crear descripciones para su propio beneficio cuando asignan etiquetas o calificaciones a los recursos web, y es poco probable que utilicen descriptores estándar o controlados cuando lo hacen. [36] La variabilidad resultante puede ser un problema si la creación de la descripción requiere juicio por parte del etiquetador. La mayoría de las personas pueden ponerse de acuerdo sobre la duración de un archivo de música en particular pero pueden diferir enormemente a la hora de determinar a qué género musical pertenece ese archivo. Afortunadamente, la mayoría de los usuarios web reconocen implícitamente que el valor potencial en estas aplicaciones “Web 2.0” o “contenido generado por el usuario” será mayor si evitan descripciones egocéntricas. Además, la estadística de tamaños de muestra grandes conduce inevitablemente a algún acuerdo en las descripciones sobre las aplicaciones más populares porque las descripciones idiosincrásicas están dominadas en la distribución de frecuencias por las más convencionales. [37]

    No estamos sugiriendo que las descripciones profesionales sean siempre de alta calidad y utilidad, y las producidas socialmente siempre son de baja calidad y utilidad. [38] Más bien, es importante comprender las limitaciones y calificaciones de las descripciones producidas en cada sentido. El etiquetado reduce la barrera de entrada para la descripción, haciendo que la organización sea más accesible y creando descripciones que reflejen una variedad de puntos de vista. Sin embargo, cuando muchas etiquetas están asociadas con un recurso, aumenta la memoria mientras disminuye la precisión. (Ver “Descripción del Recurso por Usuarios”)

    Descripción de Recursos Automatizados y Computacionales

    El archivo EXIF de una imagen creado por una cámara digital registra propiedades asociadas a la cámara y sus ajustes, así como algunas propiedades del contexto de toma de fotos. (Ver Figura: Descripciones contrastantes para una obra de arte. para un ejemplo.) Crear esta descripción altamente detallada a mano sería casi imposible. La desventaja, sin embargo, es que la descripción automatizada no captura el significado de la foto; una descripción de imagen automatizada captura la hora y el lugar, pero no que sea una imagen de unas vacaciones de luna de miel. La diferencia entre descripción automatizada y humana se denomina brecha semántica (“La brecha semántica”).

    Cualquier recurso que sea lo suficientemente inteligente como para recopilar datos sobre su estado o entorno está creando descripciones de recursos automáticamente (Consulte “Recursos activos u operantes”). Los recursos con capacidades computacionales pueden procesar los datos del sensor sin procesar para identificar eventos importantes y crear descripciones más interpretables.

    Algunos enfoques computacionales crean descripciones de recursos que son similares en propósito a las creadas por descriptores humanos. La minería de texto y los sistemas de resumen para los comentarios de los clientes sobre los productos pueden reducir miles de comentarios a una lista de las características más importantes. [39] Las personas que compran libros en Amazon.com obtienen información sobre el contenido y la distinción de un libro a partir de las frases estadísticamente improbables que ha identificado comparando todos los libros para los que tiene el texto completo. [40]

    Las descripciones computacionales pueden usar cualquier variable observable o latente (ver la barra lateral, Creación de funciones latentes y Recomendaciones de Netflix) excepto algunas que están prohibidas por la ley, como la raza, la religión, el origen nacional y el estado civil, para evitar la discriminación. En la práctica, sin embargo, esta prohibición se elude fácilmente porque estas propiedades suelen predecirse usando otras. Por ejemplo, la raza a menudo se puede predecir de manera confiable usando la dirección de residencia y el apellido. [41]

    Por supuesto, todos los sistemas de recuperación de información comparan una descripción de las necesidades de un usuario con descripciones de los recursos que podrían satisfacerlas. “Describir los recursos no textuales” y en las interacciones con los recursos.

    Evaluar descripciones de recursos

    La evaluación está implícita en muchas de las actividades de los sistemas de organización que describimos en Actividades en Sistemas Organizadores y es explícita cuando mantenemos una colección de recursos a lo largo del tiempo. En esta sección, nos enfocamos en el problema más limitado de evaluar descripciones de recursos.

    Evaluar significa determinar la calidad con respecto a algunos criterios o dimensiones. Se han propuesto muchos conjuntos diferentes de criterios; para los repositorios de recursos digitales, los más utilizados son la precisión, integridad y consistencia. [42] Otros criterios típicos son la puntualidad, interoperabilidad y usabilidad. Es fácil imaginar estos criterios en conflicto; los esfuerzos por lograr la precisión y la integridad podrían poner en peligro la puntualidad; hacer cumplir la consistencia podría evitar modificaciones y personalizaciones que mejorarían la usabilidad.

    ¿Qué características o criterios utilizaría para determinar la calidad de un automóvil? ¿De comida? ¿De ropa? ¿De un lugar para vivir? ¿Cuáles de estos criterios son específicos de dominio y cuáles se aplican de manera más general a muchos tipos de recursos?

    La calidad del resultado del proceso multipaso propuesto en este capítulo es un compuesto de la calidad creada o despilfarrada en cada paso. Un alcance que sea demasiado granular o abstracto, propósitos demasiado ambiciosos o vagos, un vocabulario descriptivo que sea difícil de usar, o dar a las personas un tiempo inadecuado para crear buenas descripciones pueden causar problemas de calidad, pero ninguna de estas decisiones es visible al final del proceso donde los usuarios interactúan con descripciones de recursos.

    Evaluación de la creación de descripciones de recursos

    Cuando los profesionales crean descripciones de recursos de manera centralizada, lo que durante mucho tiempo ha sido la práctica estándar para muchos recursos en las bibliotecas, existe un enfoque natural en la calidad en el punto de creación para garantizar que se hayan utilizado los vocabularios y estándares controlados apropiados. Sin embargo, la necesidad de descripción de recursos generaliza a dominios de recursos fuera del bibliográfico tradicional, y otras consideraciones de calidad emergen en esos contextos.

    Las descripciones de recursos en las empresas del sector privado son esenciales para administrar el negocio y para interactuar de manera eficiente con proveedores, socios y clientes. En comparación con el sector público, hay mucho mayor énfasis en la economía y la estrategia de descripción de recursos. [43] ¿Cuál es el valor de la descripción del recurso? ¿Quién asumirá los costos de producirlos? ¿Cuál de los estándares de la industria competidora se seguirá? Algunas de estas decisiones no son elecciones libres tanto como son limitaciones impuestas como condición para hacer negocios con un socio económico dominante, que a veces es una entidad gubernamental.

    Por ejemplo, una firma como Wal-Mart con enorme poder de mercado puede dictar términos y estándares a sus proveedores porque los beneficios a largo plazo de un contrato de Wal-Mart generalmente hacen que el alojamiento inicial valga la pena. Asimismo, los gobiernos a menudo requieren que sus proveedores se ajusten a estándares abiertos para evitar el bloqueo de tecnologías patentadas. [44]

    Tanto en el sector público como en el privado hay un mayor uso de técnicas computacionales para crear descripciones de recursos porque el número de recursos a describir es simplemente demasiado grande para permitir una descripción profesional. Una gran cantidad de trabajo en minería de datos de texto, clasificación de páginas web, enriquecimiento semántico y otras áreas de investigación similares ya está en marcha y está disminuyendo significativamente el costo de producir descripciones útiles de recursos. Algunos museos han adoptado enfoques que crean automáticamente descripciones de recursos orientadas al usuario y nuevas interfaces de usuario para la búsqueda y navegación transformando las descripciones profesionales en sus sistemas internos de gestión de colecciones. [45] El ambicioso proyecto de Google para digitalizar millones de libros ha sido criticado por la calidad de sus descripciones de recursos extraídos algorítmicamente, pero podemos esperar que los informáticos pongan el corpus de libros de Google en buen uso como banco de pruebas de investigación para mejorar las técnicas. [46]

    Las aplicaciones Web 2.0 que derivan su valor de la agregación e interpretación de contenido generado por el usuario pueden verse como cediendo voluntariamente su autoridad para describir y organizar recursos a sus usuarios, quienes luego los etiquetan o califican como mejor les parezca. En este contexto la consistencia de la descripción de los recursos, o la falta de ella, se convierte en un tema importante, y muchos sitios están utilizando tecnología o incentivos para guiar a los usuarios a crear mejores descripciones.

    Evaluación del uso de descripciones de recursos

    Independientemente de, o además de, cualquier criterio de calidad aplicado a la creación y selección de descripciones de recursos, en algún momento las descripciones de recursos cumplen con sus usuarios previstos. El criterio de calidad más importante en ese momento es si las descripciones de los recursos satisfacen sus fines previstos de manera utilizable. En muchos sentidos, la respuesta es un no decepcionante.

    Por ejemplo, en una de las primeras revisiones a las descripciones originales de los recursos siguen plagando a los usuarios de la web. (Ver “Curación Social y Web”.)

    El diseño de un vocabulario descriptivo circunscribe lo que se puede decir de un recurso, por lo que es importante reconocer que determina implícitamente lo que no se puede decir también, con consecuencias negativas no deseadas para los usuarios. El esquema de descripción de recursos implementado en el sistema de manejo de pacientes de un médico define ciertos tipos de información registrable sobre la visita de un paciente: la fecha de la visita, cualquier prueba que se ordenó, un diagnóstico que se hizo, una derivación a un especialista. El esquema, y su flujo de trabajo asociado, imponen restricciones que afectan los tipos de información que los profesionales médicos pueden registrar y la cantidad de espacio que pueden usar para esas descripciones. Además, tal esquema también podría eliminar el espacio vital no estructurado que los registros en papel pueden proporcionar, donde los médicos comuniquen sus fundamentos para un diagnóstico o decisión sin tener que encajarlo en ninguna caja en particular.

    Sin embargo, cuando las descripciones de recursos son los datos utilizados para entrenar modelos para predicción o clasificación, el foco de la evaluación no está en las descripciones, que a menudo se supone que son observaciones precisas sobre el mundo. En cambio, la evaluación se centra en el modelo, y la “selección de modelos” es la tarea de elegir cuál de los varios modelos de la competencia se ajusta mejor a los datos originales y, al mismo tiempo, generalizar bien a nuevos datos. En cualquier caso, cualquier problema de calidad o sesgo de selección con los datos originales socavará el valor de cualquier modelo seleccionado.

    La importancia de la evaluación iterativa

    Los inevitables conflictos entre los objetivos de calidad significan que habrá compromisos entre los criterios de calidad. Además, el aumento de la escala en un sistema de organización y las mejoras constantes de las técnicas computacionales para la descripción de recursos implican que la naturaleza del compromiso cambiará con el tiempo. En consecuencia, no bastará con una sola evaluación de las descripciones de los recursos en un momento dado.

    Esto hace que los registros de uso, el historial de navegación y los datos transaccionales sean extremadamente importantes en tipos de descripciones de recursos porque le permiten enfocar sus esfuerzos en mejorar la calidad donde más se necesitan. Además, para organizar sistemas con muchos tipos de recursos y comunidades de usuarios, esta información puede permitir la adaptación de la naturaleza y extensión de la descripción de los recursos para encontrar el equilibrio adecuado entre enfoques “ricos e integrales” y “simples y eficientes”. Cada combinación de tipo de recurso y comunidad de usuarios puede tener una solución diferente.

    La idea de que la calidad es propiedad de un proceso de extremo a extremo está plasmada en el “movimiento de calidad” y el control estadístico de procesos para procesos industriales, pero se aplica igualmente bien a la descripción de los recursos. La idea central es que la calidad no puede probarse inspeccionando los productos finales. En cambio, la calidad se logra a través del control de procesos, midiendo y eliminando la variabilidad de cada proceso necesario para crear los productos. [47] Los comentarios explícitos de los usuarios o los comentarios implícitos de los registros de sus necesidades de interacción con los recursos son esenciales a medida que iteramos a través del proceso de diseño y revisamos las decisiones que allí se toman.


    1. Debido a que el esquema de base de datos relacional sirve como modelo para la creación de descripciones de recursos, está diseñado para restringir las descripciones para que sean conjuntos simples y completamente regulares de pares atributo-valor. El esquema de la base de datos especifica la estructura general de las tablas y especialmente sus columnas, las cuales contendrán los valores de atributo que describen cada recurso. Una tabla de empleados puede tener columnas para los atributos de identificación del empleado, fecha de contratación, departamento y salario. Un atributo de fecha se restringirá a un valor que sea una fecha, mientras que el salario de un empleado se restringirá de acuerdo a los rangos salariales establecidos por el departamento de recursos humanos. Esto convierte el nombre del atributo y las restricciones en los valores de atributo en descripciones de recursos que se aplican a toda la clase de recursos descrita por la tabla.

      A menudo es necesario asociar algunas descripciones con recursos individuales que son específicos de esa instancia y otros tipos de descripciones que reflejen la clase abstracta a la que pertenece la instancia. Cuando un automóvil típico sale de la línea de montaje, solo tiene una descripción a nivel de instancia que lo diferencia de sus pares: su número de identificación del vehículo (VIN). Los autos específicos tienen colores interiores y exteriores individualizados y opciones instaladas, y todos tienen fecha y lugar de fabricación. Otros elementos descriptivos tienen valores que se comparten con muchos otros autos del mismo modelo y año, como el precio sugerido y los paquetes de opciones adicionales, o configuraciones que se le pueden aplicar antes de que se entregue a un cliente. Alternativamente, cualquier información descriptiva que se aplique a varios autos del mismo año modelo podría ser parte de una descripción de recursos en ese nivel al que se hace referencia en lugar de duplicar en las descripciones de instancias.


    2. Los servicios web generalmente se implementan utilizando (Erl 2005b), especialmente el Ch. 3, Introducción a las Tecnologías de Servicios Web.


    3. Crear descripciones que puedan seguir el ritmo del crecimiento de una colección ha sido un problema para los bibliotecarios durante años, ya que las bibliotecas pasaron de describir simplemente “lo que sea que haya encontrado con el escritorio de un catalogador” a catalogar recursos para una audiencia nacional e incluso internacional (Svenonius 2000, p. 31).


    4. La AACR2 incluye reglas para libros, folletos y hojas impresas; materiales cartográficos; manuscritos y colecciones de manuscritos; música; grabaciones sonoras; películas y grabaciones de video; materiales gráficos; recursos electrónicos; artefactos 3-D; microformas; y recursos continuos . El Conciso (Gorman 2004). Los vocabularios de Descripción de Recursos y Acceso (RDA) son los sucesores de AACR2 y hacen distinciones aún más finas entre los tipos de recursos. Consulte el contenido de RDA, los medios y las listas de valores del operador.


    5. También podemos ver el Dublin Core como parte de los fundamentos intelectuales para el “crowdsourcing” o “comisariado comunitario” de descripciones de recursos por parte de no profesionales (“Curación social y web”). Consulte la Dublin Core Metadata Initiative (DCMI) en http://dublincore.org/.


    6. La “franqueza” semántica de un vocabulario minimalista se ilustra con los ejemplos para el uso del elemento “creador” en una guía oficial del usuario Dublin Core (Hillmann 2005) que muestra “Shakespeare, William” y “Hubble Telescopio” como creadores.


    7. El procesador Intel Core 2 Duo tiene especificaciones detalladas (http://www.intel.com/products/processor/core2duo/specifications.htm) y siete categorías de documentación técnica: notas de aplicación, hojas de datos, guías de diseño, manuales, actualizaciones, componentes de soporte y blanco ponencias (http://www.intel.com/design/core2duo/documentation.htm).


    8. Los anuncios inmobiliarios son conocidos por sus descripciones creativas; lo más probable es que una casa “conveniente para el transporte” esté al lado de una autopista ruidosa, y una casa en un “lugar apartado” está en una parte remota y desolada de la ciudad.


    9. En sus primeros días. cuando los consumidores estadounidenses generalmente desconocían que Sony era una compañía japonesa y la calidad de los productos japoneses se veía de manera negativa, Sony haría que la etiqueta “Made in Japan” fuera tan discreta como pudiera salirse con la suya. (Juan 1999)

      En el verano de 2015, la organización de defensa del consumidor Truth in Advertising informó haber encontrado en el sitio web de Walmart más de 100 descripciones de productos que presentaban incorrectamente los productos como hechos en Estados Unidos. (Ver https://www.truthinadvertising.org/walmart-made-in-usa/)


    10. Los hallazgos de un estudio de cuatro servicios de citas en línea (Toma et al 2008) encontraron que 81% de las personas mintieron sobre al menos una característica. Los hombres tenían más probabilidades de mentir sobre la altura, mientras que las mujeres mintieron más sobre el peso, y cuanto más lejos estaban sus alturas y pesos reales de la media, más mintieron. Un estudio posterior (Hall et al 2010) confirmó el hallazgo para las mujeres y el peso, pero también encontró que los hombres son muy propensos a tergiversar sus bienes personales.


    11. Nos encontramos con FRBR varias veces en capítulos anteriores, especialmente en “Identidad y recursos bibliográficos”, donde preguntamos “¿Qué es esto que llamamos 'Macbeth'? ” y que describe la jerarquía de abstracción de cuatro niveles FRBR de la obra, representada en Figura: La Jerarquía de Abstracción FRBR.

      El marco FRBR es la formalización más reciente de los propósitos de descripción de recursos que se inició en las bibliotecas del siglo XIX. Esta larga historia significa que no es de extrañar que la forma en que pensamos sobre la descripción de los recursos siga mostrando cierto sesgo hacia las interacciones con los recursos bibliográficos físicos y las descripciones necesarias para obtenerlos.

      Hay tres miembros de la “familia FRBR. ” Un miembro es las “entidades del Grupo 1—Trabajo, Expresión, Manifestación y Elemento que se utilizan para definir clases de productos intelectuales y sus relaciones entre sí. Las “entidades del Grupo 2” son responsables de la creación o custodia de las entidades del Grupo 1: Persona, Familia y Cuerpo Corporativo. El modelo y requisitos del Grupo 2 se han desarrollado más como los Requisitos Funcionales para Datos de Autoridad (FRAD) para permitir a los catálogos responder preguntas sobre las relaciones entre entidades corporativas o colaboradores; ver http://www.ifla.org/publications/fun...authority-data y http://archive.ifla.org/VII/d4/wg-franar.htm#Authority. Las “entidades del Grupo 3” son las descripciones de materias para el Grupo 1 y el Grupo 2; consulte los Requisitos Funcionales para los Datos de Autoridad del Sujeto (FRSAD) en http://www.ifla.org/node/1297.

      Para los recursos bibliográficos estas interacciones y los modelos de descripciones de recursos necesarios para apoyarlos se han formalizado como los Requisitos Funcionales para Registros Bibliográficos (FRBR). Nos encontramos con “Recursos Bibliográficos, Componentes de Información y “Cosas Inteligentes” como Recursos) donde preguntamos “¿Qué es esto que llamamos 'Macbeth'? ” y describió la obra.


    12. En el ambiente muy ocupado y peligroso de una cubierta de vuelo de portaaviones, los marineros visten chalecos y camisas codificadas por colores para sus trabajos. Por ejemplo, las camisas rojas manejan municiones, las camisas moradas manejan combustible, las camisas verdes corren las catapultas y ganchos que lanzan y aterrizan los jets, y las camisas amarillas manejan los vuelos. El color lo hace más rápido y requiere menos atención para que las personas vean si las personas adecuadas están donde se supone que deben estar

      La carta oficial de colores Navy para el personal de portaaviones está disponible en www.navy.mil/navydata/ships/carriers/rainbow.asp

      Un principio similar se usa en algunos deportes; los porteros usan camisetas de diferentes colores para facilitar el cumplimiento de reglas específicas de posición, y los mariscales de campo de fútbol usan camisetas de práctica distintivas para recordar a los jugadores defensivos que no los aborden y posiblemente lastimarlos.

      Cabe señalar que el daltonismo afecta aproximadamente al 7% de la población.


    13. La organización sin fines de lucro Creative Commons define seis tipos de licencias de derechos de autor que difieren en la medida en que permiten usos comerciales o modificaciones de un recurso original (ver http://creativecommons.org/licenses/). La aplicación para compartir fotos en Flickr es un buen ejemplo de un sitio donde una búsqueda de recursos reutilizables puede utilizar las licencias Creative Commons para filtrar los resultados (http://www.flickr.com/creativecommons/).


    14. El uso de los mismos estándares para describir productos o especificar la ejecución de procesos de negocio puede facilitar la implementación y operación de modelos de negocio intensivos en información, ya que la información puede fluir entre servicios o empresas sin intervención humana. A su vez, esto permite que el negocio se vuelva más impulsado por la demanda o los eventos en lugar de impulsado por el pronóstico, lo que lo convierte en una empresa más “adaptativa, “ágil” o “bajo demanda”. Véase (Glushko y McGrath 2005), especialmente el capítulo 5, Cómo evolucionan los modelos y patrones.


    15. Para nuevos recursos, el costo intensivo de mano de obra de la descripción bibliográfica tradicional es menos justificable cuando se puede seguir un enlace desde la descripción de un recurso hasta el recurso digital que describe y decidir rápidamente su relevancia. Es decir, los motores de búsqueda web demuestran que el análisis algorítmico del contenido de los recursos de información puede hacer que se autodescriban en un grado significativo, reduciendo la necesidad de descripción bibliográfica.


    16. Ver el modelo de referencia de la biblioteca FRBR


    17. (Svenonius 2000, páginas 18-19).


    18. Definitive XSLT y XPath (Holman 2001) de Ken Holman es el libro para comenzar con XPath, y nadie ha enseñado a más gente sobre XPath que Holman. Las primeras cinco horas de un curso en video de 24 horas sobre Transformación Práctica Usando XSLT y XPath está disponible de forma gratuita en www.udemy.com/practical-transformation-using-xslt-and-xpath.


    19. (PREMIS 2011). El estándar de estrategias de implementación de metadatos de preservación (PREMIS) para los metadatos de preservación es mantenido por la Biblioteca del Congreso de Estados Unidos en http://www.loc.gov/standards/premis/. Un buen lugar para comenzar es el Diccionario de Datos PREMIS 2011 (http://www.loc.gov/standards/premis/v2/premis-2-1.pdf).


    20. (Lockyer 1893) y (Campana 1970)

      La historia conjunta de la recolección de datos de Brahe y el análisis y teorización de Kepler se cuenta de manera entretenida en (Ferguson 2002). Un análisis igualmente fascinante que interpreta los cambios conceptuales de Kepler con un modelo de razonamiento analógico es (Gentner et al., 1997).


    21. El concepto de sensemaking se originó a partir de la investigación de la escuela de negocios en la gestión y la teoría organizacional (Weick 1995) pero ha sido ampliamente empleado por etnógrafos en muchos contextos, incluyendo salas de emergencia, aulas con estudiantes minoritarios, inspecciones de seguridad aérea y delincuencia investigación. Ver (Weick 2005) y (Chater 2016)


    22. La navaja de Occam tiene una larga tradición en filosofía científica, pero algunas personas han argumentado que está sobrevalorada como heurística por elegir entre explicaciones o teorías alternativas, particularmente porque depende de cómo definas la simplicidad.


    23. Una forma de hacer más útil la simplicidad como guía para elegir entre modelos matemáticos es penalizar explícitamente aquellos que son más complejos añadiendo error a las predicciones, técnica que los informáticos han dado el nombre no intuitivo de regularización. Esta penalización requiere que los modelos complejos sean significativamente mejores para explicar los datos que los más simples porque tienen que superar los errores agregados.


    24. Por ejemplo, la composición de una silla se presenta aquí como una propiedad intrínseca estática, pero de hecho una silla de madera podría deteriorarse con el tiempo como resultado de la exposición a la luz solar, calor o agentes biológicos que la atacan. Una habilidad puede considerarse intrínseca y dinámica, pero también puede ser altamente dependiente del contexto, haciéndola extrínseca. La categoría temática asignada a un libro es extrínseca y estática, pero si se revisa el sistema de clasificación el libro podría ser reclasificado. Finalmente, si bien la ubicación de un recurso puede ser extrínseca y dinámica, el historial de ubicación del recurso en algún momento específico es un hecho, una propiedad intrínseca y estática.


    25. (Dey 2001) define además el “entorno” del contexto como lugares, personas y cosas, y para cada una de las “entidades” hay cuatro categorías de información de contexto: ubicación, identidad, estado (o actividad) y tiempo. Este marco produce así 12 dimensiones para describir el contexto de un entorno.


    26. Una historia fascinante sobre el diseño y uso que hace Netflix de decenas de miles de subgéneros cinematográficos en su sistema de recomendación es (Madrigal 2014).


    27. Considera cuántos eventos se nombran al agregar un sufijo “-gate” para dar a entender que está ocurriendo algo escandaloso o poco ético que se está encubriendo. Esta descripción cultural no tiene sentido de inmediato para nadie que desconozca el allanamiento en la sede de la sede del Comité Nacional Demócrata en el hotel Watergate y el posterior encubrimiento que llevó a la renuncia del presidente estadounidense en 1974 Richard Nixon. Una lista de eventos “-gate” se mantiene en http://en.Wikipedia.org/wiki/List_of_scandals_with_%22-gate%22_suffix.


    28. (http://en.Wikipedia.org/wiki/Holbein_carpet).


    29. (Svenonius 2000, Ch. 5).


    30. (Laskey 2005).


    31. http://www.ncbi.nlm.nih.gov/mesh/.


    32. No podemos citar todas las estadísticas matemáticas en una breve nota al final, pero si te inclinas a aprender más, (Mardia, Kent y Bibby 1980) y (Lee y Verleysen 2007) son los recursos más gentiles y gentiles. Si miramos muy generosamente la “reducción de dimensionalidad” podríamos incluso considerar el paso de indexación de eliminar las “palabras de parada” como una forma de reducción de la dimensionalidad. Las palabras de parada aparecen con una frecuencia tan alta que no tienen poder discriminatorio, por lo que se descartan de las consultas y no forman parte de la descripción de los documentos indexados.


    33. (Taylor y Joudrey 2009), p. 91.


    34. Consulte el capítulo 4 de (Buttcher, Clarke y Cormack 2010) para obtener una descripción de un modelo simple de recuperación de información booleana y los capítulos 14 y 15 para obtener descripciones de los de la escala de Google. Para una discusión popular del algoritmo de Google ver (Levy 2010).


    35. Muchos sistemas de organización institucional están sujetos a una única autoridad centralizada o gubernamental que puede imponer principios para describir y ordenar los recursos. Ejemplos de sistemas de organización donde los recursos se describen usando principios centralizados estándar son:

      Bibliotecas que utilizan estándares bibliográficos nacionales para satisfacer los requisitos establecidos por asociaciones de la industria u otros organismos de acreditación como la Asociación de Bibliotecas Universitarias y de Investigación (ACRL). (http://ala.org/acrl)

      Empresas que siguen los estándares de la industria para información o modelos de proceso, clasificación de productos o identificación para ser elegibles para negocios gubernamentales (Shah y Kesan 2006).

      Documentos legislativos conformes a las normas nacionales o comunitarias de estructura, denominación y descripción (Biasiotti 2008).

      La Corporación de Nombres y Números Asignados de Internet (ICANN) y sus políticas para operar el Sistema de Nombres de Dominio (DNS) hacen posible que cada sitio web sea localizado usando su nombre lógico (como “berkeley.edu” en lugar de usar un www.icann.org/)

      En otros dominios múltiples organizaciones o instituciones tienen la autoridad para imponer principios de descripción de recursos. En ocasiones esta autoridad deriva de la colaboración voluntaria de múltiples partidos autónomos que establecen y se ajustan a normas porque se benefician de poder compartir recursos o información sobre recursos. Ejemplos de sistemas de organización donde se describen recursos utilizando principios descentralizados estandarizados son:

      Empresas que establecen estándares para toda la compañía para sus recursos de información, generalmente incluyen la organización y administración del contenido fuente, modelos de tipo de documento y una guía de estilo que se aplica a documentos impresos y web.

      Empresas que participan en los consorcios de la industria OASIS (http://www.oasis-open.org/) o del W3C (http://www.w3.org/) para establecer especificaciones o recomendaciones técnicas para sus sistemas de información o servicios web).


    36. Muchos sistemas organizadores describen y organizan sus recursos físicos o de información de manera ad hoc porque la persona o institución que determina el arreglo es completamente autónoma. Este es el dominio de los sistemas de organización abrazados por David Weinberger en Everything is Miscellaneous (Weinberger 2007).


    37. (Sen et al. 2006) analizan los efectos de cuatro algoritmos de selección de etiquetas utilizados en sitios que permiten etiquetas de usuario sobre la evolución del vocabulario (más a menudo llamada “convergencia de etiquetas” en la literatura), la utilidad de etiquetas, la adopción de etiquetas y la satisfacción del usuario.


    38. Pero en un ensayo frecuentemente citado (Doctorow, 2001) titulado provocativamente Metacrap: Poniendo la antorcha a siete hombres de paja de la meta-utopía, Cory Doctorow sostiene que gran parte de los metadatos creados por humanos son de baja calidad porque” la gente miente, la gente es perezosa, la gente es estúpida, la misión es imposible —conócete a ti mismo, los esquemas no son neutrales, las métricas influyen en los resultados, (y) hay más de una manera de describir algo.


    39. (Hu y Lui 2004).


    40. www.amazon.com/gp/search-inside/sipshelp.html/.


    41. El título lo dice todo: Análisis predictivo: El poder de predecir quién hará clic, comprará, mentirá o morirá. (Siegel 2013). La técnica de apellido bayesiano y geocodificación para predecir la raza es descrita por (Elliott et al. 2008).


    42. (Parque 2009).


    43. Sin embargo, estas preocupaciones son cada vez más importantes en el sector público. En particular, muchas universidades públicas en Estados Unidos están luchando con recortes en los fondos estatales y federales que están afectando los servicios y prácticas bibliotecarias.


    44. De manera más general, los economistas utilizan el concepto de “modo de intercambio” en una relación comercial para incluir los procedimientos y normas que rigen el comportamiento rutinario entre socios comerciales. Un modo de “salida” es aquel en el que el comprador hace poco compromiso a largo plazo con un proveedor, y los problemas con un proveedor hacen que el comprador encuentre uno nuevo. En contraste, en el modo “voz” hay mucho mayor compromiso y comunicación entre las partes, generalmente conduciendo a procesos y diseños mejorados. Véase (Helper y McDuffie 2003).


    45. (Schmitz y Black 2008).


    46. (Nunberg 2009) calificó la calidad de los metadatos de Google como “un desastre para los académicos”, pero (Sag 2012) argumenta que las “obras huérfanas” que de otro modo se descuidaban en el corpus de Google son “muelas para el molino de datos.


    47. El “movimiento de calidad” moderno surgió de los esfuerzos de Estados Unidos para reconstruir Japón después de la Segunda Guerra Mundial y su “Biblia” fue el Manual de Control de Calidad de Juran de 1951 (Juran 1951).



    This page titled 5.3: El proceso de descripción de recursos is shared under a not declared license and was authored, remixed, and/or curated by Robert J. Glushko.