La iniciativa de archivos abiertos (Open Archive Initiative – OAI)

La Iniciativa de Archivos Abiertos (OAI) proporciona la arquitectura y especificaciones técnicas necesarias para que productores y distribuidores de documentos de acceso abierto pongan a disposición de agregadores de contenidos metadatos sobre los documentos que almacenan con objeto de hacerlos visibles y accesibles a los investigadores.

OAI viene a solucionar el problema de la dispersión de los documentos en múltiples depósitos institucionales, temáticos, revistas individuales, portales de revistas electrónicas, etc. Desde el punto de vista del investigador, hace posible la integración de documentos de una misma temática, área geográfica, tipología, etc. en una única herramienta que es capaz de proporcionarle, además, una serie de valores añadidos, como selección, búsqueda e identificación, evaluación, etc.

OAI surgió a finales de los años noventa a partir de los servidores de documentos en acceso abierto que habían aparecido en distintas disciplinas científicas: arXiv en Física, RePEc en Economía, CogPrints en Psicología, NCSTRL en Informática y NDLTD para tesis. Su objetivo inicial fue estudiar la interoperatibilidad de los distintos servidores con objeto de facilitar el intercambio de datos entre los mismos. El nacimiento de la iniciativa se sitúa en la Convención de Santa Fe celebrada en la ciudad norteamericana del mismo nombre en Octubre de 1999.

La iniciativa se concretó en un protocolo para la comunicación de metadatos denominado OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) cuya primera versión apareció en Enero de 2001. Aunque inicialmente se creó para ser aplicado a depósitos de documentos en acceso abierto muy pronto se vio que podía implementarse sobre cualquier sistema que requiriese la comunicación de metadatos. Esto hizo afirmar, con cierta euforia, a alguno de los creadores del mismo que OAI-PMH estaba llamado a ser a las bibliotecas digitales lo que http había sido a la web.

Podríamos señalar tres características fundamentales del protocolo:

Simplicidad: Se concibió bajo la premisa de la sencillez. Conscientes de los problemas de implementación que habían tenido otras iniciativas anteriores como Z39.50 o Dients, los creadores buscaron una fórmula simple que estuviera al alcance de cualquier potencial implementador.

Normalización: Basado en estándares ampliamente utilizados en Internet como son el protocolo http (HiperText Transport Protocol) para la transmisión de datos y órdenes y XML (Extended Markup Language) para la codificación de los metadatos.

Recolección. Frente a otros sistemas de agregación de contenidos como la búsqueda distribuida (Z39.50) o los sistemas de sindicación de contenidos vía RSS, OAI-PMH ha optado por la recolección de metadatos. En este caso, existe una entidad que pone a disposición de los interesados información bibliográfica sobre los documentos que almacena. Estos, normalmente agregadores de contenidos, recogen periódica y sistemáticamente todos o parte de los metadatos expuestos para, localmente, implementar servicios de valor añadido.

OAI-PMH sigue el principio de que existen múltiples proveedores de datos (PD) que comparten información con múltiples proveedores de servicios (PS) a través de un protocolo común. Los primeros son los depósitos de documentos que proporcionan los metadatos de los documentos que almacenan y los segundos son los recolectores o agregadores de contenidos, que toman los datos con el objetivo de incorporarles algún valor añadido y presentarlos a los usuarios finales. Entre los valores añadidos que se pueden ofrecer tenemos: sistema de búsqueda e identificación, filtrado, alertas temáticas, medición del uso e impacto de los documentos, etc.

Es importante matizar que OAI-PMH trata exclusivamente de la comunicación de metadatos, no de los textos completos de los documentos que se referencian.