La versión 3 de DSpace lleva casi un año en funcionamiento, pero aún hay pocas instalaciones que la incorporen. Sabemos que la migración es costosa y mucha gente opina aquello de “si funciona no lo toques”, pero creemos que esta versión incorpora tantas mejoras que merece la pena probarla.
No vamos a valorar porqué se ha pasado de la versión 1.8 a la 3, y teniendo en cuenta que las versiones 3.1 y 3.2 solo resuelven bugs respecto a la 3.0, vamos a listar de forma bastante completa (aunque no exhaustiva) las principales mejoras de la versión 3:
- La herramienta Discovery junto con el motor de búsqueda y navegación Solr: además de las búsquedas, controla los índices y las estadísticas, ya existía en versiones anteriores, pero en ésta se da un salto cualitativo:
- En la interfaz XMLUI, se han mejorado muchos aspectos:
- Búsqueda más potente, por filtros (facetada), como la usada por Amazon.
- Búsqueda y agrupación dinámica.
- Documentos relacionados con los resultados.
- Términos de la búsqueda resaltados en el resultado.
- Los ítems restringidos no aparecen en las búsquedas, solucionando un problema que daba muchos quebraderos de cabeza.
- Además, y muy importante, ahora se puede instalar en la interfaz JSPUI. Aquellos que no quieren deshacerse de esta interfaz, vale la pena que la prueben.
- Navegación mejorada:
- Se pueden usar los índices de Solr, más eficientes que los almacenados en base de datos.
- Se indica el número de ítems en la navegación por autor, palabra clave… tanto en la interfaz XMLUI como JSPUI.
Aún teniendo activado Discovery, el motor de búsqueda anterior (Lucene) no desaparece, pudiendo dar resultados desconcertantes en alguna ocasión.
- En la interfaz XMLUI, se han mejorado muchos aspectos:
- La nueva versión 2.0 del protocolo OAI-PMH (Open Archives Initiative -Protocol Metadata Harvesting), que incluye:
- Nueva interfaz web, el resultado de las consultas se muestra de forma más amigable, en forma de web, por la que podemos navegar.
- Cumple por defecto con las directivas europeas Driver y OpenAire. Aquellos que tenéis que adaptar vuestro repositorio a estas directivas estáis de enhorabuena. Ya no es necesario instalar y adaptar el plugin OAIExtended, ya que se generan automáticamente los set virtuales, filtros y transformaciones para Driver y OpenAire.
- Los metadatos se exportan a 12 formatos, pudiéndose generar otros fácilmente mediante XSLT, por ejemplo el esquema ESE v.3.4, exigido por Europeana.
- Funciona con Solr, mejorando el rendimiento.
- Además, gracias al almacenamiento en caché, los resultados son mucho más rápidos.
- Las estadísticas basadas en Solr:
- Ahora se generan estadísticas de flujos de trabajo y de términos de búsqueda.
- El rendimiento se ha optimizado.
Como nadie es perfecto, las estadísticas del sistema se generan a la antigua usanza, mediante el procesado de los logs, aunque se han añadido utilidades para el tratamiento de grandes ficheros de log.
- Herramientas de importación por lotes de formatos bibliográficos, que soportan Endnote, BibTex, RIS, TSV, CSV.
- Envíos basados en tipos: en los formularios de envío hasta ahora, para diferenciar los envíos por tipo de objeto, era necesario definir colecciones diferenciadas y adaptar el formulario a cada colección. Ahora podemos mostrar u ocultar metadatos en función del tipo de contenido enviado. Esperábamos que funcionase con tecnología Ajax y Javascript, pero no es así, es necesario que el tipo de objeto se defina en una página del formulario y en la siguiente los metadatos dependientes, por ejemplo, en una página definimos “type” y en la siguiente “article_type”, que solo aparecerá cuando el objeto sea un “artículo”.
- Vocabularios controlados (en interfaz XMLUI), que permite evitar el uso de descripciones libres y su ambigüedad, definiendo un conjunto de palabras clave organizadas en árbol (taxonomías).
- Google Analytics funciona con JSPUI, introduciendo la clave en el fichero de configuración.
- Embargo avanzado (en la interfaz XMLUI):
- Restricciones basadas en tiempo para metadatos y bitstreams.
- Restricciones avanzadas para grupos de usuarios.
- Versionado a nivel de ítem (en interfaz XMLUI):
- Crea y preserva diferentes versiones de los ítems.
- Genera diferentes identificadores para cada versión, pudiendo citar una versión particular. Sólo la versión más reciente se muestra en los resultados de las búsquedas.
- Nuevo tema móvil: la interfaz XMLUI permite definir un tema que adapta su visualización en los dispositivos móviles. Está aún en fase beta, pero vale la pena probarlo ya que el uso de estos dispositivos está aumentando significativamente.
- Estadísticas ElasticSearch: podemos elegir entre las estadísticas con Solr y las que usan ElasticSearch. El módulo complementario ElasticSearch Usage Statistics, permite que:
- Otras mejoras que aportan las versiones 3.x, previa configuración (algunas ya existían en versiones anteriores, y en ésta se perfeccionan):
- Incorpora controles para mejorar la calidad de los metadatos (tareas de curación o Curator Tasks): comprobación de urls, metadatos obligatorios, formato de los ficheros añadidos, escáner de virus… y la posibilidad de generar controles propios.
- Extrae texto de más formatos para poder indexar los contenidos a texto completo, como por ejemplo Powerpoint.
- Incorpora la exposición mejorada a Google Scholar de los contenidos.
- Simplifica la instalación en diferentes entornos mediante build.properties: se puede instalar DSpace con diferente configuración y en diferentes entornos (desarrollo, producción, etc), simplemente cambiando este archivo.
Próximamente hablaremos con más detalle de alguna de estas características, como por ejemplo la configuración de Discovery y Solr.