jueves, 19 de mayo de 2011

XML y su relación con los SGI

El XML (eXtensible Markup Language) es un metalenguaje de marcado subconjunto de SGML (lenguaje predecesor al XML). Utiliza una sintaxis para crear lenguajes declarativos. Fue desarrollado por el W3C. Es multiplataforma, es decir, no sólo es aplicable en Internet. Está orientado a la descripción de la estructura y la semántica de los diferentes componentes de los documentos. Además, es libre y gratuito. La estructura de un documento XML es jerárquica o de árbol, contiene elementos relacionados entre sí distribuidos por niveles a lo largo del documento, cada elemento puede contener otros elementos:

  • Cada elemento se denomina nodo
  • El nodo principal se denomina raíz
  • Los nodos, dicho antes, se organizan por niveles
  • Los nodos que contienen otros nodos se denominan nodos padre
  • Los nodos que dependen de otro nodo superior se denominan nodos hijo
  • Los nodos de nivel superior se conocen como ascendentes
  • Los nodos de nivel inferior se conocen como descendientes
Ejemplo:



Los elementos son extensibles para insertar más información y siguen una jerarquía de relaciones. El contenido puede ser simple (texto), mixto (elemento+texto) o vacío. Estos elementos se les señala mediante etiquetas, que consisten en una marca hecha en el documento, que señala una porción de éste como un elemento. Un pedazo de información con un sentido claro y definido. Las etiquetas tienen la forma <nombre>, donde nombre es el nombre del elemento que se está señalando.

Un documento XML con una sintaxis correcta es un documento bien formado. Si además este documento bien formado se adapta a las normas de un DTD (Document Type Definition) asignado para él, se dice que es válido. 

Un DTD defina la tipología de marcas que pueden existir en un documento XML y sus relaciones dentro del mismo documento. Los parsers (analizador sintáctico que convierte el texto de entrada en otras estructuras, comúnmente árboles) de validación analizan la estructura del documento con las reglas de un DTD, validándola o interrumpiendo el proceso.

Una vez etiquetado nuestro documento XML, damos paso al XSL (eXtended Stylesheet Language). Es un lenguaje para transformar y dar formato a los datos de un documento XML. Sirve también para definir partes y diseños XML y para formatear documentos XML. Es necesario transformar para tener una capa de presentación para hacer "amigable" la visualización de la información XML

Ejemplo de XML:



XML y SGI:

En archivística, se emplea el EAD (Encoded Archival Description), que es la representación digital de un instrumento de descripción archivístico: catálogo, etc. Guarda correspondencia con los elementos de descripción de la ISAD-G

Ejemplos: 

El proyecto "A National Database of Electronic Finding Aids for Australian Literacy Manuscript Collections" (http://www.library.uwa.edu.au/research/rief) es un proyecto en el que participan seis bibliotecas australianas, bajo la dirección de la University of Western of Australia, con el objetivo de construir una base de datos nacional de instrumentos de descripción (guías electrónicas) codificados con EAD de las colecciones de manuscritos de literatura australiana. El proyecto persigue mejorar el acceso de los investigadores a una información consistente y detallada sobre las colecciones de manuscritos australianos; y se creó para ser el primer uso conjunto significativo del formato EAD en Australia con la intención de actuar como sitio demostrativo de la capacidad de este formato. La base de datos resultante, consta de instrumentos de descripción para más de 80 colecciones de manuscritos.

El proyecto que ha producido la California Heritage Collection es el California Heritage Digital Image Project (http://sunsite.berkeley.edu/CalHeritage). Este archivo proporciona acceso a fotografías, imágenes y manuscritos de las colecciones de la "Bancroft Library" de la Universidad de Berkeley en California a través de instrumentos de descripción codificados con EAD. Todas las imágenes están disponibles al visualizar las descripciones de las diferentes colecciones, y basta con pinchar en cada una de ellas para visualizarla por completo o ver las imágenes asociadas. Todos los instrumentos de descripción se ofrecen como ficheros HTML convertidos desde SGML a través del servidor DynaWeb de Inso.

MALVINE es un proyecto europeo patrocinado por "K.G. Saur Verlag, Munich, Alemania" (http://www.malvine.org/malvine) que persigue mejorar y facilitar el acceso a diferentes colecciones de cartas y manuscritos modernos conservados y catalogados en bibliotecas, archivos, centros de documentación y museos europeos. Se trata de crear una red que conecte estas instituciones en Europa y que sea accesible desde cualquier lugar del mundo vía Web como si se tratase de una base de datos homogénea y unificada.
El proyecto proporcionará una interfaz de usuario multilingüe que emplee una terminología común y ofrezca copias en formato digital de documentos valiosos. De esta forma se facilitará tanto el acceso a manuscritos modernos originales europeos como el intercambio de datos entre sistemas heterogéneos. Todo esto va a contribuir a la protección y conservación de los documentos originales.
En definitiva, lo que se pretende es establecer una infraestructura que:
  • permita un servicio de búsqueda de manuscritos y petición de copias y
  • proporcione a los usuarios información de los distintos catálogos codificados con XML utilizando EAD.
Esto va a posibilitar que cualquier institución, independientemente de su tamaño, ponga a disposición de un amplio público sus colecciones contribuyendo así con los objetivos de la sociedad de la información.
Los principales resultados de este proyecto son:
  • Una herramienta de conversión para traducir los catálogos almacenados en distintos formatos locales a un formato común de intercambio. Este formato es SGML o XML usando la DTD EAD. La herramienta está programada con Perl.
  • Un conversor EAD online que intenta convertir cualquier fichero dado a un fichero codificado con XML usando también la DTD EAD. Para que el conversor realice la operación con éxito, el fichero que se intenta convertir debe estar entre los formatos nativos que éste conozca.
  • Una herramienta de conversión que demuestra cómo la traducción de los diferentes formatos nativos al formato EAD puede hacerse usando diferentes hojas de estilo (XSL).

EAD es una DTD XML que refleja la estructura lógica y jerárquica de un instrumento de descripción de archivo, que es compatible con la norma internacional para la descripción de material de archivo (ISAD-G) y que posibilita la difusión, acceso y navegabilidad, a través de la tecnología de redes, de información descriptiva de archivo.
Los documentos EAD pueden "aprovechar" todas las posibilidades aplicables a los archivos XML. Por ejemplo, los archivos EAD pueden ser enlazables entre sí, enlazadas partes de ellos, o integrar imágenes de los documentos descritos.


En definitiva, combinar las funcionalidades del XML y las posibilidades de conectividad y accesibilidad que brindan las redes sociales para acercar la información a todos los usuarios y facilitar la comunicación tanto entre los propios SGI como los usuarios de dichos sistemas.


Fuentes:


No hay comentarios:

Publicar un comentario