Prise de contact avec XML
Ce module donne des premiers éléments sur l'utilisation d'XML avec DILIB et l'approche ScienceExplor.
Sommaire
Notions générales sur XML
Avec ScienceExplor, l'accent est mis sur l'exploration de corpus et non sur la création de documents XML.
...
La notation Sxml
La plateforme Dilib est très fortement insérée dans le système Unix, initialement conçu pour des applications de génie logiciel dans lesquelles la documentation et la gestion des sources sont une contrainte importante.
Unix contient donc un nombre important de commandes de base, par exemple grep, qui permettent de manipuler des flots de ligne.
La notation Sxml vise à utiliser les commandes Unix pour manipuler des flots de documents XML.
Sauts de lignes et tabulations
le caractère saut de ligne est un séparateur de ligne sous Unix.
Avec Sxml, le saut de ligne devient un séparateur de document. Son usage est interdit au sein d'un document.
Pour des raisons techniques (clé de tris), l'usage de la tabulation est également proscrit au sein d'un document Sxml.
Exemple
<place><placeName><settlement type="city">Gand</settlement><region type="province" nuts="2">Province de Flandre-Orientale</region></placeName></place>