CIDE (2012) Arribe : Différence entre versions

De CIDE
imported>Rkya Hemi
imported>Thierry Daunois
 
(91 révisions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
Chaînes éditoriales numériques : allier efficacité et variabilitégrâce à des primitives documentaires
+
{{Titre page article
 +
|titre=Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires
 +
}}
 +
{{CIDE boîte bibliographique|texte=
 +
;Titre: [[A pour titre::Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires]]
 +
;Titre (anglais) : ''Digital publishing chains: combine efficiency and variability through document primitive''
 +
;Auteurs: [[A pour premier auteur::Thibaut Arribe]], [[A pour auteur::Stéphane Crozat]], [[A pour auteur::Sylvain Spinelli]] et [[A pour auteur::Bruno Bachimont]]
 +
;Affiliation:[[A pour affiliation auteur::HEUDIASYCUMR CNRS 7253]],[[A pour affiliation auteur:: Université de Technologie de Compiègne]], [[A pour affiliation auteur:: Université de Technologie de Compiègne]], [[A pour affiliation auteur::Société Kelis]]
 +
;In: [[Est dans les actes::CIDE 2012 Tunis|CIDE'15]]
 +
(Tunis 2012)
 +
;En ligne: https://ics.utc.fr/ics/res/crozat2012cide2.pdf
 +
}}
  
Digital publishing chains: combine efficiency and variability
+
__TOC__
through document primitive
+
;Résumé:  
 +
Cette  contribution  s'inscrit  dans  le  domaine  de  l'ingénierie documentaire, et plus particulièrement des chaînes éditoriales numériques, c'est à  dire  des  systèmes  assistant  la  production  et  la  publication  de  documents
 +
structurés. Après  avoir  réaffirmé  l'enjeu  du  document structuré  et  l'objet  de  l'ingénierie documentaire, nous comparerons les notions de modèle documentaire universel et  dédié.  Puis  nous  présenterons  le  concept  de  fonction  génératrice  chez Cassirer  et  l'associerons  au  concept  de  primitive documentaire:un code
 +
informatique  abstrayant  des  principes  essentiels  d'objets documentaires  pour permettre  la  génération  de  code  spécifique  instanciant  de  multiples  modèles documentaires.  Nous  montrerons  que  l'état  de  l'art  se  partage entre  d'une  part des  solutions  privilégiant  l'efficacité  au  détriment  de  la  variabilité  (possibilité d'adaptation au contexte) par l'utilisation de modèles universels, et d'autre part des solutions privilégiant la variabilité au détriment de l'efficacité par l'utilisation de modèles dédiés. Nous défendrons alors qu'un niveau d'abstraction fait défaut pour  mettre  en  œuvre  de  façon  réaliste  des  systèmes  alliant  efficacité  et variabilité.
 +
Notre  contribution  est  une  formalisation  du  système  de  conception  de  chaîne éditoriale Scenari, développé en 2004. Issu de travaux visant l'optimisation de la phase  de  conception  de chaînes  éditoriales,  le  système  Scenari  propose  un niveau  d'abstraction  supplémentaire  grâce  à  des  primitives,  et permet  de concevoir  des  chaînes éditoriales  sur  mesure,  avec  des  performances économiques et d'usage inédites.
 +
 
 +
;Mots-clés:
 +
document  structuré,  chaîne  éditoriale,  abstraction,
 +
génération, modèle documentaire.
  
Thibaut ARRIBE(1, 2, 3), Stéphane CROZAT(2), Bruno Bachimont (1),  
+
{{boîte déroulante
Sylvain SPINELLI (3)
+
  |titre=''Digital publishing chains: combine efficiency and variability through document primitive''
 +
  |contenu=
 +
;Abstract :
 +
''This paperexamines digital  publishing  chains, i.e. systems  which assist  the  production  and  publication  of  structured  documents, especially  their design processes.
 +
After reassertingthe issue of structured document and the subject of
 +
document engineering, we will compare the notions of universal and dedicated document model.
 +
We will then introduce the concept of generating function from Cassirer and combine with the concept of document primitive : a computer code which abstracts the  essential  principles  of  document  objects  to  enable the generation of specific code instantiating multiple document models. We will show that the
 +
state of the art is divided between solutions favouring efficiency over variability (ability  to  adapt  to  the  context) by  the  use  of  universal document models,  and solutions that promote variability at the expense of efficiency through the use of
 +
dedicated models. We will defend that a level of abstraction is  missing in orderto implement systems which combine efficiency and variability.
 +
Our  contribution  is  a  formalisation  of  the Scenari system,
 +
a publishing  chains design system developed in 2004. Stemming from works to optimize the design stage of  publishing  chains,  the
 +
Scenari system  offers  a level  of  abstraction through  primitives, and  can design  custom  publishing  chains with innovative use and economic performance.''
 +
;Keywords :
 +
''structured  document,  publishing  chain,  abstraction,  generation, document model. ''
 +
}}
  
(1)HEUDIASYCUMR CNRS 7253, Université de Technologie de Compiègne thibaut.arribe
+
{{CIDE début corps}}
@
+
==Introduction==
utc.fr
+
Le document est un objet dont l’usage s’est considérablement démocratisé depuis l’avènement du numérique  ({{CIDE lien citation|Pédauque, 2003}})  . Les contextes donnant lieu à l’écriture d’un document s e sont démultipliés, devenant un objet d’étude à part entière. Nous citons pour l’exemple l’étude de Zacklad  ({{CIDE lien citation|Zacklad, 2007}})  qui répertorie ces contextes en domaines : « le domaine esthétique» (œuvres artistiques) ; «le domaine affectif - fictionnel» (œuvres fictionnelles) ; «le domaine politico - spirituel» (doctrines politiques, livres sacrés) ; «le domaine moral - idéologique» (documents militants, pratiques liturgiques) ; «le domaine s cientifique» (résultats et vulgarisations scientifiques, documents pédagogiques) et «le domaine pratique - efficace» (documentation technique, juridique, administrative).
bruno.bachimont@hds.utc.fr
+
Dans cette contribution, nous nous intéressons à des contextes de forte production de documents relativement homogènes (en reprenant les domaines de Zacklad, nous nous situons principalement dans les domaines «pratique - efficace» et «scientifique»). L’ingénierie documentaire a répondu à la problématique de production de masse en faisant émerger la notion de document structuré ({{CIDE lien citation|André et al. , 1988}}) . Son enjeu est de contrôler l’homogénéité des documents par des structures qui s’articulent intimement avec les logiques applicatives d’édition, de manipulation et de publication. Cette mise en éviden ce de la structure permet d’instrumenter la séparation entre le fond et la forme - ou entre le fonds documentaire et ses formes ({{CIDE lien citation|Bachimont & Crozat, 2004}}) - permettant ainsi une automatisation de la manipulation documentaire. Les logiciels instrumentant cette situation d’écriture sont appelés des chaînes éditoriales XML  ({{CIDE lien citation|Crozat, 2007}})
(2) Unité ICS,  
+
. Ils permettent l'écriture d'un contenu en se conformant à un modèle préalablement défini. La publication s'opère par des transformations automatiques vers des standards tels que PDF ou HTML.
Université de Technologie de Compiègne
+
Nous qualifierons les chaînes éditoriales en fonction de deux critères : leur faculté à s’adapter à un nouveau contexte, la variabilité ; leur apport pour la production et la maintenance, l’ efficacité .
stephane.crozat@utc.fr
+
Un des objectifs majeurs de l’ingénierie documentaire est de maintenir la variabilité des contenus - pour respecter la spécificité de chaque contexte d’usage - tout en améliorant l’efficacité de leur gestion - pour gérer la massification.
(3
+
 
 +
==Modèle universel versus modèle dédié==
 +
 
 +
La notion de document structuré suppose de formaliser un modèle de représentation du document permettant d’en contrôler les opérations ({{CIDE lien citation|Barron, 1989}}) ({{CIDE lien citation|Piwowarski et al. , 2002}}) .
 +
 
 +
===Modèle documentaire dédié===
 +
Un modèle dédié est un modèle documentaire spécifique à un contexte d ’usage métier en particulier. Le besoin documentaire est analysé puis formalisé dans un modèle, comprenant des schémas structurels, des interfaces d’éditions, des programmes de validation, de transformation... Historiquement portées par SGML ces approches sont aujourd’hui ancrées dans les technologies XML : Schema, XSLT, DOM...
 +
L’intérêt du modèle dédié est par construction son adéquation au contexte adressé. C’est la solution juste nécessaire au problème, permettant de traiter des structures documentaire s métiers (tableaux comptables, scénarios pédagogiques, plans numériques, formats dédiés...) sans scories héritées de fonctions liées à d’autres contextes d’usage.
 +
L’utilisation d’un modèle dédié impose une forte spécificité de la chaîne éditoriale. Nous parlerons d’une approche par création car la chaîne éditoriale doit être développée ex nihilo , permettant ainsi de répondre finement à la problématique de la variabilité. Ce gain se paie sur l’efficacité du processus, notamment en raison des coûts de mise œuvre à l’initialisation, puis en maintenance. La chaîne étant fortement adhérente au contexte par construction, elle devient obsolète dès l’évolution de ce contexte et requiert par conséquent des moyens de maintenance importants. Cette barrière rend cett e approche adaptée uniquement à des usages de niche et aux contextes relativement stables du point de vue des formats documentaires (presse, documentation technique des industries sensibles...).
 +
 
 +
===Modèle documentaire universel===
 +
Un modèle universel est au cont raire un modèle à forte valeur de généralité visant à circonscrire l’ensemble des usages pour une famille de contextes. Généralement porté s par un standard (W3C, OASIS...), les modèles universels visent l’intégration d’un très large ensemble de besoins, et misent sur la mutualisation des développements autour du standard. On citera par exemple DITA, DocBook, ou la partie sémantique de HTML <ref>http://dev.w3.org/html5/html-author/#understanding-semantics</ref>.
 +
 
 +
La raison d’être du modèle global, une fois celui - ci standardisé et les développements associés mûris, est la possibilité de disposer de chaînes éditoriales prêtes à l’emploi. Ces chaînes prêtes à l’emploi se composent d’un code générique fourni par l’éditeur de la chaîne et d’un code spécifique permettant une relative adaptation du contexte. Nous parlerons d’approche par déclinaison car une chaîne éditoriale type pourra se décliner par un simple ajout de code spécifique. Cette approche est incontestablement dominante dans les faits aujourd’hui, en particulier du fait de sa forte efficacité lorsque l’usage reste très proche du standard. Dès qu’elle s’éloigne du standard, en revanche, elle gère mal la variabilité, il faut alors utiliser plus de code spécifique, faisant chuter fortement l’efficacité.
 +
L’enjeu de cette contribution est de répondre aux cas nécessitant une adaptation trop spécifique pour être raisonnablement déclinée depuis un modèle universel, mais ne pouvant pas se permettre une approche dédiée pour des raisons économiques.
 +
 
 +
==Vers un niveau d’abstraction supplémentaire==
 +
 
 +
===Notions de déclinaison et de génération chez Cassirer===
 +
Dans son ouvrage, Cassirer (1910) s’intéresse aux différentes théories du concept pour mettre en relief les notions de déclinaison et génération. Il y distingue deux approches : d’un coté l a logique formelle forgée par Aristote, de l’autre celle des sciences modernes et contemporaines. L’objet de la logique formelle est l’étude de la métaphysique : «l’essence et l’articulation de l’être». Dit autrement, ce qui est. Du coté des sciences modernes, la notion de concept s’appuie non plus uniquement sur l’existence mais également sur la preuve, ce qui est vérifiable.
 +
Le concept vu par la logique est « un rassemblement par similitude d’essence » c'est à dire un rassemblement d’individus par ressemblance. Par exemple, l’hirondelle, le moineau et l’aigle ont tous des plumes, des ailes, un bec, etc. Ces caractéristiques constituent l’essence du concept d'oiseau. La généralisation d’un concept vers un concept de niveau supérieur se fait en procédant a u rassemblement des concepts de niveau inférieur. Un animal serait un mammifère, un oiseau, un amphibien, un poisson ou un reptile. Le concept universel serait alors une liste de toutes les essences possibles de ce qui est. L’universalité sera ici appelée abstraite car il n’existe pas de relation entre un concept et un sous - concept. Le passage de concept au sous - concept se fera alors par une déclinaison de l’ensemble des propriétés du concept.
 +
Pour Cassirer, le concept scientifique n’est plus un rassemblement mais une abstraction de la liste des propriétés, permettant ainsi la réunion, dans un même concept, de sous - concepts qui ne se ressemblent pas. Une fonction génératrice attachée au concept permet de générer l’ensemble des sous - concepts. En partant du nombre 0 et avec la loi successeur, il est possible de générer l’ensemble des entiers naturels. La généralisation de plusieurs concepts scientifiques se fera en changeant les fonctions génératrices. L’universalité sera ici appelée concrète car les fonctions du concept universel permettent la génération de l’ensemble des individus qui le composent.
 +
 
 +
===Approche par déclinaison en ingénierie documentaire===
 +
Cassirer conçoit la déclinaison en rassemblant des individus semblables. Rapporté e à l’ingénierie documentaire, u ne approche par déclinaison consiste à construire un modèle de document générique et un système générique qui le manipule. Les éléments additionnels du modèle ou de l’application sont à définir dans un code spécifique qui, associé au code générique, construit une déclinaison. Cette approche est conforme à l’utilisation d’un modèle universel.
 +
Conserver cette approche avec un modèle dédié revient à écrire une quantité importante de code spécifique pour adapter les composants de l’application aux spécificités du modèle. Le code spécifique de chaque composant sera dépendant du modèle. Il y aura donc une forte dépendance de chaque morceau de code spécifique. La viabilité de cette approche touchera ses limites devant la complexité du code et du contrôle des dépendances, plus la variabilité est prise en compte, plus l’efficacité chute. Cette approche n’aura plus d’intérêt quand son efficacité sera moins importante que celle de l’approche par création.
 +
 
 +
===Approche par génération en ingénierie documentaire===
 +
Pour maintenir un niveau élevé de variabilité et d’efficacité, il est nécessaire de réduire les dépendances du code spécifique. Nous proposons d’isoler ces dépendances et de les gérer par des primitives couplées à une fonction de génération. Le code spécifique dépendant est alors créé automatiquement par la fonction de génération, suivant le principe de Cassirer.
 +
Nous retrouvons des approches de ce type dans le domaine de la spécialisation logicielle ({{CIDE lien citation|Stig Nordheim, 2004}}) . Par exemple, Recker ({{CIDE lien citation|Recker et al. , 2006}})  part d’u n « modèle de référence », le spécialise pour un cas d’usage et génère le modèle d’entreprise qui sera utilisé par l’application. Le déploiement final est automatiquement contrôlé pour en vérifier la cohérence. Sur une même approche, Zina ({{CIDE lien citation|Zina et al. , 2006}})  propose de construire, à partir de modèles existants, un « méta - modèle » d’application de Gestion de Cycle de vie d’un Produit (Product Lifecycle Management - PLM) permettant d’instancier de nouveaux modèles d’application.
 +
D’un point de vue plus général , cette approche rejoint les travaux du Object Management Group’s (OMG) Model Driven Architecture <ref>http://www.omg.org/mda</ref> consistant à générer tout type d’architecture logicielle à partir d’un modèle, approche généralisée à l’ensemble de l’ingénierie logicielle par Kent ({{CIDE lien citation|Kent, 2002}}) .
 +
 
 +
==L’exemple de Scenari==
 +
Nous illustrons à présent le principe de génération porté par des primitives à travers le système de conception de chaînes éditoriales Scenari <ref>http://scenari-platform.org</ref>, inventé à l'UTC et édité par la société Kelis. Nous mobiliserons un exemple d'ap plication en production depuis plusieurs années pour la gestion de la documentation métier de la société Quick.
 +
 
 +
 
 +
===Le contexte Quick===
 +
La chaîne de restaurants Quick manipule trois documentations distinctes : la documentation de référence, la documentation de formation et les dossiers d'homologation.  
 +
La documentation de référence, appelée en interne, la bible, contient toutes les procédures nécessaires à l'exploitation des restaurants (de la réalisation des produits à l'utilisation et l'entretien des équipement s). Cette documentation doit être continuellement disponible dans l'ensemble des restaurants. Elle peut être imprimée en version papier sous forme de fiches conservées dans un classeur ou consultée sur l'intranet de la société.  
 +
La documentation de formation permet à chaque restaurant de former ses nouveaux équipiers. Elle permet aux nouveaux collaborateurs d'étudier les différentes procédures à l'aide de parcours de formation appropriés. Elle permet également de sanctionner l'apprentissage par un système d' évaluation composé de séries de questions à choix multiples (QCM). La documentation de formation fait l'objet de plusieurs supports dédiés : outre les formats PDF ou HTML standard, on relève par exemple une version multimédia orientée mobiles (tablette, smartphone) pour un usage en situation sur le poste de travail de l'équipier.
 +
Enfin le département innovation est en charge de l'élaboration de nouveaux produits ou de nouveaux équipements. Toute évolution dans les procédés de fabrication fait l'objet d'un document de type dossier d'homologation (DH) qui a des répercutions sur les documents de référence et pédagogiques.
 +
L'ensemble de la documentation est par ailleurs diffusée au niveau international, nécessitant des adaptations liées aux fonctionnements locaux des restaurants (législation, adaptations culturelles...). On appelle dérivation l'adaptation d'un document à un contexte international.
 +
 
 +
Figure 1. Processus documentaires instrumentés par la chaîne éditoriale Quick (
 +
http://scenari.utc.fr/c2m/DOCS/L4d/html/co/quick4.html
 
)  
 
)  
Société Kelis
 
sylvain.spine
 
lli@kelis.fr
 
  
 +
Pour une société comme Quick, la documentation est un enjeu important sans toutefois être son cœur de métier et justifier un investissement trop important. Dan s cette situation multi - contextes, accompagnée d'un besoin pluri - média, les approches classiques de conception de chaîne éditoriale sont mal adaptées . Le développement d'une chaîne éditoriale ex nihilo couvrant l'ensemble des contextes d'usage nécessite un investissement initial trop important. L a complexité du contexte n'est pas directement adressable par un modèle universel, l'effort de déclinaison serait trop important quel que soit le standard (réutilisation inter - documents DH, bible, supports de formation ; gestion de QCM ; publications pour mobiles ; dérivations internationales...)
  
 +
===Instrumentation Scenari===
 +
Le système Scenari propose un principe de primitives documentaires permettant de modéliser les documents à manipuler et un système de primitives de transformation dédié à la définition des publications associées. Il existe plusieurs types de primitives (composition de primitives, méta - données associées, structuration de texte, inclusion de ressources binaires, etc.), qui une fois agencées, permettent de définir de nombreux modèles.
  
Résumé.Cette  contribution  s'inscrit  dans  le  domaine  de  l'ingénierie documentaire, et plus particulièrement des chaînes éditoriales numériques, c'est à  dire  des  systèmes  assistant  la  production  et  la  publication  de  documents
+
====Définition du modèle====
structurés.
+
Les primitives documentaires et les primitives de transformation utilisées par le système Scenari s'expriment dans un formalisme XML. Les encadrés 1 et 2 donnent des exemples simplifiés de ces p rimitives. L'encadré 1 définit une « Fiche savoir - faire » comme la composition d'autres primitives : des métadonnées ( procM.model ), une première partie « Contexte » ( co.model ), suivi e d'une « Procédure » ( stepList.model ). L'encadré 2 définit une publication de ce type de fiche pour XHTML, en associant les parties à des blocs titrés ( W H eadingBlock ) et des classes qui seront stylées en CSS.
Après  avoir  réaffirmé  l'enjeu  du  document  structuré  et l'objet  de  l'ingénierie documentaire, nous comparerons les notions de modèle documentaire universel et  dédié.  Puis  nous  présenterons  le concept  de  fonction  génératrice  chez Cassirer  et  l'associerons  au  concept  de  primitive  documentaire:un code
 
informatique  abstrayant  des principes  essentiels  d'objets documentaires  pour permettre  la  génération  de code  spécifique  instanciant  de  multiples  modèles documentaires. Nous  montrerons  que  l'état  de  l'art  se  partage entre  d'une part des  solutions  privilégiant  l'efficacité  au  détriment  de  la  variabilité  (possibilité d'adaptation au contexte) par l'utilisation de modèles universels
 
; et d'autre part des solutions privilégiant la variabilité au détriment de l'efficacité par l'utilisation de modèles dédiés. Nous défendrons alors qu'un niveau d'abstraction fait défaut pour mettre  en œuvre  de  façon  réaliste  des systèmes  alliant  efficacité  et variabilité.
 
  
 +
Encadré 2.exemple simplifié de primitive de transformation
  
Notre contribution est une formalisation du système  de  conception de chaîne éditoriale Scenari, développé en 2004. Issu de travaux visant l'optimisation de la phase de  conception de chaînes éditorialesle système Scenari propose un niveau   d'abstraction  supplémentaire  grâce  à   des   primitiveset permet de concevoir  des   chaînes éditoriales  sur  mesure,   avec   des   performances économiques et d'usage inédites.
+
Pour simplifier  l'  écriture,  la  gestion  et la maintenance des primitives, le système   Scenari  propose  un  éditeur XML  dédié  à  travers  son  outil  de modélisation SCENARIbuilder (voir figure 2).
 +
 
 +
Figure 2.Éditeur XML de primitives dans SCENARIbuilder
 +
 
 +
SCENARIbuilder    permet    ensuite    la    compilation    des    primitives documentaires  déclarées  pour  générer  un code  source  spécifique à Quick, qui sera interprété par le code générique de Scenari à travers l'outil SCENARIchain. Le  résultat  de la compilation  est  compressé  dans  une  archive  dédiée  (
 +
wsppack), une  fois  chargée  dansSCENARIchain, la chaîne éditoriale  est  prête  à  l'emploi (figure  3).  Elle  propose  alors  un  éditeur  XML  dédié au  modèle  (figure  4),  des Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires logiques  applicatives de  gestion  posées  par  les  primitives  documentaires  (par exemple  l'adaptation  au contexte internationalvisible  via  les  drapeaux  dans l'éditeur)  et  des  publications  posées  par les primitives de transformation (par exemple la publication XHTML, figure 5).
 +
 
 +
==Conclusion==
 +
 
 +
À travers cette contribution, nous avons souhaité montrer les limites de l’ingénierie documentaire traditionnelle qui privilégie la variabilité ou l’efficacité, mais peine à concilier les deux. L’abstraction que constitue le modèle d’un document structuré est le premier niveau traditionnellement mobilisé pour monter en efficacité tout en gérant la variabilité documentaire au sein d’une même chaîne éditoriale : le modèle permet de gérer la variabilité de documents qui se ressemblent (ils respectent un même schéma, mobilisent les mêmes transformations...).
 +
En revanche cette solution ne permet pas de gérer efficacement la variabilité de documents qui ne ressemblent pas : à chaque nouveau modèle de document, il faut soit décliner une chaîne existante si le modèle est proche d’un cas maîtrisé, soit réinventer la chaîne ex nihilo lorsque la variation est trop forte. Or ces documents qui ne se ressemblent pas, présentent néanmoins des propriétés intrinsèques que l’on retrouve d’un modèle à l’autre, et qu’il est possible d’exprimer sous la forme de fonctions génératrices capables d’engendrer le code spécifique d’un modèle particulier.
 +
C’est ce second niveau d’abstraction, celui des primitives documentaires, qui permet de gérer la variabilité des modèles documentaires ( au delà de la variabilité des instances gérée par les modèles) tout en conservant un niveau d’efficacité compatible avec la plupart des contextes professionnels.
 +
Dans le cas des restaurants Quick, le modèle est complexe mais la solution conçue s'adapte néanmoins aux contextes d'usage dans toutes leurs spécificités. L'utilisation du système Scenari a permis d'adresser la variabilité des contextes d'usage et le principe de modélisation par primitive a été mis à profit pour mutualiser de nombreux aspects du modèle avec des contextes standards, et ainsi maintenir le projet dans une économie acceptable. Le principe de conception utilisé dans Scenari permet ainsi des performances de conception et de maintenance inédites. Depuis son développement, l'outil SCENARIbuilder dédié à l'écriture et à la génération des primitives a permis la diminution du temps nécessaire à la production du code source spécifique d'un facteur de un à dix au minimum (observations empiriques réalisées sur les projets menés par la société Kelis). Les compétences nécessaires à la conception d'une chaîne éditoriale se sont par ailleurs déplacées d'un niveau technique de type développement informatique à un niveau plus fonctionnel de type modélisation documentaire. Ce glissement renforce l'expertise documentaire des concepteurs et permet d'améliorer l'efficacité de la conception et la qualité des chaînes produites.
 +
Nos prochains travaux seront consacrés à l’étude d’un nouveau niveau d’abstraction, complémentaire des primitives documentaires, permettant la génération de logiques applicatives d’ écriture collaborative . Dans le cadre du projet ANR C2M <ref>https://ics.utc.fr/ics/co/pres-ics.html</ref> , le concept de chaîne éditoriale collaborative a été étudié et instancié dans le logiciel Scenari4. L’enjeu est à présent de concevoir un niveau d’abstraction pour cette dimension collaborative qui soit cohérent avec celui défini pour la dimension documentaire et permette le même gain autour des enjeux de variabilité et d'efficacité.
 +
 
 +
==Notes==
 +
<references/>
 +
 
 +
==Références bibliographiques==
 +
{{CIDE biblio
 +
|id=ANDRE, J., FURUTA, R., QUINT, V., 2007
 +
|id édité=[[A pour auteur cité::ANDRE, J., FURUTA, R., QUINT, V.]] (2007)
 +
|texte=  « Structured Documents ». Cambridge University Press, the cambridge series on ''electronic publishing edition 1988''.
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=BACHIMONT, B., CROZAT, S.
 +
|id édité=[[A pour auteur cité::BACHIMONT, B., CROZAT, S.]] (2004)
 +
|texte= « Instrumentation numérique des documents  : pour une séparation fonds/forme ». ''Revue I3'', vol. 4, 95–10.
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=BARRON, 1989.
 +
|id édité=[[A pour auteur cité::BARRON, D.]] (1989)
 +
|texte= « Why use sgml? ». ''Electronic publishing'' vol. 2, 3–24.
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=CASSIRER, 1910.
 +
|id édité=[[A pour auteur cité::CASSIRER, E.]] (1910)
 +
|texte= « Substance et Fonction ». ''Berlin''
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=CROZAT, 2007
 +
|id édité=[[A pour auteur cité::CROZAT, S.]] (2007)
 +
|texte= « Scenari  : la chaîne éditoriale libre : Structurer et publier textes, images et son ». ''Eyrolles, accès libre edition''
 +
}} 
 +
 
 +
{{CIDE biblio
 +
|id=KENT, 2002.
 +
|id édité=[[A pour auteur cité::KENT, S.]] (2002)
 +
|texte= « Model driven engineering ». ''Integrated Formal Methods - Lecture Notes in Computer Science'' vol. 2335, 286–298
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=PIWOWARSKI, DENOYER, GALLINARI, 2002
 +
|id édité=[[A pour auteur cité::PIWOWARSKI, B., DENOYER, L., GALLINARI, P.]] (2002)
 +
|texte= « Un modèle pour la recherche d’information sur des documents structurés ». ''In JAdT  : 6es Journées internationales d’Analyse statistique des Données Textuelle''
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=PEDAUQUE, 2003
 +
|id édité=[[A pour auteur cité::PEDAUQUE, R. T.]] (2003)
 +
|texte= « Document  : forme, signe et médium, les reformulations du numérique ».
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=RECKER, MENDLING, VAN DER AALST, ROSEMANN, 2006.
 +
|id édité=[[A pour auteur cité::RECKER, J., MENDLING, J., VAN DER AALST, W., ROSEMANN, M.]] (2006)
 +
|texte= « Model-driven enterprise systems configuration ». ''Advanced Information Systems Engineering - Lecture Notes in Computer Science''vol. 4001, 369–383
 +
}}
 +
 
 +
{{CIDE biblio
 +
|id=STIG NORDHEIM, 2004
 +
|id édité=[[A pour auteur cité::STIG NORDHEIM, T. P.]] (2004)
 +
|texte= « Customization of enterprise content management systems : An exploratory case study. In Proceedings of the 37th Hawaii International Conference on System Sciences ».
 +
}}
 +
 
 +
{{CIDE biblio
 +
 
 +
|id=ZACKLAD, 2007
 +
 
 +
|id édité=[[A pour auteur cité::ZACKLAD M.]] (2007)
 +
 
 +
|texte=« Réseaux et communautés d’imaginaire documédiatisées. In A Document ». Roswitha Skare and Andreas Varheim and Niels Windfeld Lund.
  
Mots-clés.
+
}}
document  structuré,  chaîne  éditoriale,  abstraction,
 
génération, modèle documentaire.
 
  
Abstract.
+
{{CIDE biblio
This
+
  |id=ZINA, LOMBARD, LOSSENT, HENRIOT, 2006
paper
+
  |id édité=[[A pour auteur cité::ZINA, S., LOMBARD, M., LOSSENT, L., HENRIOT, C.]] (2006)
examines
+
  |texte= « Generic modeling and configuration management in product lifecycle management ». ''International Journal of Computers, Communications & Control'' 126–138
digital publishing  chains,  
+
}}
i.
 
e.
 
systems  which
 
assist  the  production  and  publ
 
ication  of  structured  documents
 
, especially  their
 
design processes
 
.
 
After
 
reasserting
 
the issue of
 
structured document an
 
d the subject
 
of
 
document
 
engineering, we will compare the notions of
 
universa
 
l
 
and dedicated
 
document
 
model
 
.
 
W
 
e
 
will
 
then
 
introduce the
 
concept of generating function
 
from
 
Cassirer
 
and
 
combine with
 
the concept of
 
docu
 
m
 
ent
 
primitive
 
: a computer code
 
w
 
h
 
ich
 
abstrac
 
t
 
s
 
the  essential  principles  of  document  objects  to  enable
 
the
 
generation
 
of specif
 
ic code instantiating multiple
 
document
 
models
 
. We will show that the
 
state of the art is divided between
 
solutions favo
 
u
 
ring efficiency over
 
variability
 
(ability  to  adapt  to  the  context)  by  the  use  of  universal
 
document
 
models, and
 
solutions that promote variability at the expense of efficiency through the use of
 
dedicated models. We will defend
 
that
 
a level of
 
abstraction
 
is mi
 
ssing in order
 
to implement
 
system
 
s
 
which
 
combine
 
efficiency and variability
 
.
 
Our  contribution  is  a  formali
 
s
 
a
 
tion  of  the
 
Scenari
 
system,
 
a
 
publishing  chains
 
design
 
system
 
developed in 2004. Stemming from work
 
s
 
to optimize the design
 
stage
 
of  publishing  chains,  the
 
Scenari
 
system  offers  a
 
level  of  abstraction
 
through  primitives,  and  can
 
design  custom  publishing  chains
 
with
 
innovative
 
use and
 
economic performance
 
.
 
Keywords
 
.  structured  document,  publishing  chain,  abstraction,  generation,
 
document model.
 
1
 
Introduction
 
Le document est un objet dont l’usage s’est considérablement démocratisé
 
depuis l’avènement du numérique (P
 
édauque, 2003). Les contextes donnant l
 
ieu
 
à l’écriture d’un document
 
s
 
e sont démultipliés, devenant un objet d’étude à part
 
entière. Nous citons pour l’exemple l’étude de Zacklad (Zacklad, 2007) qui
 
répertorie  ces  contextes  en  domaines
 
:  «
 
l
 
e  domaine  esth
 
étique»  (œuvres
 
artistiques)
 
;  «le  domaine  affectif
 
-
 
fictionnel»  (œuvres  fictionnelles)
 
;  «le
 
domaine  politico
 
-
 
spirituel»  (doctrines  politiques,  livres  sacrés)
 
;  «le  domaine
 
moral
 
-
 
idéologique»  (documents  militants,  pratiques  liturgiques)
 
;  «le  domaine
 
s
 
cientifique»
 
(résultats
 
et
 
vulgarisations
 
scientifiques,
 
documents
 
pédagogiques)
 
et  «le  domaine  pratique
 
-
 
efficace»  (documentation  technique,
 
juridique, administrative).
 
Dans  cette  contribution,  nous  nous  intéressons  à  des  contextes  de  forte
 
production  de  d
 
ocuments  relativement  homogènes  (en  reprenant  les  domaines
 
de  Zacklad,  nous  nous  situons  principalement  dans  les  domaines  «pratique
 
-
 
efficace»  et «scientifique»).  L’ingénierie  documentaire  a  répondu  à  la
 
problématique  de  production  de  masse  en  faisant  émerg
 
er  la  notion  de
 
document  structuré  (André
 
et
 
al.
 
,  1988).  Son  enjeu  est  de  contrôler
 
l’homogénéité  des  documents  par  des  structures  qui  s’articulent  intimement
 
avec les logiques applicatives d’édition, de manipulation et de publication. Cette
 
mise  en  éviden
 
ce de la structure permet d’instrumenter la séparation entre le
 
fond et la forme
 
-
 
ou entre le fonds documentaire et ses formes (Bachimont &
 
Crozat,  2004)
 
-
 
permettant  ainsi  une  automatisation  de  la  manipulation
 
documentaire. Les logiciels instrumentant ce
 
tte situation d’écriture sont appelés
 
Cha
 
înes éditoriales numériques :
 
allier efficacité et
 
variabilité gr
 
âce à des
 
primi
 
tives documentaires
 
3
 
des  chaînes  éditoriales  XML  (Crozat,  2007).  Ils  permettent  l'écriture  d'un
 
contenu  en  se  conformant  à  un  modèle  préalablement  défini.  La  publication
 
s'opère  par  des  transformations  automatiques  vers  des  standards  tel
 
s
 
q
 
ue  PDF
 
ou HTML.
 
Nous qualifierons les chaînes éditoriales en fonction de deux critères
 
: leur
 
faculté à s’adapter à un nouveau contexte, la
 
variabilité
 
;  leur  apport  pour  la
 
production et la maintenance, l’
 
efficacité
 
.
 
Un des objectifs majeurs de l’ingéni
 
erie  documentaire  est  de  maintenir  la
 
variabilité  des  contenus
 
-
 
pour  respecter  la  spécificité  de  chaque  contexte
 
d’usage
 
-
 
tout  en  améliorant  l’efficacité  de  leur  gestion
 
-
 
pour  gérer  la
 
massification.
 
2
 
Modèle universel versus modèle dédié
 
La  notion  de  doc
 
ument  structuré  suppose  de  formaliser  un  modèle  de
 
représentation du document permettant d’en contrôler les opérations (Barron,
 
1989) (Piwowarski
 
et
 
al.
 
, 2002).
 
2.1
 
Modèle documentaire dédié
 
Un  modèle  dédié  est  un  modèle  documentaire  spécifique  à  un  contexte
 
d
 
’usage métier en particulier. Le besoin documentaire est analysé puis formalisé
 
dans un modèle, comprenant des schémas structurels, des interfaces d’éditions,
 
des programmes de validation, de transformation... Historiquement portées par
 
SGML  ces  approches
 
sont aujourd’hui ancrées dans les technologies XML
 
:
 
Schema, XSLT, DOM...
 
L’intérêt du modèle dédié est par construction son adéquation au contexte
 
adressé. C’est la solution juste nécessaire au problème, permettant de traiter des
 
structures documentaire
 
s métiers (tableaux comptables, scénarios pédagogiques,
 
plans  numériques,  formats  dédiés...)  sans  scories  héritées  de  fonctions  liées  à
 
d’autres contextes d’usage.
 
L’utilisation d’un modèle dédié impose une forte spécificité de la chaîne
 
éditoriale.  Nous  p
 
arlerons d’une approche par
 
création
 
car  la  chaîne  éditoriale
 
doit  être  développée
 
ex  nihilo
 
,  permettant    ainsi  de  répondre  finement    à  la
 
problématique de la variabilité. Ce gain se paie sur l’efficacité du processus,
 
notamment  en  raison  des  coûts  de  mise
 
œuvre  à  l’initialisation,  puis  en
 
maintenance. La chaîne étant fortement adhérente au contexte par construction,
 
elle devient obsolète dès l’évolution de ce contexte et requiert par conséquent
 
des  moyens  de  maintenance  importants.  Cette  barrière  rend  cett
 
e  approche
 
adaptée uniquement à des usages de niche et aux contextes relativement stables
 
du  point  de  vue  des  formats  documentaires  (presse,  documentation  technique
 
des industries sensibles...).
 
2.2
 
Modèle documentaire universel
 
Un modèle universel est au cont
 
raire un modèle à forte valeur de généralité
 
visant  à  circonscrire  l’ensemble  des  usages  pour  une  famille  de  contextes.
 
Généralement  porté
 
s
 
par  un  standard  (W3C,  OASIS...),  les  modèles  universels
 
visent  l’intégration  d’un  très  large  ensemble  de  besoins,  et
 
misent  sur  la
 
mutualisation  des  développements  autour  du  standard.  On  citera  par  exemple
 
DITA, DocBook,
 
ou la partie sémantique de HTML
 
1
 
.
 
1
 
http://dev.w3.org/html5/html
 
-
 
author/#understanding
 
-
 
semantics
 
Cha
 
înes éditoriales numériques :
 
allier efficacité et
 
variabilité gr
 
âce à des
 
primi
 
tives documentaires
 
7
 
Figure
 
1.
 
Processus documentaires  instrumentés par la chaîne éditoriale Quick
 
(
 
http://scenari.utc.fr/c2m/DOCS/L4d/html/co/quick4.html
 
)
 
Pour une société  comme Quick, la documentation est un enjeu important
 
sans  toutefois  être  son  cœur  de  métier  et  justifier  un  investissement  trop
 
important. Dan
 
s cette situation multi
 
-
 
contextes, accompagnée d'un besoin pluri
 
-
 
média,  les  approches  classiques  de  conception  de  chaîne  éditoriale
 
sont  mal
 
adaptées
 
.  Le  développement  d'une  chaîne  éditoriale  ex  nihilo  couvrant
 
l'ensemble  des  contextes  d'usage  nécessite  un
 
investissement  initial
 
trop
 
important.
 
L
 
a  complexité  du  contexte  n'est  pas  directement  adressable  par  un
 
modèle  universel,  l'effort  de  déclinaison  serait  trop  important
 
quel  que  soit
 
le
 
standard
 
(réutilisation  inter
 
-
 
documents  DH,  bible,  supports  de
 
formation
 
;
 
gestion de QCM
 
;  publications pour mobiles
 
; dérivations internationales...)
 
4.2
 
Instrumentation Scenari
 
Le  système  Scenari  propose  un  principe  de  primitives  documentaires
 
permettant de modéliser les documents à manipuler et un système de primiti
 
ves
 
de  transform
 
ation  dédié  à  la  définition  des
 
publications  associées.  Il  existe
 
plusieurs  types  de  primitives  (composition  de  primitives,  méta
 
-
 
données
 
associées,  structuration  de  texte,  inclusion  de  ressources  binaires,  etc.),  qui  une
 
fois agencées, per
 
mettent de définir de nombreux modèles.
 
Définition du modèle
 
Les  primitives  documentaires  et  les  primitives  de  transformation  utilisées
 
par le système Scenari s'expriment dans un formalisme XML. Les encadrés 1 et
 
2  donnent  des  exemples  simplifiés    de  ces  p
 
rimitives.  L'encadré  1  définit  une
 
«
 
Fiche    savoir
 
-
 
faire
 
»    comme    la    composition    d'autres    primitives
 
:    des
 
métadonnées  (
 
procM.model
 
),  une  première  partie  «
 
Contexte
 
»  (
 
co.model
 
),
 
suivi
 
e
 
d'une  «
 
Procédure
 
»  (
 
stepList.model
 
).  L'encadré  2  définit  une  publication
 
de  ce  type  de  fiche  pour  XHTML,  en  associant  les  parties  à  des  blocs  titrés
 
(
 
W
 
H
 
eadingBlock
 
) et des classes qui seront stylées en CSS.
 
<compositionPrim
 
name
 
=
 
"Fiche savoir
 
-
 
faire"
 
>
 
<identification
 
code
 
=
 
"proc"
 
/>
 
<structure>
 
<meta
 
refUri
 
=
 
"/qkDoss/model/co
 
ntent/proc/procM.model"
 
usage
 
=
 
"required"
 
/>
 
<part
 
code
 
=
 
"context"
 
name
 
=
 
"Contexte"
 
family
 
=
 
"sub
 
-
 
level"
 
usage
 
=
 
"optional"
 
>
 
<allowedModel
 
refUri
 
=
 
"/qkDoss/model/base/co.model"
 
/>
 
</part>
 
<part
 
code
 
=
 
"stepList"
 
name
 
=
 
"Procédure : liste d'étapes"
 
family
 
=
 
"sub
 
-
 
level"
 
usage
 
=
 
"required"
 
>
 
<allowedModel
 
refUri
 
=
 
"/qkDoss/model/content/proc/stepList.model"
 
/>
 
</part>
 
</structure>
 
</compositionPrim>
 
Encadré
 
1.
 
exemple simplifié de primitive documentaire
 
CIDE.15
 
Novembre 2012
 
8
 
<compositionXhtmlTransf
 
>
 
<model
 
refUri
 
=
 
"/qkDoss/model/con
 
tent/proc/proc.model"
 
/>
 
<content
 
format
 
=
 
"xhtml"
 
>
 
<inDataOrder>
 
<for
 
codes
 
=
 
"context"
 
>
 
<WHeadingBlock
 
widgetClass
 
=
 
"bk_context"
 
>
 
<title>
 
<subModelTitle/>
 
<fixedTitle
 
value
 
=
 
"Contexte"
 
/>
 
</title>
 
<callSubModel/>
 
</WHeadi
 
ngBlock>
 
</for>
 
<for
 
codes
 
=
 
"stepList"
 
>
 
<WHeadingBlock
 
widgetClass
 
=
 
"bk_stepList"
 
>
 
<title>
 
<subModelTitle/>
 
<fixedTitle
 
value
 
=
 
"Procédure"
 
/>
 
</title>
 
<callSubModel/>
 
</WHeadingBlock>
 
</for>
 
</inDataOrder>
 
</conte
 
nt>
 
</compositionXhtmlTransf>
 
Encadré 2
 
.
 
exemple simplifié de primitive de transformation
 
Pour  simplifier  l'  écriture,  la  gestion  et  la  maintenance  des  primitives,  le
 
système  Scenari  propose  un  éditeur  XML  dédié  à  travers  son  outil  de
 
modélisation SCENA
 
RIbuilder (voir figure 2).
 
Figure 2
 
.
 
Éditeur XML de primitives dans SCENARIbuilder
 
SCENARIbuilder    permet    ensuite    la    compilation    des    primitives
 
documentaires  déclarées  pour  générer  un  code  source  spécifique  à  Quick,  qui
 
sera interprété par le code génér
 
ique de Scenari à travers l'outil SCENARIchain.
 
Le  résultat  de  la  compilation  est  compressé  dans  une  archive  dédiée  (
 
wsppack
 
),
 
une  fois  chargée  dans
 
SCENARIchain
 
,
 
la  chaîne  éditoriale  est  prête  à  l'emploi
 
(figure  3).  Elle  propose  alors  un  éditeur  XML  dédié
 
au  modèle  (figure  4),  des
 
Cha
 
înes éditoriales numériques :
 
allier efficacité et
 
variabilité gr
 
âce à des
 
primi
 
tives documentaires
 
9
 
logiques  applicatives  de  gestion  posées  par  les  primitives  documentaires  (par
 
exemple  l'adaptation  au  contexte  international,  visible  via  les  drapeaux  dans
 
l'éditeur)  et  des  publications  posées  par  les  primitives  de  transformation
 
(par
 
exemple la publication XHTML, figure 5).
 
Figure 3
 
.
 
Architecture Scenari de génération et exécution de code spécifique
 
Figure 4
 
.
 
Éditeur XML de fiche savoir
 
-
 
faire Quick
 
CIDE.15
 
Novembre 2012
 
10
 
F
 
igure 5
 
.
 
Publication HTML d'une fiche savoir
 
-
 
faire Quick
 
5
 
Conclusion
 
À  t
 
ravers  cette  contribution,  nous  avons  souhaité  montrer  les  limites  de
 
l’ingénierie documentaire traditionnelle qui privilégie la variabilité ou l’efficacité,
 
mais peine à concilier les deux. L’abstraction que constitue le modèle d’un
 
document  structuré  est
 
le  premier  niveau  traditionnellement  mobilisé  pour
 
monter en efficacité tout en gérant la variabilité documentaire au sein d’une
 
même chaîne éditoriale
 
: le modèle permet de gérer la variabilité de documents
 
qui  se  ressemblent  (ils  respectent  un  même  sch
 
éma,  mobilisent  les  mêmes
 
transformations...).
 
En  revanche  cette  solution  ne  permet  pas  de  gérer  efficacement  la
 
variabilité de documents qui ne ressemblent pas
 
: à chaque nouveau modèle de
 
document, il faut soit décliner une chaîne existante si le modèle
 
est proche d’un
 
cas maîtrisé, soit réinventer la chaîne
 
ex nihilo
 
lorsque la variation est trop forte.
 
Or  ces  documents  qui  ne  se  ressemblent  pas,  présentent  néanmoins  des
 
propriétés  intrinsèques  que  l’on  retrouve  d’un  modèle  à  l’autre,  et  qu’il  est
 
possi
 
ble  d’exprimer  sous  la  forme  de  fonctions  génératrices  capables
 
d’engendrer le code spécifique d’un modèle particulier.
 
C’est ce second niveau d’abstraction, celui des primitives documentaires,
 
qui  permet  de  gérer  la  variabilité  des  modèles  documentaires  (
 
au  delà  de  la
 
variabilité  des  instances  gérée  par  les  modèles)  tout  en  conservant  un  niveau
 
d’efficacité compatible avec la plupart des contextes professionnels.
 
Dans le cas des restaurants Quick, le modèle est complexe mais la solution
 
conçue s'adapte né
 
anmoins aux contextes d'usage dans toutes leurs spécificités.
 
L'utilisation  du  système  Scenari  a  permis  d'adresser  la  variabilité  des  contextes
 
d'usage    et  le  principe  de  modélisation  par  primitive  a  été  mis  à  profit  pour
 
mutualiser  de  nombreux  aspects  du
 
modèle  avec  des  contextes  standards,  et
 
ainsi  maintenir  le  projet  dans  une  économie  acceptable.  Le  principe  de
 
conception utilisé dans Scenari permet ainsi des performances de conception et
 
Cha
 
înes éditoriales numériques :
 
allier efficacité et
 
variabilité gr
 
âce à des
 
primi
 
tives documentaires
 
11
 
de  maintenance  inédites.  Depuis  son  développement,  l'outil  SCENARI
 
builder
 
dédié  à  l'écriture  et  à  la  génération  des  primitives  a  permis  la  diminution  du
 
temps nécessaire à la production du code source spécifique d'un facteur de un à
 
dix au minimum (observations empiriques réalisées sur les projets menés par la
 
société  Ke
 
lis).  Les  compétences  nécessaires  à  la  conception  d'une  chaîne
 
éditoriale  se  sont  par  ailleurs  déplacées  d'un  niveau  technique  de  type
 
développement informatique à un niveau plus fonctionnel de type modélisation
 
documentaire. Ce glissement renforce l'exper
 
tise documentaire des concepteurs
 
et  permet  d'améliorer  l'efficacité  de  la  conception  et  la  qualité  des  chaînes
 
produites.
 
Nos prochains travaux seront consacrés à l’étude d’un nouveau niveau
 
d’abstraction,  complémentaire  des  primitives  documentaires,  perm
 
ettant  la
 
génération de logiques applicatives d’
 
écriture collaborative
 
. Dans le cadre du projet
 
ANR  C2M
 
4
 
,
 
le  concept  de  chaîne  éditoriale  collaborative  a  été  étudié  et
 
instancié dans le logiciel Scenari4. L’enjeu est à présent de concevoir un niveau
 
d’abstra
 
ction  pour  cette  dimension  collaborative  qui  soit  cohérent  avec  celui
 
défini  pour  la  dimension  documentaire  et  permette  le  même  gain  autour  des
 
enjeux de variabilité et d'efficacité.
 
Références
 
A
 
NDRE
 
,
 
J.,
 
F
 
URUTA
 
,
 
R.
 
,
 
Q
 
UINT
 
,
 
V.
 
(1988).
 
Structured  Documents
 
.  Cambridge
 
University Press, the cambridge series on electronic publishing edition.
 
B
 
ACHIMONT
 
,
 
B.,
 
C
 
ROZAT
 
,
 
S.
 
(2004). Instrumentation numérique des documents
 
: pour une séparation fonds/forme.
 
Revue I3
 
,
 
vol.
 
4
 
,
 
95
 
 
104.
 
B
 
ARRON
 
,
 
D.
 
(1989).
 
Why use sgml?
 
E
 
lectronic publishing
 
,
 
vol.
 
2
 
,
 
3
 
 
24.
 
C
 
ASSIRER
 
,
 
E.
 
(1910).
 
Substance et Fonction
 
. Berlin.
 
C
 
ROZAT
 
,
 
S.
 
(2007).
 
Scenari
 
: la chaîne éditoriale libre
 
: Structurer et publier textes, images
 
et son
 
.
 
Eyrolles, accès libre edition.
 
K
 
ENT
 
,
 
S.
 
(2002).  Model  driven  eng
 
ineering.
 
Integrated  Formal  Methods
 
-
 
Lecture
 
Notes in Computer Science
 
,
 
vol.
 
2335
 
,
 
286
 
 
298.
 
P
 
IWOWARSKI
 
,
 
B.,
 
D
 
ENOYER
 
,
 
L.
 
,
 
G
 
ALLINARI
 
,
 
P.
 
,
 
(2002).
 
Un  modèle  pour  la
 
recherche d’information sur des documents structurés. In
 
JAdT
 
:  6es  Journées
 
internationales
 
d’Analyse statistique des Données Textuelles
 
.
 
P
 
EDAUQUE
 
,
 
R.
 
T.
 
(2003).  Document
 
:  forme,  signe  et  médium,  les
 
reformulations du numérique.
 
R
 
ECKER
 
,
 
J.,
 
M
 
ENDLING
 
,
 
J.,
 
VAN
 
DER
 
A
 
ALST
 
,
 
W.
 
,
 
R
 
OSEMANN
 
,
 
M.
 
(2006). Model
 
-
 
driven enterprise systems configuration.
 
Adv
 
anced Information Systems Engineering
 
-
 
Lecture Notes in Computer Science
 
,
 
vol.
 
4001
 
,
 
369
 
 
383.
 
S
 
TIG
 
N
 
ORDHEIM
 
,
 
T.
 
P.
 
(2004).    Customization    of    enterprise    content
 
management systems
 
: An exploratory case study. In
 
Proceedings of the 37th Hawaii
 
International
 
Conference on System Sciences
 
.
 
4
 
www.utc.fr/ics/c2m
 
CIDE.15
 
Novembre 2012
 
12
 
Z
 
ACKLAD
 
,
 
M.
 
(2007). Réseaux et communautés d’imaginaire documédiatisées.
 
In
 
A  Document  (Re)turn
 
.
 
AM
 
M
 
AIN
 
,
 
F.
 
(
 
Ed.
 
)
 
,  Roswitha  Skare  and  Andreas
 
Varheim and Niels Windfeld Lund.
 
Z
 
INA
 
,
 
S.,
 
L
 
OMBARD
 
,
 
M.,
 
L
 
OSSENT
 
,
 
L.
 
,
 
H
 
ENRIOT
 
,
 
C.
 
(
 
2006).
 
Generic modeling  
 
and configuration management in product lifecycle management.  
 
International  
 
Journal of Computers, Communications & Control
 
, 126
 
 
138.
 

Version actuelle datée du 13 février 2018 à 13:32

Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires


 
 

 
Titre
Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires
Titre (anglais) 
Digital publishing chains: combine efficiency and variability through document primitive
Auteurs
Thibaut Arribe, Stéphane Crozat, Sylvain Spinelli et Bruno Bachimont
Affiliation
HEUDIASYCUMR CNRS 7253,Université de Technologie de Compiègne, Université de Technologie de Compiègne, Société Kelis
In
CIDE'15

(Tunis 2012)

En ligne
https://ics.utc.fr/ics/res/crozat2012cide2.pdf
Résumé

Cette contribution s'inscrit dans le domaine de l'ingénierie documentaire, et plus particulièrement des chaînes éditoriales numériques, c'est à dire des systèmes assistant la production et la publication de documents structurés. Après avoir réaffirmé l'enjeu du document structuré et l'objet de l'ingénierie documentaire, nous comparerons les notions de modèle documentaire universel et dédié. Puis nous présenterons le concept de fonction génératrice chez Cassirer et l'associerons au concept de primitive documentaire:un code informatique abstrayant des principes essentiels d'objets documentaires pour permettre la génération de code spécifique instanciant de multiples modèles documentaires. Nous montrerons que l'état de l'art se partage entre d'une part des solutions privilégiant l'efficacité au détriment de la variabilité (possibilité d'adaptation au contexte) par l'utilisation de modèles universels, et d'autre part des solutions privilégiant la variabilité au détriment de l'efficacité par l'utilisation de modèles dédiés. Nous défendrons alors qu'un niveau d'abstraction fait défaut pour mettre en œuvre de façon réaliste des systèmes alliant efficacité et variabilité. Notre contribution est une formalisation du système de conception de chaîne éditoriale Scenari, développé en 2004. Issu de travaux visant l'optimisation de la phase de conception de chaînes éditoriales, le système Scenari propose un niveau d'abstraction supplémentaire grâce à des primitives, et permet de concevoir des chaînes éditoriales sur mesure, avec des performances économiques et d'usage inédites.

Mots-clés

document structuré, chaîne éditoriale, abstraction, génération, modèle documentaire.

Introduction

Le document est un objet dont l’usage s’est considérablement démocratisé depuis l’avènement du numérique (Pédauque, 2003) . Les contextes donnant lieu à l’écriture d’un document s e sont démultipliés, devenant un objet d’étude à part entière. Nous citons pour l’exemple l’étude de Zacklad (Zacklad, 2007) qui répertorie ces contextes en domaines : « le domaine esthétique» (œuvres artistiques) ; «le domaine affectif - fictionnel» (œuvres fictionnelles) ; «le domaine politico - spirituel» (doctrines politiques, livres sacrés) ; «le domaine moral - idéologique» (documents militants, pratiques liturgiques) ; «le domaine s cientifique» (résultats et vulgarisations scientifiques, documents pédagogiques) et «le domaine pratique - efficace» (documentation technique, juridique, administrative). Dans cette contribution, nous nous intéressons à des contextes de forte production de documents relativement homogènes (en reprenant les domaines de Zacklad, nous nous situons principalement dans les domaines «pratique - efficace» et «scientifique»). L’ingénierie documentaire a répondu à la problématique de production de masse en faisant émerger la notion de document structuré (André et al. , 1988) . Son enjeu est de contrôler l’homogénéité des documents par des structures qui s’articulent intimement avec les logiques applicatives d’édition, de manipulation et de publication. Cette mise en éviden ce de la structure permet d’instrumenter la séparation entre le fond et la forme - ou entre le fonds documentaire et ses formes (Bachimont & Crozat, 2004) - permettant ainsi une automatisation de la manipulation documentaire. Les logiciels instrumentant cette situation d’écriture sont appelés des chaînes éditoriales XML (Crozat, 2007) . Ils permettent l'écriture d'un contenu en se conformant à un modèle préalablement défini. La publication s'opère par des transformations automatiques vers des standards tels que PDF ou HTML. Nous qualifierons les chaînes éditoriales en fonction de deux critères : leur faculté à s’adapter à un nouveau contexte, la variabilité ; leur apport pour la production et la maintenance, l’ efficacité . Un des objectifs majeurs de l’ingénierie documentaire est de maintenir la variabilité des contenus - pour respecter la spécificité de chaque contexte d’usage - tout en améliorant l’efficacité de leur gestion - pour gérer la massification.

Modèle universel versus modèle dédié

La notion de document structuré suppose de formaliser un modèle de représentation du document permettant d’en contrôler les opérations (Barron, 1989) (Piwowarski et al. , 2002) .

Modèle documentaire dédié

Un modèle dédié est un modèle documentaire spécifique à un contexte d ’usage métier en particulier. Le besoin documentaire est analysé puis formalisé dans un modèle, comprenant des schémas structurels, des interfaces d’éditions, des programmes de validation, de transformation... Historiquement portées par SGML ces approches sont aujourd’hui ancrées dans les technologies XML : Schema, XSLT, DOM... L’intérêt du modèle dédié est par construction son adéquation au contexte adressé. C’est la solution juste nécessaire au problème, permettant de traiter des structures documentaire s métiers (tableaux comptables, scénarios pédagogiques, plans numériques, formats dédiés...) sans scories héritées de fonctions liées à d’autres contextes d’usage. L’utilisation d’un modèle dédié impose une forte spécificité de la chaîne éditoriale. Nous parlerons d’une approche par création car la chaîne éditoriale doit être développée ex nihilo , permettant ainsi de répondre finement à la problématique de la variabilité. Ce gain se paie sur l’efficacité du processus, notamment en raison des coûts de mise œuvre à l’initialisation, puis en maintenance. La chaîne étant fortement adhérente au contexte par construction, elle devient obsolète dès l’évolution de ce contexte et requiert par conséquent des moyens de maintenance importants. Cette barrière rend cett e approche adaptée uniquement à des usages de niche et aux contextes relativement stables du point de vue des formats documentaires (presse, documentation technique des industries sensibles...).

Modèle documentaire universel

Un modèle universel est au cont raire un modèle à forte valeur de généralité visant à circonscrire l’ensemble des usages pour une famille de contextes. Généralement porté s par un standard (W3C, OASIS...), les modèles universels visent l’intégration d’un très large ensemble de besoins, et misent sur la mutualisation des développements autour du standard. On citera par exemple DITA, DocBook, ou la partie sémantique de HTML [1].

La raison d’être du modèle global, une fois celui - ci standardisé et les développements associés mûris, est la possibilité de disposer de chaînes éditoriales prêtes à l’emploi. Ces chaînes prêtes à l’emploi se composent d’un code générique fourni par l’éditeur de la chaîne et d’un code spécifique permettant une relative adaptation du contexte. Nous parlerons d’approche par déclinaison car une chaîne éditoriale type pourra se décliner par un simple ajout de code spécifique. Cette approche est incontestablement dominante dans les faits aujourd’hui, en particulier du fait de sa forte efficacité lorsque l’usage reste très proche du standard. Dès qu’elle s’éloigne du standard, en revanche, elle gère mal la variabilité, il faut alors utiliser plus de code spécifique, faisant chuter fortement l’efficacité. L’enjeu de cette contribution est de répondre aux cas nécessitant une adaptation trop spécifique pour être raisonnablement déclinée depuis un modèle universel, mais ne pouvant pas se permettre une approche dédiée pour des raisons économiques.

Vers un niveau d’abstraction supplémentaire

Notions de déclinaison et de génération chez Cassirer

Dans son ouvrage, Cassirer (1910) s’intéresse aux différentes théories du concept pour mettre en relief les notions de déclinaison et génération. Il y distingue deux approches : d’un coté l a logique formelle forgée par Aristote, de l’autre celle des sciences modernes et contemporaines. L’objet de la logique formelle est l’étude de la métaphysique : «l’essence et l’articulation de l’être». Dit autrement, ce qui est. Du coté des sciences modernes, la notion de concept s’appuie non plus uniquement sur l’existence mais également sur la preuve, ce qui est vérifiable. Le concept vu par la logique est « un rassemblement par similitude d’essence » c'est à dire un rassemblement d’individus par ressemblance. Par exemple, l’hirondelle, le moineau et l’aigle ont tous des plumes, des ailes, un bec, etc. Ces caractéristiques constituent l’essence du concept d'oiseau. La généralisation d’un concept vers un concept de niveau supérieur se fait en procédant a u rassemblement des concepts de niveau inférieur. Un animal serait un mammifère, un oiseau, un amphibien, un poisson ou un reptile. Le concept universel serait alors une liste de toutes les essences possibles de ce qui est. L’universalité sera ici appelée abstraite car il n’existe pas de relation entre un concept et un sous - concept. Le passage de concept au sous - concept se fera alors par une déclinaison de l’ensemble des propriétés du concept. Pour Cassirer, le concept scientifique n’est plus un rassemblement mais une abstraction de la liste des propriétés, permettant ainsi la réunion, dans un même concept, de sous - concepts qui ne se ressemblent pas. Une fonction génératrice attachée au concept permet de générer l’ensemble des sous - concepts. En partant du nombre 0 et avec la loi successeur, il est possible de générer l’ensemble des entiers naturels. La généralisation de plusieurs concepts scientifiques se fera en changeant les fonctions génératrices. L’universalité sera ici appelée concrète car les fonctions du concept universel permettent la génération de l’ensemble des individus qui le composent.

Approche par déclinaison en ingénierie documentaire

Cassirer conçoit la déclinaison en rassemblant des individus semblables. Rapporté e à l’ingénierie documentaire, u ne approche par déclinaison consiste à construire un modèle de document générique et un système générique qui le manipule. Les éléments additionnels du modèle ou de l’application sont à définir dans un code spécifique qui, associé au code générique, construit une déclinaison. Cette approche est conforme à l’utilisation d’un modèle universel. Conserver cette approche avec un modèle dédié revient à écrire une quantité importante de code spécifique pour adapter les composants de l’application aux spécificités du modèle. Le code spécifique de chaque composant sera dépendant du modèle. Il y aura donc une forte dépendance de chaque morceau de code spécifique. La viabilité de cette approche touchera ses limites devant la complexité du code et du contrôle des dépendances, plus la variabilité est prise en compte, plus l’efficacité chute. Cette approche n’aura plus d’intérêt quand son efficacité sera moins importante que celle de l’approche par création.

Approche par génération en ingénierie documentaire

Pour maintenir un niveau élevé de variabilité et d’efficacité, il est nécessaire de réduire les dépendances du code spécifique. Nous proposons d’isoler ces dépendances et de les gérer par des primitives couplées à une fonction de génération. Le code spécifique dépendant est alors créé automatiquement par la fonction de génération, suivant le principe de Cassirer. Nous retrouvons des approches de ce type dans le domaine de la spécialisation logicielle (Stig Nordheim, 2004) . Par exemple, Recker (Recker et al. , 2006) part d’u n « modèle de référence », le spécialise pour un cas d’usage et génère le modèle d’entreprise qui sera utilisé par l’application. Le déploiement final est automatiquement contrôlé pour en vérifier la cohérence. Sur une même approche, Zina (Zina et al. , 2006) propose de construire, à partir de modèles existants, un « méta - modèle » d’application de Gestion de Cycle de vie d’un Produit (Product Lifecycle Management - PLM) permettant d’instancier de nouveaux modèles d’application. D’un point de vue plus général , cette approche rejoint les travaux du Object Management Group’s (OMG) Model Driven Architecture [2] consistant à générer tout type d’architecture logicielle à partir d’un modèle, approche généralisée à l’ensemble de l’ingénierie logicielle par Kent (Kent, 2002) .

L’exemple de Scenari

Nous illustrons à présent le principe de génération porté par des primitives à travers le système de conception de chaînes éditoriales Scenari [3], inventé à l'UTC et édité par la société Kelis. Nous mobiliserons un exemple d'ap plication en production depuis plusieurs années pour la gestion de la documentation métier de la société Quick.


Le contexte Quick

La chaîne de restaurants Quick manipule trois documentations distinctes : la documentation de référence, la documentation de formation et les dossiers d'homologation. La documentation de référence, appelée en interne, la bible, contient toutes les procédures nécessaires à l'exploitation des restaurants (de la réalisation des produits à l'utilisation et l'entretien des équipement s). Cette documentation doit être continuellement disponible dans l'ensemble des restaurants. Elle peut être imprimée en version papier sous forme de fiches conservées dans un classeur ou consultée sur l'intranet de la société. La documentation de formation permet à chaque restaurant de former ses nouveaux équipiers. Elle permet aux nouveaux collaborateurs d'étudier les différentes procédures à l'aide de parcours de formation appropriés. Elle permet également de sanctionner l'apprentissage par un système d' évaluation composé de séries de questions à choix multiples (QCM). La documentation de formation fait l'objet de plusieurs supports dédiés : outre les formats PDF ou HTML standard, on relève par exemple une version multimédia orientée mobiles (tablette, smartphone) pour un usage en situation sur le poste de travail de l'équipier. Enfin le département innovation est en charge de l'élaboration de nouveaux produits ou de nouveaux équipements. Toute évolution dans les procédés de fabrication fait l'objet d'un document de type dossier d'homologation (DH) qui a des répercutions sur les documents de référence et pédagogiques. L'ensemble de la documentation est par ailleurs diffusée au niveau international, nécessitant des adaptations liées aux fonctionnements locaux des restaurants (législation, adaptations culturelles...). On appelle dérivation l'adaptation d'un document à un contexte international.

Figure 1. Processus documentaires instrumentés par la chaîne éditoriale Quick ( http://scenari.utc.fr/c2m/DOCS/L4d/html/co/quick4.html )

Pour une société comme Quick, la documentation est un enjeu important sans toutefois être son cœur de métier et justifier un investissement trop important. Dan s cette situation multi - contextes, accompagnée d'un besoin pluri - média, les approches classiques de conception de chaîne éditoriale sont mal adaptées . Le développement d'une chaîne éditoriale ex nihilo couvrant l'ensemble des contextes d'usage nécessite un investissement initial trop important. L a complexité du contexte n'est pas directement adressable par un modèle universel, l'effort de déclinaison serait trop important quel que soit le standard (réutilisation inter - documents DH, bible, supports de formation ; gestion de QCM ; publications pour mobiles ; dérivations internationales...)

Instrumentation Scenari

Le système Scenari propose un principe de primitives documentaires permettant de modéliser les documents à manipuler et un système de primitives de transformation dédié à la définition des publications associées. Il existe plusieurs types de primitives (composition de primitives, méta - données associées, structuration de texte, inclusion de ressources binaires, etc.), qui une fois agencées, permettent de définir de nombreux modèles.

Définition du modèle

Les primitives documentaires et les primitives de transformation utilisées par le système Scenari s'expriment dans un formalisme XML. Les encadrés 1 et 2 donnent des exemples simplifiés de ces p rimitives. L'encadré 1 définit une « Fiche savoir - faire » comme la composition d'autres primitives : des métadonnées ( procM.model ), une première partie « Contexte » ( co.model ), suivi e d'une « Procédure » ( stepList.model ). L'encadré 2 définit une publication de ce type de fiche pour XHTML, en associant les parties à des blocs titrés ( W H eadingBlock ) et des classes qui seront stylées en CSS.

Encadré 2.exemple simplifié de primitive de transformation

Pour simplifier l' écriture, la gestion et la maintenance des primitives, le système Scenari propose un éditeur XML dédié à travers son outil de modélisation SCENARIbuilder (voir figure 2).

Figure 2.Éditeur XML de primitives dans SCENARIbuilder

SCENARIbuilder permet ensuite la compilation des primitives documentaires déclarées pour générer un code source spécifique à Quick, qui sera interprété par le code générique de Scenari à travers l'outil SCENARIchain. Le résultat de la compilation est compressé dans une archive dédiée ( wsppack), une fois chargée dansSCENARIchain, la chaîne éditoriale est prête à l'emploi (figure 3). Elle propose alors un éditeur XML dédié au modèle (figure 4), des Chaînes éditoriales numériques : allier efficacité et variabilité grâce à des primitives documentaires logiques applicatives de gestion posées par les primitives documentaires (par exemple l'adaptation au contexte international, visible via les drapeaux dans l'éditeur) et des publications posées par les primitives de transformation (par exemple la publication XHTML, figure 5).

Conclusion

À travers cette contribution, nous avons souhaité montrer les limites de l’ingénierie documentaire traditionnelle qui privilégie la variabilité ou l’efficacité, mais peine à concilier les deux. L’abstraction que constitue le modèle d’un document structuré est le premier niveau traditionnellement mobilisé pour monter en efficacité tout en gérant la variabilité documentaire au sein d’une même chaîne éditoriale : le modèle permet de gérer la variabilité de documents qui se ressemblent (ils respectent un même schéma, mobilisent les mêmes transformations...). En revanche cette solution ne permet pas de gérer efficacement la variabilité de documents qui ne ressemblent pas : à chaque nouveau modèle de document, il faut soit décliner une chaîne existante si le modèle est proche d’un cas maîtrisé, soit réinventer la chaîne ex nihilo lorsque la variation est trop forte. Or ces documents qui ne se ressemblent pas, présentent néanmoins des propriétés intrinsèques que l’on retrouve d’un modèle à l’autre, et qu’il est possible d’exprimer sous la forme de fonctions génératrices capables d’engendrer le code spécifique d’un modèle particulier. C’est ce second niveau d’abstraction, celui des primitives documentaires, qui permet de gérer la variabilité des modèles documentaires ( au delà de la variabilité des instances gérée par les modèles) tout en conservant un niveau d’efficacité compatible avec la plupart des contextes professionnels. Dans le cas des restaurants Quick, le modèle est complexe mais la solution conçue s'adapte néanmoins aux contextes d'usage dans toutes leurs spécificités. L'utilisation du système Scenari a permis d'adresser la variabilité des contextes d'usage et le principe de modélisation par primitive a été mis à profit pour mutualiser de nombreux aspects du modèle avec des contextes standards, et ainsi maintenir le projet dans une économie acceptable. Le principe de conception utilisé dans Scenari permet ainsi des performances de conception et de maintenance inédites. Depuis son développement, l'outil SCENARIbuilder dédié à l'écriture et à la génération des primitives a permis la diminution du temps nécessaire à la production du code source spécifique d'un facteur de un à dix au minimum (observations empiriques réalisées sur les projets menés par la société Kelis). Les compétences nécessaires à la conception d'une chaîne éditoriale se sont par ailleurs déplacées d'un niveau technique de type développement informatique à un niveau plus fonctionnel de type modélisation documentaire. Ce glissement renforce l'expertise documentaire des concepteurs et permet d'améliorer l'efficacité de la conception et la qualité des chaînes produites. Nos prochains travaux seront consacrés à l’étude d’un nouveau niveau d’abstraction, complémentaire des primitives documentaires, permettant la génération de logiques applicatives d’ écriture collaborative . Dans le cadre du projet ANR C2M [4] , le concept de chaîne éditoriale collaborative a été étudié et instancié dans le logiciel Scenari4. L’enjeu est à présent de concevoir un niveau d’abstraction pour cette dimension collaborative qui soit cohérent avec celui défini pour la dimension documentaire et permette le même gain autour des enjeux de variabilité et d'efficacité.

Notes

Références bibliographiques

[ANDRE, J., FURUTA, R., QUINT, V. (2007)] « Structured Documents ». Cambridge University Press, the cambridge series on electronic publishing edition 1988.

[BACHIMONT, B., CROZAT, S. (2004)] « Instrumentation numérique des documents  : pour une séparation fonds/forme ». Revue I3, vol. 4, 95–10.

[BARRON, D. (1989)] « Why use sgml? ». Electronic publishing vol. 2, 3–24.

[CASSIRER, E. (1910)] « Substance et Fonction ». Berlin

[CROZAT, S. (2007)] « Scenari  : la chaîne éditoriale libre : Structurer et publier textes, images et son ». Eyrolles, accès libre edition

[KENT, S. (2002)] « Model driven engineering ». Integrated Formal Methods - Lecture Notes in Computer Science vol. 2335, 286–298

[PIWOWARSKI, B., DENOYER, L., GALLINARI, P. (2002)] « Un modèle pour la recherche d’information sur des documents structurés ». In JAdT  : 6es Journées internationales d’Analyse statistique des Données Textuelle

[PEDAUQUE, R. T. (2003)] « Document  : forme, signe et médium, les reformulations du numérique ».

[RECKER, J., MENDLING, J., VAN DER AALST, W., ROSEMANN, M. (2006)] « Model-driven enterprise systems configuration ». Advanced Information Systems Engineering - Lecture Notes in Computer Sciencevol. 4001, 369–383

[STIG NORDHEIM, T. P. (2004)] « Customization of enterprise content management systems : An exploratory case study. In Proceedings of the 37th Hawaii International Conference on System Sciences ».

[ZACKLAD M. (2007)] « Réseaux et communautés d’imaginaire documédiatisées. In A Document ». Roswitha Skare and Andreas Varheim and Niels Windfeld Lund.

[ZINA, S., LOMBARD, M., LOSSENT, L., HENRIOT, C. (2006)] « Generic modeling and configuration management in product lifecycle management ». International Journal of Computers, Communications & Control 126–138