CIDE (2012) Arribe
Cha înes éditoriales numériques : allier efficacité et variabilité gr âce à des primi tives documentaires 3 des chaînes éditoriales XML (Crozat, 2007). Ils permettent l'écriture d'un contenu en se conformant à un modèle préalablement défini. La publication s'opère par des transformations automatiques vers des standards tel s q ue PDF ou HTML. Nous qualifierons les chaînes éditoriales en fonction de deux critères
- leur
faculté à s’adapter à un nouveau contexte, la variabilité
- leur apport pour la
production et la maintenance, l’ efficacité . Un des objectifs majeurs de l’ingéni erie documentaire est de maintenir la variabilité des contenus - pour respecter la spécificité de chaque contexte d’usage - tout en améliorant l’efficacité de leur gestion - pour gérer la massification. 2 Modèle universel versus modèle dédié La notion de doc ument structuré suppose de formaliser un modèle de représentation du document permettant d’en contrôler les opérations (Barron, 1989) (Piwowarski et al. , 2002). 2.1 Modèle documentaire dédié Un modèle dédié est un modèle documentaire spécifique à un contexte d ’usage métier en particulier. Le besoin documentaire est analysé puis formalisé dans un modèle, comprenant des schémas structurels, des interfaces d’éditions, des programmes de validation, de transformation... Historiquement portées par SGML ces approches sont aujourd’hui ancrées dans les technologies XML
Schema, XSLT, DOM... L’intérêt du modèle dédié est par construction son adéquation au contexte adressé. C’est la solution juste nécessaire au problème, permettant de traiter des structures documentaire s métiers (tableaux comptables, scénarios pédagogiques, plans numériques, formats dédiés...) sans scories héritées de fonctions liées à d’autres contextes d’usage. L’utilisation d’un modèle dédié impose une forte spécificité de la chaîne éditoriale. Nous p arlerons d’une approche par création car la chaîne éditoriale doit être développée ex nihilo , permettant ainsi de répondre finement à la problématique de la variabilité. Ce gain se paie sur l’efficacité du processus, notamment en raison des coûts de mise œuvre à l’initialisation, puis en maintenance. La chaîne étant fortement adhérente au contexte par construction, elle devient obsolète dès l’évolution de ce contexte et requiert par conséquent des moyens de maintenance importants. Cette barrière rend cett e approche adaptée uniquement à des usages de niche et aux contextes relativement stables du point de vue des formats documentaires (presse, documentation technique des industries sensibles...). 2.2 Modèle documentaire universel Un modèle universel est au cont raire un modèle à forte valeur de généralité visant à circonscrire l’ensemble des usages pour une famille de contextes. Généralement porté s par un standard (W3C, OASIS...), les modèles universels visent l’intégration d’un très large ensemble de besoins, et misent sur la mutualisation des développements autour du standard. On citera par exemple DITA, DocBook, ou la partie sémantique de HTML 1 . 1 http://dev.w3.org/html5/html - author/#understanding - semantics CIDE.15 Novembre 2012 4 La raison d’être du modèle global, une fois celui - ci standardisé et les développements associés mûris, est la possibil ité de disposer de chaînes éditoriales prêtes à l’emploi. Ces chaînes prêtes à l’emploi se composent d’un code générique fourni par l’éditeur de la chaîne et d’un code spécifique permettant une relative adaptation du contexte. Nous parlerons d’approche par déclinaison car une chaîne éditoriale type pourra se décliner par un simple ajout de code spécifique. Cette approche est incontestablement dominante dans les faits aujourd’hui, en particulier du fait de sa forte efficacité lorsque l’usage reste très proch e du standard. Dès qu’elle s’éloigne du standard, en revanche, elle gère mal la variabilité, il faut alors utiliser plus de code spécifique, faisant chuter fortement l’efficacité. L’enjeu de cette contribution est de répondre aux cas nécessitant une adaptation trop spécifique pour être raisonnablement déclinée depuis un modèle universel, mais ne pouvant pas se permettre une approche dédiée pour des raisons économiques. 3 Vers un niveau d’abstraction sup plémentaire 3.1 Notions de déclinaison et de génération chez Cassirer Dans son ouvrage, Cassirer ( 1910) s’intéresse aux différentes théories du concept pour mettre en relief les notions de déclinaison et génération. Il y distingue deux approches
- d’un coté l
a logique formelle forgée par Aristote, de l’autre celle des sciences modernes et contemporaines. L’objet de la logique formelle est l’étude de la métaphysique
- «l’essence et l’articulation de l’être». Dit
autrement, ce qui est. Du coté des sciences mode rnes, la notion de concept s’appuie non plus uniquement sur l’existence mais également sur la preuve, ce qui est vérifiable. Le concept vu par la logique est « un rassemblement par similitude d’essence » c'est à dire un rassemblement d’individus par resse mblance. Par exemple, l’hirondelle, le moineau et l’aigle ont tous des plumes, des ailes, un bec, etc. Ces caractéristiques constituent l’essence du concept d'oiseau. La généralisation d’un concept vers un concept de niveau supérieur se fait en procédant a u rassemblement des concepts de niveau inférieur. Un animal serait un mammifère, un oiseau, un amphibien, un poisson ou un reptile. Le concept universel serait alors une liste de toutes les essences possibles de ce qui est. L’universalité sera ici appelée abstraite car il n’existe pas de relation entre un concept et un sous - concept. Le passage de concept au sous - concept se fera alors par une déclinaison de l’ensemble des propriétés du concept. Pour Cassirer, le concept scientifique n’est plus un rassembleme nt mais une abstraction de la liste des propriétés, permettant ainsi la réunion, dans un même concept, de sous - concepts qui ne se ressemblent pas. Une fonction génératrice attachée au concept permet de générer l’ensemble des sous - concepts. En partant du no mbre 0 et avec la loi successeur, il est possible de générer l’ensemble des entiers naturels. La généralisation de plusieurs concepts scientifiques se fera en changeant les fonctions génératrices. L’universalité sera ici appelée concrète car les fonctions du concept universel permettent la génération de l’ensemble des individus qui le composent. Cha înes éditoriales numériques : allier efficacité et variabilité gr âce à des primi tives documentaires 5 3.2 Approche par déclinaison en ingénierie documentaire Cassirer conçoit la déclinaison en rassemblant des individus semblables. Rapporté e à l’ingénierie documentaire, u ne approche par déclinaison consiste à construire un modèle de document générique et un système générique qui le manipule. Les éléments additionnels du modèle ou de l’application sont à définir dans un code spécifique qui, associé au code générique, constr uit une déclinaison. Cette approche est conforme à l’utilisation d’un modèle universel. Conserver cette approche avec un modèle dédié revient à écrire une quantité importante de code spécifique pour adapter les composants de l’application aux spécificités du modèle. Le code spécifique de chaque composant sera dépendant du modèle. Il y aura donc une forte dépendance de chaque morceau de code spécifique. La viabilité de cette approche touchera ses limites devant la complexité du code et du contrôle des dépend ances, plus la variabilité est prise en compte, plus l’efficacité chute. Cette approche n’aura plus d’intérêt quand son efficacité sera moins importante que celle de l’approche par création. 3.3 Approche par génération en ingénierie documentaire Pour maintenir un niveau élevé de variabilité et d’efficacité, il est nécessaire de réduire les dépendances du code spécifique. Nous proposons d’isoler ces dépendances et de les gérer par des primitives couplées à une fonction de génération. Le code spécifique d épendant est alors créé automatiquement par la fonction de génération, suivant le principe de Cassirer. Nous retrouvons des approches de ce type dans le domaine de la spécialisation logicielle (Stig Nordheim, 2004). Par exemple, Recker (Recker et al. , 2006) part d’u n « modèle de référence », le spécialise pour un cas d’usage et génère le modèle d’entreprise qui sera utilisé par l’application. Le déploiement final est automatiquement contrôlé pour en vérifier la cohérence. Sur une même approche, Zina (Zina et al. , 200 6) propose de construire, à partir de modèles existants, un « méta - modèle » d’application de Gestion de Cycle de vie d’un Produit (Product Lifecycle Management - PLM) permettant d’instancier de nouveaux modèles d’application. D’un point de vue plus général , cette approche rejoint les travaux du Object Management Group’s (OMG) Model Driven Architecture 2 consistant à générer tout type d’architecture logicielle à partir d’un modèle, approche généralisée à l’ensemble de l’ingénierie logicielle par Kent (Ke nt, 2002). 4 L’exemple de Scenari Nous illustrons à présent le principe de génération porté par des primitives à travers le système de conception de chaînes éditoriales Scenari 3 , inventé à l'UTC et édité par la société Kelis. Nous mobiliserons un exemple d'ap plication en production depuis plusieurs années pour la gestion de la documentation métier de la société Quick. 2 http://www.omg.org/mda 3 http://scenari - platform.org CIDE.15 Novembre 2012 6 4.1 Le contexte Quick La chaîne de restaurants Quick manipule trois documentations distinctes
la documentation de référence, la documentation de f ormation et les dossiers d'homologation. La documentation de référence, appelée en interne, la bible, contient toutes les procédures nécessaires à l'exploitation des restaurants (de la réalisation des produits à l'utilisation et l'entretien des équipement s). Cette documentation doit être continuellement disponible dans l'ensemble des restaurants. Elle peut être imprimée en version papier sous forme de fiches conservées dans un classeur ou consultée sur l'intranet de la société. La documentation de formatio n permet à chaque restaurant de former ses nouveaux équipiers. Elle permet aux nouveaux collaborateurs d'étudier les différentes procédures à l'aide de parcours de formation appropriés. Elle permet également de sanctionner l'apprentissage par un système d' évaluation composé de séries de questions à choix multiples (QCM). La documentation de formation fait l'objet de plusieurs supports dédiés
- outre les formats PDF ou HTML
standard, on relève par exemple une version multimédia orientée mobiles (tablette, smartphone) pour un usage en situation sur le poste de travail de l'équipier. Enfin le département innovation est en charge de l'élaboration de nouveaux produits ou de nouveaux équipements. Toute évolution dans les procédés de fabrication fait l'objet d'u n document de type dossier d'homologation (DH) qui a des répercutions sur les documents de référence et pédagogiques. L'ensemble de la documentation est par ailleurs diffusée au niveau international, nécessitant des adaptations liées aux fonctionnements l ocaux des restaurants (législation, adaptations culturelles...). On appelle dérivation l'adaptation d'un document à un contexte international. Cha înes éditoriales numériques : allier efficacité et variabilité gr âce à des primi tives documentaires 7 Figure 1. Processus documentaires instrumentés par la chaîne éditoriale Quick ( http://scenari.utc.fr/c2m/DOCS/L4d/html/co/quick4.html ) Pour une société comme Quick, la documentation est un enjeu important sans toutefois être son cœur de métier et justifier un investissement trop important. Dan s cette situation multi - contextes, accompagnée d'un besoin pluri - média, les approches classiques de conception de chaîne éditoriale sont mal adaptées . Le développement d'une chaîne éditoriale ex nihilo couvrant l'ensemble des contextes d'usage nécessite un investissement initial trop important. L a complexité du contexte n'est pas directement adressable par un modèle universel, l'effort de déclinaison serait trop important quel que soit le standard (réutilisation inter - documents DH, bible, supports de formation
gestion de QCM
- publications pour mobiles
- dérivations internationales...)
4.2 Instrumentation Scenari Le système Scenari propose un principe de primitives documentaires permettant de modéliser les documents à manipuler et un système de primiti ves de transform ation dédié à la définition des publications associées. Il existe plusieurs types de primitives (composition de primitives, méta - données associées, structuration de texte, inclusion de ressources binaires, etc.), qui une fois agencées, per mettent de définir de nombreux modèles. Définition du modèle Les primitives documentaires et les primitives de transformation utilisées par le système Scenari s'expriment dans un formalisme XML. Les encadrés 1 et 2 donnent des exemples simplifiés de ces p rimitives. L'encadré 1 définit une « Fiche savoir - faire » comme la composition d'autres primitives
- des
métadonnées ( procM.model ), une première partie « Contexte » ( co.model ), suivi e d'une « Procédure » ( stepList.model ). L'encadré 2 définit une publication de ce type de fiche pour XHTML, en associant les parties à des blocs titrés ( W H eadingBlock ) et des classes qui seront stylées en CSS. <compositionPrim name = "Fiche savoir - faire" > <identification code = "proc" /> <structure> <meta refUri = "/qkDoss/model/co ntent/proc/procM.model" usage = "required" /> <part code = "context" name = "Contexte" family = "sub - level" usage = "optional" > <allowedModel refUri = "/qkDoss/model/base/co.model" /> </part> <part code = "stepList" name = "Procédure : liste d'étapes" family = "sub - level" usage = "required" > <allowedModel refUri = "/qkDoss/model/content/proc/stepList.model" /> </part> </structure> </compositionPrim> Encadré 1. exemple simplifié de primitive documentaire CIDE.15 Novembre 2012 8 <compositionXhtmlTransf > <model refUri = "/qkDoss/model/con tent/proc/proc.model" /> <content format = "xhtml" > <inDataOrder> <for codes = "context" > <WHeadingBlock widgetClass = "bk_context" > <title> <subModelTitle/> <fixedTitle value = "Contexte" /> </title> <callSubModel/> </WHeadi ngBlock> </for> <for codes = "stepList" > <WHeadingBlock widgetClass = "bk_stepList" > <title> <subModelTitle/> <fixedTitle value = "Procédure" /> </title> <callSubModel/> </WHeadingBlock> </for> </inDataOrder> </conte nt> </compositionXhtmlTransf> Encadré 2 . exemple simplifié de primitive de transformation Pour simplifier l' écriture, la gestion et la maintenance des primitives, le système Scenari propose un éditeur XML dédié à travers son outil de modélisation SCENA RIbuilder (voir figure 2). Figure 2 . Éditeur XML de primitives dans SCENARIbuilder SCENARIbuilder permet ensuite la compilation des primitives documentaires déclarées pour générer un code source spécifique à Quick, qui sera interprété par le code génér ique de Scenari à travers l'outil SCENARIchain. Le résultat de la compilation est compressé dans une archive dédiée ( wsppack ), une fois chargée dans SCENARIchain , la chaîne éditoriale est prête à l'emploi (figure 3). Elle propose alors un éditeur XML dédié au modèle (figure 4), des Cha înes éditoriales numériques : allier efficacité et variabilité gr âce à des primi tives documentaires 9 logiques applicatives de gestion posées par les primitives documentaires (par exemple l'adaptation au contexte international, visible via les drapeaux dans l'éditeur) et des publications posées par les primitives de transformation (par exemple la publication XHTML, figure 5). Figure 3 . Architecture Scenari de génération et exécution de code spécifique Figure 4 . Éditeur XML de fiche savoir - faire Quick CIDE.15 Novembre 2012 10 F igure 5 . Publication HTML d'une fiche savoir - faire Quick 5 Conclusion À t ravers cette contribution, nous avons souhaité montrer les limites de l’ingénierie documentaire traditionnelle qui privilégie la variabilité ou l’efficacité, mais peine à concilier les deux. L’abstraction que constitue le modèle d’un document structuré est le premier niveau traditionnellement mobilisé pour monter en efficacité tout en gérant la variabilité documentaire au sein d’une même chaîne éditoriale
- le modèle permet de gérer la variabilité de documents
qui se ressemblent (ils respectent un même sch éma, mobilisent les mêmes transformations...). En revanche cette solution ne permet pas de gérer efficacement la variabilité de documents qui ne ressemblent pas
- à chaque nouveau modèle de
document, il faut soit décliner une chaîne existante si le modèle est proche d’un cas maîtrisé, soit réinventer la chaîne ex nihilo lorsque la variation est trop forte. Or ces documents qui ne se ressemblent pas, présentent néanmoins des propriétés intrinsèques que l’on retrouve d’un modèle à l’autre, et qu’il est possi ble d’exprimer sous la forme de fonctions génératrices capables d’engendrer le code spécifique d’un modèle particulier. C’est ce second niveau d’abstraction, celui des primitives documentaires, qui permet de gérer la variabilité des modèles documentaires ( au delà de la variabilité des instances gérée par les modèles) tout en conservant un niveau d’efficacité compatible avec la plupart des contextes professionnels. Dans le cas des restaurants Quick, le modèle est complexe mais la solution conçue s'adapte né anmoins aux contextes d'usage dans toutes leurs spécificités. L'utilisation du système Scenari a permis d'adresser la variabilité des contextes d'usage et le principe de modélisation par primitive a été mis à profit pour mutualiser de nombreux aspects du modèle avec des contextes standards, et ainsi maintenir le projet dans une économie acceptable. Le principe de conception utilisé dans Scenari permet ainsi des performances de conception et Cha înes éditoriales numériques : allier efficacité et variabilité gr âce à des primi tives documentaires 11 de maintenance inédites. Depuis son développement, l'outil SCENARI builder dédié à l'écriture et à la génération des primitives a permis la diminution du temps nécessaire à la production du code source spécifique d'un facteur de un à dix au minimum (observations empiriques réalisées sur les projets menés par la société Ke lis). Les compétences nécessaires à la conception d'une chaîne éditoriale se sont par ailleurs déplacées d'un niveau technique de type développement informatique à un niveau plus fonctionnel de type modélisation documentaire. Ce glissement renforce l'exper tise documentaire des concepteurs et permet d'améliorer l'efficacité de la conception et la qualité des chaînes produites. Nos prochains travaux seront consacrés à l’étude d’un nouveau niveau d’abstraction, complémentaire des primitives documentaires, perm ettant la génération de logiques applicatives d’ écriture collaborative . Dans le cadre du projet ANR C2M 4 , le concept de chaîne éditoriale collaborative a été étudié et instancié dans le logiciel Scenari4. L’enjeu est à présent de concevoir un niveau d’abstra ction pour cette dimension collaborative qui soit cohérent avec celui défini pour la dimension documentaire et permette le même gain autour des enjeux de variabilité et d'efficacité. Références A NDRE , J., F URUTA , R. , Q UINT , V. (1988). Structured Documents . Cambridge University Press, the cambridge series on electronic publishing edition. B ACHIMONT , B., C ROZAT , S. (2004). Instrumentation numérique des documents
- pour une séparation fonds/forme.
Revue I3 , vol. 4 , 95 – 104. B ARRON , D. (1989). Why use sgml? E lectronic publishing , vol. 2 , 3 – 24. C ASSIRER , E. (1910). Substance et Fonction . Berlin. C ROZAT , S. (2007). Scenari
- la chaîne éditoriale libre
- Structurer et publier textes, images
et son . Eyrolles, accès libre edition. K ENT , S. (2002). Model driven eng ineering. Integrated Formal Methods - Lecture Notes in Computer Science , vol. 2335 , 286 – 298. P IWOWARSKI , B., D ENOYER , L. , G ALLINARI , P. , (2002). Un modèle pour la recherche d’information sur des documents structurés. In JAdT
- 6es Journées
internationales d’Analyse statistique des Données Textuelles . P EDAUQUE , R. T. (2003). Document
- forme, signe et médium, les
reformulations du numérique. R ECKER , J., M ENDLING , J., VAN DER A ALST , W. , R OSEMANN , M. (2006). Model - driven enterprise systems configuration. Adv anced Information Systems Engineering - Lecture Notes in Computer Science , vol. 4001 , 369 – 383. S TIG N ORDHEIM , T. P. (2004). Customization of enterprise content management systems
- An exploratory case study. In
Proceedings of the 37th Hawaii International Conference on System Sciences . 4 www.utc.fr/ics/c2m CIDE.15 Novembre 2012 12 Z ACKLAD , M. (2007). Réseaux et communautés d’imaginaire documédiatisées. In A Document (Re)turn . AM M AIN , F. ( Ed. ) , Roswitha Skare and Andreas Varheim and Niels Windfeld Lund. Z INA , S., L OMBARD , M., L OSSENT , L. , H ENRIOT , C. ( 2006). Generic modeling and configuration management in product lifecycle management. International Journal of Computers, Communications & Control , 126 – 138.