CIDE (2012) Crozat : Différence entre versions
imported>Allison Gnassou |
imported>Maria Sadek |
||
(41 révisions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
{{Titre page article | {{Titre page article | ||
− | |titre=C2M : Chaînes éditoriales collaboratives multimédia}} | + | |titre=C2M : Chaînes éditoriales collaboratives multimédia}}''' |
− | {{CIDE boîte bibliographique|texte= | + | {{CIDE boîte bibliographique |
+ | |texte= | ||
;Titre: [[A pour titre::C2M : Chaînes éditoriales collaboratives multimédia]] | ;Titre: [[A pour titre::C2M : Chaînes éditoriales collaboratives multimédia]] | ||
− | ;Titre (anglais) : '''' | + | ;Titre (anglais) : ''C2M : Collaborative multimedia publishing chains'' |
− | ;Auteurs: [[A pour premier auteur:: | + | ;Auteurs: [[A pour premier auteur::Stéphane Crozat]] |
− | ;Affiliation:[[A pour affiliation auteur:: | + | ;Affiliation: |
+ | |||
+ | : (1) :[[A pour affiliation auteur:: Université de Technologie de Compiègne]], [[Unité Recherche Action ]] | ||
+ | : (2) :[[A pour affiliation auteur:: Ingénierie des contenus et des savoirs ]] | ||
;In: [[Est dans les actes::CIDE 2015 Montpellier|CIDE'18]] (Montpellier 2015) | ;In: [[Est dans les actes::CIDE 2015 Montpellier|CIDE'18]] (Montpellier 2015) | ||
− | ;En | + | ;En PDF: https://stph.crzt.fr/res/crozat2012cide1.pdf |
− | }} | + | ;Adresse mail: stephane.crozat@utc.fr}} |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
__TOC__ | __TOC__ | ||
;Résumé: Nous présentons dans cet article le résultat principal du projet C2M à travers Scenari4, un système de gestion de contenus structurés et fragmentés en contexte collaboratif. La principale difficulté est la gestion de la rééditorialisation et de la transclusion. Nous proposons les concepts d'atelier dynamique et de réseau de fragments vivants, et de bibliothèque et de document-dossier pour y remédier. Scenari4 est disponible sous licence FLOSS et est expérimenté dans plusieurs contextes expérimentaux et commerciaux. | ;Résumé: Nous présentons dans cet article le résultat principal du projet C2M à travers Scenari4, un système de gestion de contenus structurés et fragmentés en contexte collaboratif. La principale difficulté est la gestion de la rééditorialisation et de la transclusion. Nous proposons les concepts d'atelier dynamique et de réseau de fragments vivants, et de bibliothèque et de document-dossier pour y remédier. Scenari4 est disponible sous licence FLOSS et est expérimenté dans plusieurs contextes expérimentaux et commerciaux. | ||
Ligne 25 : | Ligne 22 : | ||
|titre=''C2M : Chaînes éditoriales collaboratives multimédia'' | |titre=''C2M : Chaînes éditoriales collaboratives multimédia'' | ||
|contenu= | |contenu= | ||
+ | |||
+ | __TOC__ | ||
;Abstract: We present in this paper the main result of the C2M project through Scenari4, a system able to manage structured and fragmented contents in a collaborative context. The main issue is related to repurposing and transclusion management. We submit the concepts of dynamic workspace and network of live fragments, and static library and folder-documents to deal with it. Scenari4 is released under FLOSS license and has been being used in several experimental and commercial contexts. | ;Abstract: We present in this paper the main result of the C2M project through Scenari4, a system able to manage structured and fragmented contents in a collaborative context. The main issue is related to repurposing and transclusion management. We submit the concepts of dynamic workspace and network of live fragments, and static library and folder-documents to deal with it. Scenari4 is released under FLOSS license and has been being used in several experimental and commercial contexts. | ||
− | ;Keywords: XML Publishing Chain, Structured Document, | + | ;Keywords: XML Publishing Chain, Structured Document, Fragmented Document, Transclusion, Repurposing, ECM.}} |
− | Fragmented Document, Transclusion, Repurposing, ECM. | ||
− | }} | ||
{{CIDE début corps}} | {{CIDE début corps}} | ||
− | == | + | == Introduction== |
Le projet C2M (Chaînes éditoriales Collaboratives Multimédia) | Le projet C2M (Chaînes éditoriales Collaboratives Multimédia) | ||
Ligne 103 : | Ligne 100 : | ||
d'OrientDb). | d'OrientDb). | ||
− | == | + | == Rééditorialisation par transclusion== |
La rééditorialisation est un processus documentaire consistant à | La rééditorialisation est un processus documentaire consistant à | ||
Ligne 145 : | Ligne 142 : | ||
de la publication (Geurts & al., 2011). | de la publication (Geurts & al., 2011). | ||
− | == | + | == Principe de la transclusion== |
Soit un document d1 contenant une information i1 à l'adresse | Soit un document d1 contenant une information i1 à l'adresse | ||
Ligne 158 : | Ligne 155 : | ||
+ | ===[[Fichier:Capture d’écran 2017-12-05 à 15.40.37.png|center|520px|thumb| '''Figure 1. Clonage et transclusion pour la réutilisation de fragments documentaire''' ]]=== | ||
− | |||
− | |||
− | |||
− | |||
Finalement les documents d2 et d2' contiennent la même | Finalement les documents d2 et d2' contiennent la même | ||
Ligne 181 : | Ligne 175 : | ||
d2'. | d2'. | ||
− | == | + | ==Rééditorialisation en contexte collaboratif== |
Le numérique met intrinsèquement à mal la notion traditionnelle | Le numérique met intrinsèquement à mal la notion traditionnelle | ||
Ligne 227 : | Ligne 221 : | ||
fragments et les réseaux de fragments. | fragments et les réseaux de fragments. | ||
− | == | + | == Problème de la propagation des modifications== |
Dans la figure ci-après les fragments 1 et 4 référencent le | Dans la figure ci-après les fragments 1 et 4 référencent le | ||
Ligne 240 : | Ligne 234 : | ||
− | + | ===[[Fichier:Figure 2. Fragmentation en contexte collaboratif .png|center|520px|thumb| '''Figure 2. Fragmentation en contexte collaboratif (http://utc.fr/ics/c2m)''' ]]=== | |
− | |||
− | |||
− | |||
− | |||
− | Figure 2. Fragmentation en contexte collaboratif | ||
− | (http://utc.fr/ics/c2m) | ||
− | |||
Ligne 267 : | Ligne 254 : | ||
moment du déploiement réel en entreprise. | moment du déploiement réel en entreprise. | ||
− | == | + | == Problème de cohérence des droits en lecture== |
Un autre problème à résoudre est la difficulté de gérer un | Un autre problème à résoudre est la difficulté de gérer un | ||
Ligne 299 : | Ligne 286 : | ||
− | + | ===[[Fichier:Figure 3. Incohérences entre les droits accordés et les réseaux correspondants.png|center|520px|thumb| '''Figure 3. Incohérences entre les droits accordés et les réseaux correspondants''' ]]=== | |
− | Figure 3. Incohérences entre les droits accordés et les réseaux | ||
− | correspondants | ||
− | |||
− | |||
− | |||
Ligne 312 : | Ligne 294 : | ||
référencer les fragments de EA. | référencer les fragments de EA. | ||
− | == | + | == Atelier et production collaborative== |
Pour résoudre les problèmes de cohérence relevés | Pour résoudre les problèmes de cohérence relevés | ||
Ligne 359 : | Ligne 341 : | ||
la gestion humaine de la dynamique de l'atelier. | la gestion humaine de la dynamique de l'atelier. | ||
− | == | + | == Sécurisation des contenus face aux modifications== |
Un système fortement dynamique doit assurer à ses utilisateurs, | Un système fortement dynamique doit assurer à ses utilisateurs, | ||
Ligne 389 : | Ligne 371 : | ||
− | + | ===[[Fichier:Historisation versionnage dans Scenari4 .png|center|520px|thumb|'''Figure 4. Historisation versionnage dans Scenari4 (C2M:L5c)''']]=== | |
− | |||
− | Figure 4. Historisation versionnage dans Scenari4 (C2M:L5c) | ||
− | |||
− | |||
Ligne 403 : | Ligne 381 : | ||
de la création de la version v1 de "anomalie.chapter". | de la création de la version v1 de "anomalie.chapter". | ||
− | + | == Autres fonctions de gestion de la dynamique éditoriale au sein des ateliers== | |
− | == | ||
D'autres fonctions ont été conçues, expérimentées et | D'autres fonctions ont été conçues, expérimentées et | ||
Ligne 410 : | Ligne 387 : | ||
vivants par les utilisateurs (C2M:L2d)(C2M:L3e), on pourra citer : | vivants par les utilisateurs (C2M:L2d)(C2M:L3e), on pourra citer : | ||
− | + | * l'information des utilisateurs sur l'activité du système : | |
des logs permettent aux utilisateurs de connaître les | des logs permettent aux utilisateurs de connaître les | ||
actions concurrentes en cours dans le système, ou | actions concurrentes en cours dans le système, ou | ||
passées en leur absence ; | passées en leur absence ; | ||
− | + | * la programmation et l'organisation des modifications : | |
− | gestion de tâches et cycles de vie au niveau des | + | la gestion de tâches et cycles de vie au niveau des |
fragments permet de planifier le comportement du | fragments permet de planifier le comportement du | ||
système et d'anticiper les modifications à venir ; | système et d'anticiper les modifications à venir ; | ||
− | + | *la possibilité de ne pas répercuter des modifications : | |
− | moment de la modification d'un fragment les utilisateurs | + | au moment de la modification d'un fragment les utilisateurs |
qui l'utilisent au sein de leurs réseaux sont alertés et | qui l'utilisent au sein de leurs réseaux sont alertés et | ||
peuvent choisir de rester brancher sur une version | peuvent choisir de rester brancher sur une version | ||
Ligne 428 : | Ligne 405 : | ||
utilisateurs que lorsque c'est nécessaire ; | utilisateurs que lorsque c'est nécessaire ; | ||
− | + | *les outils de comparaison et fusion : | |
− | + | les utilisateurs doivent pouvoir facilement visualiser les différences | |
− | doivent pouvoir facilement visualiser les différences | ||
entre fragments et réseaux de fragments pour décider | entre fragments et réseaux de fragments pour décider | ||
lesquels référencer, voire créer des versions hybrides (Vu | lesquels référencer, voire créer des versions hybrides (Vu | ||
& al., 2011) ; | & al., 2011) ; | ||
− | + | * les outils de communication éditoriale et d'aide à l'interprétation : | |
− | l'interprétation : les utilisateurs peuvent échanger | + | les utilisateurs peuvent échanger |
(annotations, commentaires...) autour des fragments | (annotations, commentaires...) autour des fragments | ||
pour discuter leurs évolutions ; | pour discuter leurs évolutions ; | ||
− | + | * le principe de la dérivation d'atelier : | |
− | créer une copie virtuelle d'un atelier, afin d'effectuer des | + | il est possible de créer une copie virtuelle d'un atelier, afin d'effectuer des |
surcharges de certains fragments, les fragments non | surcharges de certains fragments, les fragments non | ||
surchargés restant ceux de l'atelier d'origine (et | surchargés restant ceux de l'atelier d'origine (et | ||
Ligne 451 : | Ligne 427 : | ||
pour lui associer une logique de clonage contrôlée). | pour lui associer une logique de clonage contrôlée). | ||
− | == | + | == Document-dossier et bibliothèque pour la stabilisation documentaire== |
L'atelier est le lieu de l'élaboration du contenu, mais son | L'atelier est le lieu de l'élaboration du contenu, mais son | ||
Ligne 475 : | Ligne 451 : | ||
− | Figure 5. Structure d'un DD | + | ===[[Fichier:Figure 5. Structure d'un DD.png|center|520px|thumb|'''Figure 5. Structure d'un DD''']]=== |
− | |||
− | |||
Ligne 499 : | Ligne 473 : | ||
+ | ===[[Fichier:Organisation atelier-bibliothèque.png|center|520px|thumb|'''Figure 6. Organisation atelier-bibliothèque''']]=== | ||
− | Figure | + | ===[[Fichier:Source XML de la description d'un DD.png|center|520px|thumb|'''Figure 7. Source XML de la description d'un DD''']]=== |
− | |||
− | + | ==Conclusion et perspectives== | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | == | ||
Le projet C2M a permis d'aboutir au logiciel Scenari4, disponible | Le projet C2M a permis d'aboutir au logiciel Scenari4, disponible | ||
Ligne 551 : | Ligne 518 : | ||
la dynamique du système (C2M:L5f). | la dynamique du système (C2M:L5f). | ||
− | == | + | == Remerciements== |
L'auteur remercie l'ANR pour son soutien, l'ensemble des | L'auteur remercie l'ANR pour son soutien, l'ensemble des | ||
Ligne 557 : | Ligne 524 : | ||
travail de conception et de développement réalisé sur Scenari4. | travail de conception et de développement réalisé sur Scenari4. | ||
− | |||
− | |||
− | |||
− | |||
− | Bachimont B., Crozat S. (2004) | + | ==Références== |
− | documents : pour une séparation fonds/forme. Revue I3, vol 4, | + | === Bibliographie=== |
− | num 1. | + | |
+ | |||
+ | {{CIDE biblio | ||
+ | |id=Crozat, Montpellier 2015 | ||
+ | |id édité=[[A pour auteur cité::Jacques Andre|ANDRÉ, J.]], [[A pour auteur cité::Richard Furuta |FURUTA, R.]], [[A pour auteur cité::Vincent Quint |QUINT, V.]](1989) | ||
+ | |texte= « Structured documents. Cambridge University Press. »}} | ||
+ | |||
+ | {{CIDE biblio | ||
+ | |id=Crozat, Montpellier 2015 | ||
+ | |id édité=[[A pour auteur cité:: Bruno Bachimont|BACHIMONT, B.]], [[A pour auteur cité:: Stéphane Crozat |CROZAT, S.]],(2004) | ||
+ | |texte= « Instrumentation numérique des documents : pour une séparation fonds/forme. Revue I3, vol 4, num 1. »}} | ||
− | Bachimont B. (2007) | + | {{CIDE biblio |
− | contenus : le numérique entre ontologies et documents. | + | |id=Crozat, Montpellier 2015 |
− | Lavoisier. Hermès. | + | |id édité=[[A pour auteur cité:: Bruno Bachimont|BACHIMONT, B.]],(2007) |
+ | |texte= «Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. Lavoisier. Hermès.»}} | ||
− | Crozat S. (2007) | + | {{CIDE biblio |
+ | |id=Crozat, Montpellier 2015 | ||
+ | |id édité=[[A pour auteur cité:: Stéphane Crozat |CROZAT, S.]],(2007) | ||
+ | |texte= « Scenari, la chaîne éditoriale libre. Eyrolles.»}} | ||
− | Dupoirier G. (1995) | + | {{CIDE biblio |
− | management des documents électroniques. Hermes. | + | |id=Crozat, Montpellier 2015 |
+ | |id édité=[[A pour auteur cité:: Gérard Dupoirier |DUPOIRIER, G.]],(1995) | ||
+ | |texte= « Technologie de la GED : Techniques et management des documents électroniques. Hermes.»}} | ||
− | Gaillard L. (2010) | + | {{CIDE biblio |
− | discours multimédias : applications audiovisuelles. Thèse de | + | |id=Crozat, Montpellier 2015 |
− | doctorat de l'UTC. | + | |id édité=[[A pour auteur cité:: Ludovic Gaillard| GAILLARD , L.]],(2010) |
+ | |texte= « Modélisation rhétorique pour la publication de discours multimédias : applications audiovisuelles. Thèse de doctorat de l'UTC..»}} | ||
− | Geurts J., Morizet-Mahoudeaux P., Crozat S. (2011) | + | {{CIDE biblio |
− | collaborative de documents fragmentés. Actes du colloque | + | |id=Crozat, Montpellier 2015 |
− | IC2011, Paris. | + | |id édité=[[A pour auteur cité::Joost Geurts| GEURTS, J.]], [[A pour auteur cité:: Pierre Morizet-Mahoudeaux P.|MORIEZET-MAHOUDEAUX, P.]],[[A pour auteur cité:: Stéphane Crozat |CROZAT, S.]] ,(2011) |
+ | |texte= « Édition collaborative de documents fragmentés. Actes du colloque IC2011, Paris.»}} | ||
− | Nelson, T. H. (1981) | + | {{CIDE biblio |
− | + | |id=Crozat, Montpellier 2015 | |
− | + | |id édité=[[A pour auteur cité::Nelson Heat Trace| NELSO, T. H.]],(1981) | |
− | + | |texte= «Literary Machines. Mindful Press.»}} | |
− | + | {{CIDE biblio | |
− | + | |id=Crozat, Montpellier 2015 | |
− | + | |id édité=[[A pour auteur cité::Pédauque, Roger T.| PÉDAUQUE, R.T.]],(2005) | |
− | + | |texte= «Le texte en jeu : Permanence et transformations du document. [http://archivesic.ccsd.cnrs.fr/ docs/00/06/26/01/PDF/sic_00001401.pdf]»}} | |
− | + | {{CIDE biblio | |
− | + | |id=Crozat, Montpellier 2015 | |
− | + | |id édité=[[A pour auteur cité:: Xuan TRUONG | TRUONG , X.]],[[A pour auteur cité:: Pierre Morizet-Mahoudeaux P.|MORIEZET-MAHOUDEAUX, P.]],[[A pour auteur cité::Joost Geurts| GEURTS, J.]],[[A pour auteur cité:: Stéphane Crozat |CROZAT, S.]] ,(2011) | |
+ | |texte= «Extension d'un algorithme Diff & Merge au Merge Interactif de documents structurés. Actes du colloque CIDE.14 "Le document à l'ère de la différenciation numérique", Rabat, Maroc.»}} | ||
− | + | {{CIDE biblio | |
+ | |id=Crozat, Montpellier 2015 | ||
+ | |id édité=[[A pour auteur cité:: Erik Wilde| WILDE , E.]],[[A pour auteur cité:: David Lowe|LOWE, D.]],(2002) | ||
+ | |texte= «XPath, XLink, XPointer, and XML: A practical guide to Web hyperlinking and transclusion. Pearson Education.»}} | ||
− | + | ===Références Internet=== | |
− | |||
− | + | *ANR. L'Agence Nationale de la Recherche. [http://www.agencenationale-recherche.fr]. | |
− | [http://www. | ||
− | + | *C2M. Chaînes éditoriales Collaboratives Multimédia. [http://www.utc.fr/ics/c2m]. | |
− | [http://www. | ||
− | + | *Cap Digital. Business cluster for digital content. [http://www.capdigital.com]. | |
− | |||
− | |||
− | + | * DITA. Darwin Information Typing Architecture (DITA) Version 1.2. OASIS standard.[http://docs.oasis-open.org/dita/v1.2/spec/DITA1.2-spec.html] | |
− | [http:// | ||
− | + | * OrientDB. The NoSQL Graph-Document DBMS. [http://www.orientdb.org] | |
− | |||
+ | *Scenari. scenari-platform.org : portail de la communauté Scenari. [http://scenari-platform.org] | ||
− | Systematic. Paris region systems ans ICT cluster. | + | *Systematic. Paris region systems ans ICT cluster. [http://www.systematic-paris-region.org]. |
− | [http://www.systematic-paris-region.org]. | ||
− | + | ===Livrables du projet C2M=== | |
− | Tous les livrables du projet C2M, référencés (C2M:LXx) sont | + | *Tous les livrables du projet C2M, référencés (C2M:LXx) sont consultables via la section "Livrables" du site [http://www.utc.fr/ics/c2m]. |
− | consultables via la section "Livrables" du site | ||
− | http://www.utc.fr/ics/c2m. |
Version actuelle datée du 6 décembre 2017 à 11:24
C2M : Chaînes éditoriales collaboratives multimédia
|
Sommaire
- 1 Introduction
- 2 Rééditorialisation par transclusion
- 3 Principe de la transclusion
- 4 Rééditorialisation en contexte collaboratif
- 5 Problème de la propagation des modifications
- 6 Problème de cohérence des droits en lecture
- 7 Atelier et production collaborative
- 8 Sécurisation des contenus face aux modifications
- 9 Autres fonctions de gestion de la dynamique éditoriale au sein des ateliers
- 10 Document-dossier et bibliothèque pour la stabilisation documentaire
- 11 Conclusion et perspectives
- 12 Remerciements
- 13 Références
- Résumé
- Nous présentons dans cet article le résultat principal du projet C2M à travers Scenari4, un système de gestion de contenus structurés et fragmentés en contexte collaboratif. La principale difficulté est la gestion de la rééditorialisation et de la transclusion. Nous proposons les concepts d'atelier dynamique et de réseau de fragments vivants, et de bibliothèque et de document-dossier pour y remédier. Scenari4 est disponible sous licence FLOSS et est expérimenté dans plusieurs contextes expérimentaux et commerciaux.
- Mots-clés
- XML, Chaîne Éditoriale, Document Structuré, Document Fragmenté, Transclusion, Rééditorialisation, ECM.
- Abstract
- We present in this paper the main result of the C2M project through Scenari4, a system able to manage structured and fragmented contents in a collaborative context. The main issue is related to repurposing and transclusion management. We submit the concepts of dynamic workspace and network of live fragments, and static library and folder-documents to deal with it. Scenari4 is released under FLOSS license and has been being used in several experimental and commercial contexts.
- Keywords
- XML Publishing Chain, Structured Document, Fragmented Document, Transclusion, Repurposing, ECM.
Introduction
Le projet C2M (Chaînes éditoriales Collaboratives Multimédia) est un projet français de recherche industrielle soutenu par l'Agence Nationale de la Recherche et les pôles de compétitivité Cap Digital et Systematic, mené de septembre 2009 à mars 2012. Le projet a été coordonné par l'Université de Technologie de Compiègne et a associé les sociétés Kelis et Amexio, les laboratoires UMR-CNRS 7253 Heudiasyc et INRIA Rhône-Alpes, ainsi que l'Institut National de l'Audiovisuel.
Le projet C2M se positionne à l'intersection de deux évolutions - technologiques et d'usages - centrales dans le contexte des mutations documentaires liées à l'avènement du numérique : les chaînes éditoriales XML et les ECM (Enterprise Content Management).
La première de ces évolutions est celle de la chaîne éditoriale, une technologie orientée vers la production et de publication de documents structurés. Un document structuré est un document : «décrit comme une collection d'objets comportant des objets de plus haut niveau composés d'objets plus primitifs. Les relations entre ces objets représentent les relations logiques entre les composants du document. Par exemple [...] un livre est divisé en chapitres, chaque chapitre en sections, soussections, paragraphes, etc. (André & al., 1989)». Les premiers développements datent du début des années 80, avec LaTeX et SGML, en particulier dans les milieux ayant des enjeux documentaires prégnants (l'aéronautique typiquement). L'accès aux chaînes éditoriales a depuis été démocratisé par le standard XML et les outils logiciels qui se sont développés autour. L'intérêt de cette approche est de pousser la puissance éditoriale du document numérique et de dépasser les pratiques bureautiques : encadrement rédactionnel, publication multisupports, réutilisation sans recopie, intégration multimédia... (Crozat, 2007).
La seconde de ces évolutions est celle du documentaire collaboratif, développé dès les années 80 à travers la GED (Dupoirier, 1995), prolongé dans les années 90 par les CMS Web, et consacré au milieu des années 2000 par l'ECM en entreprise d'une part, et les usages grand public dit "Web 2.0" d'autre part (C2M:L2e)(C2M:L5c). La force de ces nouveaux usages est avant tout la démocratisation des outils de création et de diffusion : chacun peut facilement écrire et publier en ligne. Elle est également vecteur d'une interrogation sur les acteurs et les pratiques : les frontières classiques entre auteurs, lecteurs, éditeurs, rédacteurs ou contributeurs tendent à se reconfigurer.
Le projet C2M repose sur l'idée qu'il y a un intérêt très fort à faire cohabiter les avantages de la chaîne éditoriale et ceux des outils documentaires collaboratifs. L'objectif est de concevoir un système permettant à la fois la réalisation d'une documentation hautement qualitative, respectant les exigences de contextes professionnels pour lesquels le document a une valeur essentielle (documentation technique, formation...) ; et des usages collaboratifs permettant à des communautés de s'organiser autour de cycles innovants de gestion de l'information : production, maintenance, qualification, diffusion, etc. Il s'inscrit scientifiquement dans la recherche en ingénierie documentaire, au sens des systèmes informatiques optimisant l'articulation de la manipulation technique et de l'interprétation humaine des documents (Bachimont, 2007) ; et technologiquement dans la continuité du projet Scenari initié à l'UTC en 1999 et édité depuis 2004 par le société Kelis. Le principal résultat du projet est le logiciel Scenari4, qui ajoute la dimension collaborative de la gestion de contenus structurés et fragmentés grâce à l'intégration d'une base de données orientée graphe (qui s'appuie sur les couches bas niveau d'OrientDb).
Rééditorialisation par transclusion
La rééditorialisation est un processus documentaire consistant à reconstruire un nouveau document à partir d'archives. Dans les systèmes éditoriaux non numériques, la rééditorialisation est essentiellement un travail de recopie fondamentalement peu différent d'un travail de production originale. Les systèmes numériques ont apporté une rupture avec la possibilité de cloner (copier/coller) un fragment documentaire. Ce principe fonctionnel a considérablement affecté les pratiques éditoriales par l'automatisation de la rééditorialisation qu'il supporte, et nombre de documents sont aujourd'hui reconstruits par un tel processus. Si le clonage du contenu dans les systèmes numériques est un principe d'automatisation de la production, il engendre la redondance de l'information. En effet le même fragment documentaire, copié/collé à plusieurs reprises, existe à plusieurs endroits au sein d'un fonds documentaire, avec les conséquences néfastes que cela engendre sur la qualité de l'information (typiquement, incohérence des mises à jour).
L'alternative au clonage est la transclusion (Nelson, 1981), c'est à dire le référencement multiple via une adresse d'un contenu inscrit une unique fois, plutôt que sa recopie. Ce concept est peu mobilisé dans les processus d'écriture ordinaire, bien que des standards comme XLink et Xpointer (Wilde & Lowe, 2002) aient tenté d'oeuvrer en ce sens et que des technologies comme HTML permettent d'implémenter en partie ce concept (iframe par exemple). En revanche ce principe est mobilisé dans certains domaines métier comme la documentation technique à travers les principes du standard DITA et les Component Content Management Systems (C2M:L5c) qui l'instrumentent ; ou dans le domaine de l'audiovisuel où le coût de la copie est élevé, l'éditorialisation est alors «une activité d'écriture par un auteur qui puise dans un fonds d'archive et qui réagence des contenus jugés pertinents pour son propos (Gaillard, 2010)».
C'est ce principe qui est au coeur de la chaîne éditoriale XML Scenari qui instrumente nativement un contenu comme un
réseau de fragments qui se manifeste en document au moment de la publication (Geurts & al., 2011).
Principe de la transclusion
Soit un document d1 contenant une information i1 à l'adresse &1. Dans le premier cas (clonage) l'information i1 est copiée à l'adresse &2 dans le document d2, devenant de fait une autre information i1' (bien qu'identique au moment de sa copie, elle pourra librement diverger par la suite). Dans le second cas (transclusion) une référence vers l'adresse &1 est ajoutée au même endroit du document, à l'adresse &2. Un programme informatique adéquat saura résoudre la référence située à &2 et rapatrier le contenu pointé i1.
Finalement les documents d2 et d2' contiennent la même information, mais la façon dont cette information est stockée est différente, avec des conséquences profondes sur la nature documentaire associée à chaque approche. Avec la copie, les documents d1 et d2 restent représentés par deux instances numériques indépendantes, comme dans un cas traditionnel ils peuvent être indépendamment transportés, mis à jour, détruit... Avec la transclusion en revanche, d1 et d2' sont représentés par une seule et même instance numérique devenu un réseau de fragments qui dépendent les uns des autres, ainsi par exemple la mise à jour de i1 dans d1 entraînera a priori la modification de d2'. Elle l'entraînera de fait si cette modification est inscrite directement à l'adresse &1, elle ne l'entraînera pas si elle est inscrite à une adresse &1' (correspondant alors à une nouvelle version de i1), et que la référence n'est pas mise à jour dans d2'.
Rééditorialisation en contexte collaboratif
Le numérique met intrinsèquement à mal la notion traditionnelle de document (Pedauque, 2005). En effet celui-ci n'est objectivable qu'à travers la reconstruction calculée d'une ressource binaire, qui n'est elle même jamais accessible directement (Bachimont & Crozat, 2004). Tout document numérique n'est donc déjà plus vraiment un document : ce qu'on lit n'est pas ce qui est écrit.
La notion de document structuré renforce ce décalage en assumant la non identité entre ressource binaire et document lisible, afin d'en proposer plusieurs reconstructions - ou vues - qui se constituent en un dossier (Ibid.). Une ressource permet alors d'engendrer plusieurs documents : on passe d'une relation de type 1:1 à une relation 1:N.
La transclusion accentue encore le décalage : le document n'est plus le résultat d'un calcul à partir d'une ressource, mais à partir d'un réseau de ressources, dont chacune a une vie propre, dont chacune peut être connectée à d'autres ressources, qui ont des vies propres. Plusieurs ressources permettent alors d'engendrer plusieurs documents, on passe à une relation de type N:M. Un problème typique de cette relation N:M est qu'une mise à jour d'un fragment peut être souhaitable pour un document qui l'exploite, mais pas pour un autre. Un système de rédaction de documents fragmentés doit alors proposer une couche logicielle de gestion qui permettra à l'auteur à la fois l'intelligibilité et le maintien de la cohérence de l'ensemble.
Enfin l'introduction de la collaboration, c'est à dire l'intervention de plusieurs acteurs, au sein d'un système fondamentalement transclusif introduit une quatrième couche de complexité : chaque acteur n'a plus qu'une appréhension parcellaire du réseau et par conséquent ne peut à lui seul maintenir la cohérence, qui devient du ressort d'un collectif.
L'enjeu est donc in fine la capacité à maintenir la cohérence de plusieurs documents issus d'un même réseau de fragments vivants, dans un environnement où plusieurs utilisateurs sont en concurrence. La stratégie visée est de repenser, de rendre opérationnelles et d'étendre les fonctions classiques du documentaire collaboratif (gestion des accès, historisation, transaction, workflow...) pour ces objets nouveaux que sont les fragments et les réseaux de fragments.
Problème de la propagation des modifications
Dans la figure ci-après les fragments 1 et 4 référencent le fragment 3. Al effectue une modification de 3 en 3'. La transclusion implique que ce changement aura un impact sur 1, mais également sur 4. Or Al peut très bien ne pas maîtriser le contexte de 4, voire ne pas savoir du tout que le fragment 3 qu'il a modifié est utilisé dans d'autres contextes par d'autres acteurs. Il ne peut donc en tenir compte dans son travail de rédaction. Seul Bob pourra interpréter dans son contexte les modifications faites par Al et en étudier la cohérence.
Il devra alors prendre une décision parmi : référencer 3' et donc répercuter la modification ; continuer de référencer 3 (l'ancienne version), sachant que les prochaines modifications de Al n'y seront plus répercutées ; faire une copie de 3 en 3 dans son contexte propre pour l'intégrer aux fragments qu'il va maintenir par la suite ; faire une copie de 3' en 3 dans son contexte pour créer un hybride entre 3 et 3'... Bien entendu ces questions dépendent fondamentalement de la nature de la modification, la correction d'une erreur, d'une faute d'orthographe sera a priori toujours à propager, la modification de données techniques dépendra toujours du contexte. Par exemple si Al gère la documentation technique canonique d'un progiciel et Bob la documentation du déploiement de ce progiciel dans une entreprise, la mise à jour générée par Al lors de l'évolution du progiciel ne devra être propagée qu'au moment du déploiement réel en entreprise.
Problème de cohérence des droits en lecture
Un autre problème à résoudre est la difficulté de gérer un réseau de fragments avec les logiques de gestion de droits usuels (C2M:L2c). En effet si un utilisateur accède à un fragment, cela signifie logiquement qu'il doit pouvoir accéder à tout le réseau de fragments que celui-ci référence, puisqu'il n'y a pas de différence sémantique entre la réutilisation d'un fragment par clonage ou par transclusion. Donc pouvoir lire un fragment implique de pouvoir lire les fragment qu'il référence.
Or cela est contradictoire avec la définition d'accès fichier par fichier, ou même répertoire par répertoire, traditionnellement en vigueur dans les systèmes documentaires collaboratifs comme les ECM. Dans le cas 1 illustré ci-après, Albert est propriétaire de l'espace EA qui contient le fragment A et Bob est propriétaire de l'espace EB qui contient les fragments B1 et B2 tel que B1 référence B2. Bob donne l'accès à Albert sur B1 mais pas sur B2. La référence transclusive A->B1 est théoriquement possible, mais comme Albert n'a pas le droit d'accéder à B2, elle est pratiquement impossible, il y a contradiction : par exemple Albert ne pourra pas générer un document complet à partir de A. Dans le cas 2, Albert est propriétaire de l'espace EA qui contient le fragment A, Bob est propriétaire de l'espace EB qui contient B, et Charlie est propriétaire de l'espace EC qui contient C. Albert donne l'accès en lecture à Bob sur EA et Bob à Charlie sur EB. Le réseau C->B->A est possible, or Charlie n'a pas le droit d'accéder à A, il y a encore contradiction et Charlie a créé un réseau qu'il ne peut pas publier sous forme de document.
On notera que ces problèmes n'affectent en rien les droits d'écriture, si Charlie a le droit d'écrire dans EB, mais pas dans EA, cela ne pose aucun problème, tant qu'il a le droit de lire et référencer les fragments de EA.
Atelier et production collaborative
Pour résoudre les problèmes de cohérence relevés précédemment, le principe retenu est de limiter les référencements par transclusion à un espace bien délimité au sein duquel tous les utilisateurs forment une équipe de collaborateurs participant à un projet éditorial commun (Ibid.). On appelle atelier ce lieu de travail hautement collaboratif, et entrepôt l'ensemble des ateliers d'une organisation, correspondant à autant de projets et équipes différents. Les ateliers sont hermétiques entre eux, la réutilisation de contenu entre deux ateliers se fait par clonage (typiquement via un document-dossier, voir ci-après).
Le comportement par défaut d'un atelier est : d'une part que tous les utilisateurs autorisés à y accéder ont tous les droits en lecture sur tous les fragments (pas nécessairement en modification) ; et d'autre part que toutes les modifications sont automatiquement propagées au sein de l'atelier.
L'atelier est donc un espace de travail ouvert. Afin de mettre à disposition des utilisateurs des espaces de travail privés, non accessibles par les autres, une solution est de proposer à chaque utilisateur un atelier personnel auquel il est seul à pouvoir accéder. Une solution alternative (non implémentée à ce jour dans Scenari4) est d'autoriser des îlots privatifs au sein d'un atelier, qui peuvent être restreints en lecture, mais en contre-partie ne peuvent pas être la cible d'une relation de transclusion. Dans les deux cas le passage de la zone personnelle isolée à la zone collaborative commune se fait par copie (ou déplacement).
L'atelier est aussi un espace de travail dynamique, réceptacle d'un réseau de fragments vivants. Il permet une interaction très forte entre les acteurs mais engendre une forte instabilité documentaire, le réseau étant en constante mutation. Le contenu peut être modifié facilement et la perception de ces modifications n'est pas facile par chaque acteur pris indépendamment. Plusieurs pistes méthodologiques sont explorées pour pallier le risque de perte de la maîtrise des modifications par les utilisateurs : circonscrire l'atelier à un nombre limité d'acteurs ; maîtriser les relations transclusives inter-acteurs ; limiter les relations transclusives entre des fragments "éloignés" du point de vue des usages... Des fonctions logicielles sont également développées pour assister la gestion humaine de la dynamique de l'atelier.
Sécurisation des contenus face aux modifications
Un système fortement dynamique doit assurer à ses utilisateurs, que, quelque soit son activité, ils auront la possibilité de retrouver tout contenu dans un état qu'il ont connu. Typiquement tout utilisateur doit pouvoir retrouver un contenu dans l'état où il l'a laissé avant que d'autres utilisateurs ne le modifie. Dans Scenari4, cette sécurité passe par deux fonctions, l'historisation automatique de chaque fragment, et le versionnage manuel de réseau de fragments.
À chaque modification et sauvegarde d'un fragment, le système crée automatiquement une nouvelle version du fragment modifié, et conserve l'ancienne en lecture seule. C'est le modèle de fonctionnement de la plupart des Wikis. Ceci permet de remonter dans le temps et retrouver l'état antérieur de n'importe quel fragment. Néanmoins, en contexte fortement fragmenté, retrouver l'état voulu d'un réseau de fragments peut vite devenir un casse-tête insoluble, puisqu'il faut identifier une par une chaque version de chaque fragment.
Le versionnage manuel de réseau de fragments vient pallier cette difficulté : l'utilisateur peut à tout moment demander au système de créer un snapshot (une image instantanée), d'un fragment et de l'ensemble de ses fragments liés (récursivement). Le résultat est un réseau de fragments morts (en lecture seule), qui pourra donc être consulté en vase clôt à tout moment.
On visualise sur cette copie d'écran le fragment "anomalie.chapter", en haut à droite son historique de modification, et an bas à droite la version "v1" qui permettra notamment de retrouver le fragment lié "cfNoticesIndividuelles.chunk" dans l'état où il était au moment de la création de la version v1 de "anomalie.chapter".
Autres fonctions de gestion de la dynamique éditoriale au sein des ateliers
D'autres fonctions ont été conçues, expérimentées et implémentées pour assister la gestion du réseau de fragments vivants par les utilisateurs (C2M:L2d)(C2M:L3e), on pourra citer :
- l'information des utilisateurs sur l'activité du système :
des logs permettent aux utilisateurs de connaître les actions concurrentes en cours dans le système, ou passées en leur absence ;
- la programmation et l'organisation des modifications :
la gestion de tâches et cycles de vie au niveau des fragments permet de planifier le comportement du système et d'anticiper les modifications à venir ;
- la possibilité de ne pas répercuter des modifications :
au moment de la modification d'un fragment les utilisateurs qui l'utilisent au sein de leurs réseaux sont alertés et peuvent choisir de rester brancher sur une version historisée du fragment ou de se brancher sur la version courante (live), la difficulté étant de n’interroger les utilisateurs que lorsque c'est nécessaire ;
- les outils de comparaison et fusion :
les utilisateurs doivent pouvoir facilement visualiser les différences entre fragments et réseaux de fragments pour décider lesquels référencer, voire créer des versions hybrides (Vu & al., 2011) ;
- les outils de communication éditoriale et d'aide à l'interprétation :
les utilisateurs peuvent échanger (annotations, commentaires...) autour des fragments pour discuter leurs évolutions ;
- le principe de la dérivation d'atelier :
il est possible de créer une copie virtuelle d'un atelier, afin d'effectuer des surcharges de certains fragments, les fragments non surchargés restant ceux de l'atelier d'origine (et continuant donc d'évoluer comme eux), tandis que les fragments surchargés sont informés des modifications de leur fragments d'origine pour éventuellement suivre leurs mises à jour (cette fonction de dérivation-surcharge permet de sortir de la logique purement transclusive, pour lui associer une logique de clonage contrôlée).
Document-dossier et bibliothèque pour la stabilisation documentaire
L'atelier est le lieu de l'élaboration du contenu, mais son caractère dynamique le rend peu propice à l'établissement documentaire, au sens d'une forme stable, fermée, objectivable et appropriable. Dans le prolongement de travaux antérieurs (Bachimont & Crozat, 2004), nous avons forgé le concept de document-dossier comme pendant statique au réseau de fragments vivants (C2M:L2a). Un document-dossier (DD) est une version figée d'un réseau de fragments, associée éventuellement à ses formes documentaires (HTML, PDF...). Un DD est composé : d'une unique forme génératrice FG' ; de plusieurs (zéro à n) formes publiées FP ; d'un modèle M ; et de métadonnées MD. FG' est un ensemble de fragments XML reliés entre eux, versionné à un instant t à partir d'un réseau FG vivant dans l'atelier. Les FP sont des formes lisibles de FG' permettant son interprétation humaine. Le modèle correspond à l'ensemble du code (schéma, fonctions de transformation...) nécessaire à la manipulation informatique de FG'. Et les métadonnées permettent l'identification documentaire du DD via des descripteurs standard (comme Dublin Core par exemple).
Si l'écriture collaborative s'effectue sur des réseaux de fragments vivants au sein d'un atelier, la stabilisation documentaire et les échanges d'objets identifiés comme documents sont effectués via des documents-dossiers, qui peuvent alors être rangés dans des bibliothèques. Les DD stockés dans des bibliothèques peuvent être consultés par les lecteurs, les FP offrant des formes stables et fermées permettant l'appropriation du contenu ; ou peuvent être réinjectés dans des ateliers et ainsi trouver une seconde vie, la FG' et la connaissance du modèle permettant de ré-ancrer les fragments dans un nouveau réseau vivant (le document-dossier est ainsi un support à une collaboration restreinte entre ateliers). Une bibliothèque peut typiquement être implémentée avec un ECM (comme Nuxeo, Alfreco, Documentum...), une version expérimentale simplifiée a été réalisée dans le cadre de C2M (C2M:L3d), et l'intégration d'une bibliothèque native dans Scenari4 est prévue à terme (C2M:L2f).
Conclusion et perspectives
Le projet C2M a permis d'aboutir au logiciel Scenari4, disponible sous licence FLOSS, qui propose une solution unique pour l'édition collaborative de documents structurés et fragmentés, indépendamment de tout modèle de document et de tout processus de collaboration a priori. Ce produit a été présenté aux salons Documation et Elearning Expo et est d'ors et déjà valorisé par Kelis avec ses clients (Essilor, Total, ENFIP, Ucanss...) et dans le cadre de nouveaux projets, comme le site service-public.fr, dont Kelis a remporté l'appel en mars 2012. La recherche et développement de Scenari4 est également poursuivie au travers de contextes expérimentaux : l'Ina pour la valorisation d'archives radiophoniques ; la société de restauration Quick pour la création d'une base de ressources communes entre différents départements ; l’institut de formation burkinabé 2IE pour la mise en place d'une base documentaire pédagogique multi-contextes ; ou le laboratoire Costech pour la mise en place d'une revue électronique (C2M:L4c)(C2M:L4d). Ces différents terrains permettent d'instancier plusieurs modèles de chaîne éditoriale collaborative, et ainsi de mieux cerner les fonctions nécessaires, ainsi que leurs variations en fonction des contextes. Deux démonstrateurs ont également été implémentés avec Scenari4 afin d'illustrer ses nouveaux potentiels. Graphene pour la documentation technique collaborative (C2M:L5c), et Webmedia2 pour la publication multimédia de web-conférences, web-documentaires, web-clips... (C2M:L4d)
Enfin deux thèses CIFRE UTC-Kelis prolongent les recherches théoriques. La première, commencée en septembre 2011, cherche à approfondir la question de la modélisation des processus collaboratifs en relation avec les structures documentaires, pour rationaliser la spécialisation du logiciel en fonction du contexte. La seconde, prévue en 2012, vise à établir des outils philologiques d'analyse des documents structurés et fragmentés pour aider les rédacteurs dans leurs décisions face à la dynamique du système (C2M:L5f).
Remerciements
L'auteur remercie l'ANR pour son soutien, l'ensemble des acteurs du projet C2M, et Sylvain Spinelli pour le formidable travail de conception et de développement réalisé sur Scenari4.
Références
Bibliographie
[ANDRÉ, J., FURUTA, R., QUINT, V.(1989)] ↑ « Structured documents. Cambridge University Press. »
[BACHIMONT, B., CROZAT, S.,(2004)] ↑ « Instrumentation numérique des documents : pour une séparation fonds/forme. Revue I3, vol 4, num 1. »
[BACHIMONT, B.,(2007)] ↑ «Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. Lavoisier. Hermès.»
[CROZAT, S.,(2007)] ↑ « Scenari, la chaîne éditoriale libre. Eyrolles.»
[DUPOIRIER, G.,(1995)] ↑ « Technologie de la GED : Techniques et management des documents électroniques. Hermes.»
[GAILLARD , L.,(2010)] ↑ « Modélisation rhétorique pour la publication de discours multimédias : applications audiovisuelles. Thèse de doctorat de l'UTC..»
[GEURTS, J., MORIEZET-MAHOUDEAUX, P.,CROZAT, S. ,(2011)] ↑ « Édition collaborative de documents fragmentés. Actes du colloque IC2011, Paris.»
[NELSO, T. H.,(1981)] ↑ «Literary Machines. Mindful Press.»
[PÉDAUQUE, R.T.,(2005)] ↑ «Le texte en jeu : Permanence et transformations du document. docs/00/06/26/01/PDF/sic_00001401.pdf»
[TRUONG , X.,MORIEZET-MAHOUDEAUX, P.,GEURTS, J.,CROZAT, S. ,(2011)] ↑ «Extension d'un algorithme Diff & Merge au Merge Interactif de documents structurés. Actes du colloque CIDE.14 "Le document à l'ère de la différenciation numérique", Rabat, Maroc.»
[WILDE , E.,LOWE, D.,(2002)] ↑ «XPath, XLink, XPointer, and XML: A practical guide to Web hyperlinking and transclusion. Pearson Education.»
Références Internet
- ANR. L'Agence Nationale de la Recherche. [1].
- C2M. Chaînes éditoriales Collaboratives Multimédia. [2].
- Cap Digital. Business cluster for digital content. [3].
- DITA. Darwin Information Typing Architecture (DITA) Version 1.2. OASIS standard.[4]
- OrientDB. The NoSQL Graph-Document DBMS. [5]
- Scenari. scenari-platform.org : portail de la communauté Scenari. [6]
- Systematic. Paris region systems ans ICT cluster. [7].
Livrables du projet C2M
- Tous les livrables du projet C2M, référencés (C2M:LXx) sont consultables via la section "Livrables" du site [8].