CIDE (2009) Musnik : Différence entre versions
imported>Abdelhakim Aidene (→Références bibliographiques) |
imported>Abdelhakim Aidene |
||
Ligne 112 : | Ligne 112 : | ||
− | [[Fichier:CIDE (2009) | + | [[Fichier:CIDE (2009) Musnik fig 1.png|center|400px|thumb|Figure 1 Les facettes du modèle ISIS [{{CIDE lien citation|7}}]]] |
Version du 7 juillet 2016 à 13:27
Caractériser l’information à partir des processus métiers : méthodes et enjeux
|
Sommaire
- 1 Introduction
- 2 Le contexte EDF et le cadre d’étude
- 3 Le cas d’étude : la préparation et la gestion de l’arrêt de tranche pour la maintenance des centrales nucléaires
- 4 Quelques pistes pour améliorer l’efficacité de la recherche d’information (RI)
- 5 Deux approches pour caractériser les connaissances métiers
- 6 L’introduction des TIC dans les pratiques professionnelles
- 7 Synthèse
- 8 Références bibliographiques
- 9 Notes
- Résumé
- Ce projet de recherche porte sur l’analyse et le traitement de contenus documentaires numériques volumineux et hétérogènes, la recherche pertinente et l’accès auxdits documents, situés dans un contexte opérationnel complexe. Cette étude a pour objectif d’apporter des éléments méthodologiques pour supporter la conception d’un outil de gestion de l’information, permettant de répondre au besoin informationnel "en situation", c’est-à-dire prenant en compte les problématiques des métiers mobilisés dans les activités d’exploitation et de maintenance d’une installation industrielle. L’analyse de la complémentarité de deux méthodes d’indexation est au centre de l’étude – l’une dite par « facettes » s’appuie sur l’analyse des processus organisationnels, l’autre dite « participative » se fonde sur la compréhension des activités métiers et introduit la dimension subjective de l’acteur en situation.
- Abstract
- This research project focuses on the analysis and processing of voluminous and heterogeneous digital documentary content, the information retrieval of and the relevant access to those documents, located in a complex operational context. This study aims to provide methodological framework to support the design of an information management tool, which could respond to the informational needs "in context", i.e. by taking into account the actor issues involved in the operations and maintenance activities of an industrial facility. The analysis of the complementarity of two different methods of indexing is the key issue of this study: one called “facetted classification”, based on the analysis of organizational processes, the other called “participative”, based on understanding the business activities which introduces the subjective dimension of the actors in situ.
Introduction
Confrontées à la nécessité d’une gestion efficace des connaissances, des entreprises industrielles, telle qu’EDF (Électricité de France), sont particulièrement intéressées par l’émergence et le déploiement des technologies de l’information et de la communication (TIC), qui ouvrent de nouvelles possibilités en termes d’accès à un nombre de sources d’information sans cesse croissant et de support aux démarches et processus de travail.
Définir une méthode d’analyse, de traitement et de caractérisation de l’information produite et utilisée dans un contexte opérationnel, en s’appuyant sur la compréhension des processus organisationnels d’une part, des activités et des connaissances métiers d’autre part, constitue une approche originale, qui permettrait de répondre au besoin informationnel des acteurs métiers et des opérationnels terrain impliqués dans des activités d’exploitation et de maintenance d’une installation industrielle complexe.
Dans une première partie nous décrirons le contexte général de l’étude ainsi que le cas d’application identifié, puis nous présenterons les pistes envisagées pour répondre aux problématiques de l’indexation et la recherche d’information en situation. Nous exposerons ensuite deux approches d’indexation : le modèle d’une infrastructure sémantique s’appuyant sur le principe de la classification à facettes, qui permet de caractériser les connaissances à partir des processus organisationnels, et l’indexation participative, qui, orientée sur les usages et la recherche d’information lors de leur utilisation par les métiers, viendra compléter la première approche. Nous introduirons par la suite les premières pistes d’une analyse portant sur l’impact des solutions considérées sur les pratiques métiers concernées.
Le contexte EDF et le cadre d’étude
Les problématiques caractéristiques d’EDF en regard de la recherche d’information
Le besoin de gestion des connaissances est particulièrement sensible à EDF, notamment dans le secteur de la production d’énergie nucléaire [1], dont les métiers sont très techniques et les exigences de sûreté, de disponibilité et de qualité de service importantes. La gestion des connaissances nécessaires à la conception, à l’exploitation, à la maintenance et à la déconstruction des installations constitue en effet un enjeu majeur. Cette nécessité de préserver et de transmettre les connaissances et savoir-faire métiers est accrue par un contexte qui présente un certain nombre de problématiques caractéristiques [2]:
- L’organisation complexe et multi-métiers de l’entreprise ;
- La répartition des sites, dispersés sur l’ensemble du territoire français ;
- Un secteur d’activité à risque très réglementé : l’ensemble des activités et processus critiques suivent des procédures strictes et sont soumises à de fortes contraintes, liées à la sûreté nucléaire, à la radioprotection et à la réglementation environnementale, qui tendent à complexifier les activités.
- La complexité et la variété des systèmes techniques et des outils de production : différentes technologies sont utilisées et plusieurs générations d’outils sont exploitées de manière parallèle ;
- Le renouvellement important des effectifs attendu entre 2007 et 2015 et la forte mobilité professionnelle interne des agents ;
- La durée des cycles de vie industriels, plus importante que la période d’activité professionnelle d’un agent ;
- Les forts enjeux économiques ;
- La mutation des contextes technique et socio-économique dans lesquels l’entreprise évolue : entre autres, l’arrivée d’une nouvelle génération de réacteurs et l’ouverture du marché de l’énergie à la concurrence et la dérégularisation du marché de l’électricité en France et en Europe.
EDF produit, en grande quantité et dans un cadre très réglementé, des données et des documents de conception, d’exploitation et de maintenance de différentes natures et de divers formats, relatifs à ses centrales de production d’énergie nucléaire. Une part importante des activités repose sur une exploitation « intelligente » de documents (utiliser les bons documents dans le bon contexte) – qu’il s’agisse de documents internes (Programmes de Base de Maintenance Préventive, Procédures d’Exploitation, Référentiels Qualité, etc.) ou de documents externes (documentation de constructeurs, normes, documents provenant d’autres exploitants, ouvrages de référence, supports réglementaires, etc.). Ce rôle central des documents (des informations et des connaissances qu’ils véhiculent) laisse entrevoir l’importance que peut revêtir l’efficacité de la recherche d’information. En effet, la problématique de la gestion des connaissances, des savoirs et des savoir-faire contenus dans les documents de l’entreprise, est considérée comme essentielle à la performance de l’ensemble des activités de conception, d’exploitation, de maintenance et de déconstruction des outils de production du Parc nucléaire.
Le cas d’étude : la préparation et la gestion de l’arrêt de tranche pour la maintenance des centrales nucléaires
Nous centrons notre étude sur un contexte particulier : celui de l’arrêt de tranche (AT), c’est-à-dire des périodes d’arrêt d’exploitation programmées, pendant lesquelles une unité de production d’électricité nucléaire est mise à l’arrêt pour procéder au rechargement du combustible et à des opérations de contrôle, d’entretien et de maintenance. Il s’agit d’un contexte fortement contraint du point de vue de la sûreté des installations et de la sécurité des biens et des personnes [2], mais également du nombre important d’opérations à réaliser sur l’installation dans un temps limité (par exemple, de l’ordre de 4000 activités en une trentaine de jours). Dans cette étude, deux phases nous intéressent particulièrement :
- La préparation de l’arrêt. Cette phase s’étend sur quelques mois, durant lesquels différents acteurs identifient puis planifient les opérations qui devront être réalisées pendant l’arrêt, en anticipant les possibles difficultés et en optimisant l’utilisation des ressources et la gestion du temps (l’objectif d’un arrêt étant de ne pas excéder la durée cible retenue lors de l’élaboration des plannings nationaux d’arrêt, qui sont les garants de l’équilibre national entre production et consommation énergétiques) ;
- La gestion des aléas lors de l’arrêt. S’inscrivant dans la phase de conduite de l’AT, la gestion des aléas correspond à des situations, risquant de remettre en cause le planning prévisionnel de l’arrêt, au cours desquelles il s’agit de comprendre un événement inattendu, d’identifier les solutions à mettre en œuvre et les appliquer, en minimisant les allongements de délais et les surcoûts.
Une bonne préparation et une gestion efficiente des aléas reposent sur l’exploitation efficace de nombreuses informations. Ainsi, lors de ces deux étapes, les acteurs impliqués peuvent-ils avoir à effectuer diverses recherches d’information, entre autres, sur la documentation technique disponible, les retours d’expérience passés, les « bonnes pratiques », le cadrage et les procédures d’exploitation et de maintenance. En outre, les fortes contraintes temporelles qui pèsent sur la préparation et surtout la gestion de l’AT, ainsi que les multiples dépendances entre les tâches à réaliser au cours de celles-ci, mettent en évidence l’importance de l’efficacité de ces recherches d’information.
Quelques pistes pour améliorer l’efficacité de la recherche d’information (RI)
Les principaux écueils de la RI
Dans ce contexte, caractérisé par le nombre important de documents et d'entités, la complexité des circuits d'élaboration et de gestion de ces documents et l'existence d'une organisation complexe en appui aux activités de préparation et de gestion de l’arrêt de tranche, les problématiques relatives à l’accès aux documents [8] et à la recherche pertinente de l’information en situation, ainsi que celle de l’indexation [1], constituent des points clés. Les principaux écueils de la RI sont ce qu’on appelle classiquement le « bruit » et le « silence » :
- Le « bruit » correspond au cas d’une recherche renvoyant à un nombre trop élevé de sources d’information, dont la plupart ne sont pas pertinentes, ce qui rend difficile l’identification des « bons » documents, correspondant au besoin informationnel des opérationnels terrain lors de la préparation de l’arrêt ou au cours de la gestion d’un aléa. À titre d’exemple, retrouver le ReX (retour d’expérience) relatif à un événement similaire à celui rencontré lors de l’AT dans l’ensemble des documents disponibles est quasiment impossible avec les outils actuels de recherche d’information compte-tenu de la dissémination des informations dans un grand nombre de bases.
- Le « silence » correspond au cas où un document pertinent, disponible, n’est pas présenté dans les résultats proposés par le système suite à une recherche d’information. Par exemple, même si un événement a déjà été rencontré par le passé, il est assez rare que le ReX associé ait été formalisé : il est ainsi souvent plus facile de faire appel à la mémoire des acteurs que de se retourner vers les bases documentaires.
En outre, la grande variété des sources (en termes de format, de contenu et de structure), la diversité des bases dans lesquelles sont stockés les documents, ainsi que les contraintes liées à la plus ou moins grande souplesse des droits d’accès aux documents, sont autant de problématiques caractéristiques de notre cas d’étude, qui rendent la recherche d’information peu évidente et conduisent aujourd’hui à des résultats insatisfaisants.
Les pistes envisagées
Notre étude, centrée sur l’appui à la recherche et à la bonne gestion de documents, a conduit à identifier certains axes de recherche pour répondre aux problématiques de la recherche d’information en situation. Ainsi, trois pistes ont été jusqu’à présent envisagées :
- L’étude des contextes de production des documents,de la structure et des processus organisationnels de l’entreprise, et de l’articulation entre les différentes entités et les métiers qui, en tant que ressources pour la modélisation d’un système de classification à facettes, constitueraient une première approche d’indexation des documents selon un point de vue institutionnel ;
- L’analyse de la représentation de domaines métiers spécifiques,via un système d’organisation des connaissances (SOC) [2] qui, en s’appuyant sur les représentations et le sens des notions manipulées, permettrait de faciliter et d’automatiser certaines étapes d’analyse lors de la classification des documents ;
- Une approche s’appuyant sur l’intégration d’éléments caractérisant le contexte d’utilisation des documents et l’utilité des informations qui y sont contenues, ainsi que sur les réseaux d’acteurs qui les manipulent. Cette approche permettrait d’introduire la dimension interprétative des acteurs en situation et d’intégrer, dans le système de gestion de l’information, la possibilité de rechercher une information selon des critères relatifs à la pertinence d’un document en fonction de son utilité lors de la gestion d’un aléa.
Nous envisageons ainsi d’étudier et d’expérimenter ces différentes approches de classification et d’indexation des connaissances, en partant de l’hypothèse que leur complémentarité, exploitée au sein d’un système de gestion électronique de documents, permettrait de rendre la recherche d’information en situation plus efficace.
Le projet de recherche
L’analyse des apports possibles de la complémentarité de deux démarches caractérisation des documents, relevant de l’idée d’exploiter à la fois la situation d’élaboration et de consultation des documents, est au centre de notre étude. Celle-ci s’inscrit dans le projet ANR MIIPA-Doc (Méthodes et services Intégrés Institutionnels et PArticipatifs pour la classification à facettes des contenus DOCumentaires complexes) qui vise à concevoir des méthodes de gestion de l’information pour l’organisation des contenus documentaires « complexes » et à développer l’architecture logicielle correspondante. Cette dernière a pour objectif de permettre un accès unifié à l’ensemble des ressources d’information distribuées (bases notes, serveurs Intranet, outils de GED des différentes unités, etc.) et aux documents de natures variées de l’entreprise.
Afin de catégoriser les documents en lien avec les connaissances organisationnelles et institutionnelles de l’entreprise, les démarches d'indexation proposées par le modèle ISIS, présenté dans le point suivant, s’appuyant sur la classification à facettes, nous ont semblé pertinentes. Une approche participative – ou par points de vue – exploitant la dimension interprétative de l’acteur en situation, afin d’assurer une convergence entre indexation, pratiques et connaissances métiers, permettrait de compléter cette démarche afin de caractériser les connaissances métiers.
Deux approches pour caractériser les connaissances métiers
Caractériser l’information à partir des connaissances organisationnelles : la classification par facettes
Le modèle ISIS : une infrastructure sémantique pour la gestion des connaissances organisationnelles
Le modèle ISIS [3]
(Information Semantic Infrastructure Services) est une infrastructure sémantique qui propose de caractériser les documents en s’appuyant sur une méthodologie de classification à facettes [7]. Il permet de décrire à la fois le contenu de l’objet informationnel et le contexte dans lequel il a été créé, afin d’optimiser la précision de la requête de l’acteur, dans le cadre d’une opération de recherche d’information, et d’améliorer la gestion de l’information corporative à travers son cycle de vie. Ce modèle, illustré par la figure 1, constitue un jeu de facettes génériques, qui reflète l’organisation des entités et les objets qui les constituent. Ce jeu de facettes est construit et s’articule ainsi autour de la compréhension des structures organisationnelles et des processus de l’entreprise :
Les facettes de contexte décrivent les liens entre le contenu du document numérique et son environnement administratif et/ou opérationnel, soit, les fonctions et les activités de gestion et d’exploitation auquel le document est rattaché, le type de contenu, le rôle et la position des acteurs impliqués. Les facettes de contenu s’attachent, quant à elles, à décrire « de quoi parle le document », en précisant le corps même de l’information et les références au contexte de production de l’information (titre, auteur, thème, projets et affaires auxquels le document se réfère, etc.).
Le modèle ISIS repose sur la création de relations sémantiques entre les valeurs de facettes. Ainsi, certains éléments du document peuvent être extraits automatiquement, en fonction du niveau de structuration de celui- ci, générant un certain « affinement » des valeurs proposées pour caractériser les autres facettes, tandis que d’autres sont analysés manuellement. Cette fonctionnalité permet de restreindre le nombre de valeurs présentes sous chaque facette, facilitant le processus de classification et de description du document par l’acteur.
Cette méthode d’indexation s’appuie sur les référentiels des processus métiers. Elle semble particulièrement adaptée à notre cas d’application, dans la mesure où elle se présente comme un compromis entre la rigueur imposée par une organisation du classement et la flexibilité offerte par le fonctionnement des facettes. Une première étape du travail consiste à examiner, à partir d’une étude du terrain visant à spécifier les différentes facettes, comment cette démarche peut être utilisée puis adaptée dans des contextes métiers spécifiques.
Caractériser l’information à partir des connaissances métiers : les approches par points de vue et l’indexation participative
Aussi s’agit-il de questionner les modalités actuelles de production de l’information et les usages de ces informations dans un contexte opérationnel, caractérisé par la variété des types de documents mobilisés (images, textes, plans, enregistrements audio, vidéos) et la diversité des bases dans lesquelles ils sont stockés, pour contribuer à la définition d’une méthode d’indexation. On envisage ainsi de compléter l’approche de classification par facettes par une approche d’indexation participative s'appuyant davantage sur les usages et la recherche de documents lors de leur utilisation par les métiers. En suivant les développements du web socio-sémantique, les approches par points de vue (ontologies sémiotiques) et l’indexation participative (folksonomies, pratiques d’annotations libres) permettent, au moyen d’outils et d’interfaces, un « balisage » subjectivé, à vocation non pérenne, de l’information et plus globalement des connaissances.
Les approches par points de vue renvoient à une dimension d’analyse de la situation portée par un acteur, le plus souvent un expert reconnu, qui représente une pratique singulière sans que la dimension associée à cette pratique ne soit nécessairement explicitée ni qu’elle ait nécessairement vocation à s’inscrire dans un schéma d’ensemble [9]. Envisagées comme des points de vue systémiques génériques, les ontologies sémiotiques correspondent aux situations dans lesquelles l’organisation ou la communauté considérée cherche à définir un ensemble de dimensions explicites et communes sans qu’un consensus puisse être immédiatement établi [9]. Le processus de définition est progressif et il est même possible que l’on ne parvienne jamais à une situation totalement stable ; les ontologies sémiotiques se distinguent en ce sens des ontologies formelles qui proposent une modélisation a priori d’un domaine et font consensus.
Issues du croisement de deux phénomènes renvoyant à des techniques de recherche et de partage de documents sur le Web, les folksonomies [3] résultent d’un processus d’indexation participative par mots clés choisis librement par les utilisateurs.
Les approches par points de vue et l’indexation participative favorisent ainsi l’émergence de cercles sociaux intermédiaires, car les termes utilisés pour classer et caractériser les contenus documentaires sont destinés à se propager à l’échelle de la communauté de pratiques et des métiers, réunis autour de thématiques précises [4]. Elles ajoutent, de ce fait, de nouvelles fonctionnalités aux outils de classement et de partage des ressources documentaires et impliquent les utilisateurs dans la construction du système de gestion des connaissances. En les invitant à caractériser les documents au moment où ils les élaborent et au moment où ils les manipulent, elles donnent aux utilisateurs la possibilité d’organiser leurs ressources et de caractériser les informations selon des termes qu’ils auront eux-mêmes choisis.
L’introduction des TIC dans les pratiques professionnelles
Ces problématiques de la recherche d’information en situation et de son indexation s’inscrivent dans le contexte plus général de l’introduction des technologies de l’information et de la communication (TIC) dans les pratiques professionnelles.
En effet, l’étude des différents modes de recherche d’information intervient dans un cadre dans lequel se produisent de profonds changements : d’une situation dans laquelle la documentation était matérialisée sur support papier – et son accès partait d’une démarche individuelle, les métiers doivent évoluer vers une situation dans laquelle la documentation prend des formes plus variées et est disponible en abondance sur des supports électroniques accessibles en réseau. L’objectif de l’introduction d’un outil de gestion de l’information, en support à la recherche d’information en situation opérationnelle, est de permettre aux acteurs métiers de se « construire » une représentation de leur environnement tant interne qu’externe, notamment en termes de ressources à disposition.
Les pistes envisagées pour répondre à ces problématiques de recherche d’information en situation mettent ainsi en exergue le passage d’une utilisation assez « linéaire » des outils informatiques (« je questionne et je dépouille mes résultats ») à une utilisation plus composite : par de multiples acteurs, jouant des rôles différents, parfois changeant au fil du temps, vis-à-vis des informations, et une utilisation participative desdits outils, s’appuyant sur un travail en réseau. Il convient également de souligner le changement du statut de l’information [8] dans ce nouveau contexte.
De ce fait, l’exploitation des facettes et l’intégration de logiques propres au web socio-sémantique renouvellent les agencements classificatoires dans les systèmes documentaires internes à l’organisation, en permettant l’intervention directe des usagers sur la description des contenus documentaires. Les développements méthodologiques dans le domaine doivent donc être associés à une analyse de l’impact possible des solutions considérées sur les pratiques des métiers concernés et, sans doute, à des démarches d’accompagnement adaptées.
Synthèse
L’étude présentée ici vise à évaluer, en situation opérationnelle, deux méthodes d’analyse et de traitement de contenus documentaires auprès d’un échantillon d’acteurs : la classification par facettes et l’indexation participative. L’objectif est d’analyser l’intérêt du déploiement d’un outil de gestion des connaissances en contexte, pour supporter les différentes phases de l’arrêt de tranche et optimiser la durée de la planification et de la conduite de l’ensemble des opérations. La démarche de l’étude consiste en l’observation des métiers, l’analyse de l’activité et l’expérimentation des approches auprès d’un échantillon d’opérationnels terrains, afin de prendre également en compte la dimension subjective de l’acteur en situation.
Soutenue par une expérimentation du modèle auprès d’un certain nombre d’acteurs, cette étude s’intègre dans un projet de recherche, dont l’ambition est de contribuer à la définition d’une méthodologie pour la mise en œuvre (et l’adaptation) d’un outil de gestion de l’information, orienté usages et usagers, permettant de répondre au besoin informationnel « en situation », c’est-à-dire prenant en compte les différentes problématiques des métiers mobilisés dans les activités d’exploitation et de maintenance d’une centrale de production d’énergie nucléaire.
Références bibliographiques
[1] ↑ M. Amar. Les fondements théoriques de l’indexation : une approche linguistique. Paris, ADBS Éditions. 2000.
[2 om] [[#cide citation 2 om|↑]] M. Bourrier. Le nucléaire à l’épreuve de l’organisation. Paris: PUF. paraisons du point de vue de la recherche ouverte d’information. Montréal, CAIS/ACSI, 2007. http://www.cais-acsi.ca1999
[3] ↑ E. Broudoux. Folksonomies et indexation. collaborative. Rôle des réseaux sociaux dans la fabrique de l’information. 2006. Document en ligne sur DocForum:
- < http://www.docforum.tm.fr/documents/23&24nov06SavResPar06In terBroudouxE.pdf >
[4] ↑ O. Ertzscheid et G. Gallezot. Indexation sociale et continents documentaires. Document numérique et société. Actes de la conférence DocSoc. Paris, ADBS Éditions, pp. 291-305. 2006.
[5] ↑ A. Hatchuel et B. Weil. L’expert et le système : gestion des savoirs et métamorphose des acteurs dans l'entreprise industrielle. Paris: Economica. 1992.
[6] ↑ M. Hudon et S. Mas. Analyse des facettes pour la classification des documents institutionnels au gouvernement du Québec. Rapport présenté pour le Groupe de travail en classification et indexation. Montréal : École de bibliothéconomie et des sciences de l'information, Université de Montréal. (Collection en ingénierie documentaire; 13). 2001. [consulté le 15.02.2009]
- < http://www.msg.gouv.qc.ca/fr/publications/enligne/administration/i ngenierie/classification_analyse.pdf >
[7] ↑ Y. Marleau, S. Mas et M. Zacklad. Exploitation des facettes et des ontologies sémiotiques pour la gestion documentaire. In E. Broudoux et G. Chartron (dir.). Traitements et pratiques documentaires : vers un changement de paradigme ?. Paris, ADBS Éditions, p. 91-110. 2008.
[8] ↑ Roger T. Pedauque. Le document : forme, signe, medium, les reformulations du numérique. STIC-CNRS, Working Paper – 8 juillet 2003. http://archivesic.ccsd.cnrs.fr/sic_00000511.html
[9] ↑ M. Zacklad. Introduction aux ontologies sémiotiques dans le Web socio-sémantique, Actes de la conférence Ingénierie des Connaissances 2005, Nice. http://archivesic.ccsd.cnrs.fr_00001479.en.html
[10] ↑ M. Zacklad, Classification, thésaurus, ontologies, folksonomies :
Notes
- ↑ 1 80% de l’énergie produite par EDF provient des centrales nucléaires – on compte à ce jour 19 sites nucléaires avec 58 tranches.
- ↑ Les systèmes d’organisation des connaissances (SOC) sont des instruments conceptuels permettant de décrire et d’indexer des contenus documentaires, de représenter dans un formalisme opératoire les connaissances utiles à la méta-description des ressources numériques. Classification, ontologies, thésaurus, taxinomies, folksonomies, sont autant de SOC représentant un domaine de connaissances, utilisés pour diverses manipulations sémantiques aidant à interroger des ressources d’information
- ↑ Le concept ISIS a été développé par la société canadienne Cogniva, à partir, notamment, des travaux de recherche portant sur la classification à facettes de Sabine Mas et de Michèle Hudon .