CIDE (2007) Behaz : Différence entre versions

De CIDE
imported>Catherine Morel-Pair
imported>Ali Tebbakh
Ligne 1 : Ligne 1 :
<!-- copie de Lucas 2005 :
 
 
{{Titre page article
 
{{Titre page article
  |titre=UniTHEM, un exemple de traitement linguistique à couverture multilingue
+
  |titre=Création dynamique de documents hypermédias adaptatifs
 
}}
 
}}
 +
 
{{CIDE boîte bibliographique|texte=
 
{{CIDE boîte bibliographique|texte=
;Titre:[[A pour titre::UniTHEM, un exemple de traitement linguistique à couverture multilingue]]
+
;Titre:[[A pour titre:: L’ACCES MULTILINGUE A L’INFORMATION SCIENTIFIQUE ET TECHNOLOGIQUE : LIMITATIONS  DES MOTEURS DE RECHERCHE EN LANGUE ARABE ]].
;Auteurs:[[A pour premier auteur::Nadine Lucas]] et [[A pour auteur::Emmanuel Giguet]].
 
::Nadine.Lucas@info.unicaen.fr
 
::Emmanuel.Giguet@info.unicaen.fr
 
;Affiliation:[[A pour affiliation auteur::GREYC]], CNRS UMR 6072, [[A pour affiliation auteur::Université de Caen Basse-Normandie|Université de Caen]], 14032 Caen Cedex
 
;In: [[Est dans les actes::CIDE 08 Beyrouth|Actes du colloque CIDE'8]] (Beyrouth 2005)
 
;En ligne:https://users.info.unicaen.fr/~giguet/LucasGiguetDefCide.pdf
 
;Mots-clés:recherche d'information, documents multilingues, analyse de texte, mise en forme matérielle, TAL robuste, thématique, Unicode.
 
}}
 
__TOC__
 
;Résumé :Un logiciel d'analyse thématique à couverture multilingue est présenté. Le programme prend en entrée un texte HTML et renvoie en sortie le texte colorié en fonction des thèmes traités, en proposant une vue de la hiérarchie des sous-thèmes. Ce logiciel appelé [[A pour logiciel présenté::UniTHEM]] accepte des langues à écriture alphabétique (langues latines, anglais, … russe) mais aussi les écritures à graphie liée (chinois, japonais). Les limites actuelles de couverture tiennent à des particularités de format d'une part, à la longueur du texte d'autre part. En effet, les textes structurés par des intertitres ne sont pas analysés comme tels. Ces limites montrent que la démarche n'est pas statistique ni basée sur des mots-clés. Elle s'appuie sur un modèle théorique de l'exposition, mis en relation avec des traits stylistiques, ce qui permet l'exploitation de la mise en forme matérielle du document, qui est relativement invariante. Les indices exploités sont communs à des familles d'écriture. Les ressources sont limitées aux séparateurs graphiques. Ces données permettent de constituer une hiérarchie des unités thématiques traitées par recoupements successifs des contextes. La qualité des analyses obtenues est satisfaisante. Les problèmes relatifs à l'évaluation de tels outils sont évoqués.
 
{{boîte déroulante
 
  |titre=English description
 
  |contenu=
 
;Abstract :This paper introduces a language-free topic parser. The task is to highlight the theme-topic structure and the hierarchy of subtopics in a text. It is performed on newspapers and magazines in French, English and various European languages, then extended to different writing systems, such as Cyrillic and Chinese. Resources are common separators, punctuation and repeated segments. The algorithm relies on a linguistic model that allows to link stylistic features to the topic structure. The layout of text provides information on the stylistic features.
 
;KEY-WORDS : robust text parsing, cross language information retrieval, layout retrieval, topic subtopic hierarchy, Unicode.
 
}}
 
{{CIDE début corps}}
 
==Introduction==
 
La recherche des "thèmes" traités dans un document est une tâche ordinairement basée sur un traitement statistique des mots-clé censés représenter un concept (ou de termes représentant un concept) [Segond 2002 ; Toussaint 2004]. Ceci présuppose que le mot est une unité universelle [{{CIDE lien citation|Salton 1989}} ; Grefenstette 1998]. Cette vision occidentale domine largement le domaine de la recherche d'information. Cependant, nombre de "langues" ou d'écritures n'utilisent pas le mot graphique, entre autres, le chinois et la majorité des écritures d'Asie, ainsi que l'arabe. On peut s'étonner que la vision dominante ne soit pas davantage contestée par des auteurs issus de traditions scripturales différentes, mais elle l'est parfois (poliment) [Ogawa 1995; Chen 1997 ; He 2002].
 
  
L'approche ici présentée s'écarte de la vision dominante en informatique en ce que le mot n'est pas posé comme pivot ou atome de sens. L'unité thématique dans un texte n'est pas caractérisée lexicalement, mais plutôt spatialement comme un passage de texte traitant (en principe) d'une même idée. Cette conception est assez proche de la vision de Hearst connue sous le nom de text tiling [Hearst 1994, 1997]. Mais, contrairement à celle de Hearst, notre approche est fondée sur un modèle de linguiste. Quoique le résultat soit visuellement similaire, les présupposés sont différents. Le modèle de référence est celui de Yamada (1873-1958), un linguiste japonais qui définit des opérations de mise en discours sans s'appuyer sur le concept de mot (lequel n'est pas matérialisé en japonais). Il présente des opérations qui peuvent être exprimées comme une série de contraintes qui limitent de facto un exposé qui serait sinon un développement infini. On va donc délimiter des passages de texte, comme ayant une cohésion interne, mais il faudra aussi hiérarchiser ces passages, puisqu'il est possible qu'un exposé contienne des développements subordonnés ou incis, qui interrompent momentanément la progression du discours. L'intérêt principal d'une telle approche basée sur des considérations stylistiques est qu'elle fait appel à la perception (de la mise en forme du texte). Elle a une portée générale et s'applique sans modification profonde à des textes en chinois ou dans une autre écriture qui ne connaît pas le mot graphique, mais aussi aux langues occidentales.
+
;Auteurs:[[A pour premier auteur::Amel Behaz ]] et [[A pour auteur::Mahieddine Djoudi ]].
 +
:: Algérieamelbehaz@hotmail.com
 +
:: Francemahieddine.djoudi@univ-poitiers.fr
  
Du point de vue informatique, notre travail se situe dans le paradigme des analyseurs robustes, à ressources limitées et à couverture multilingue. Considérant le défi du multilinguisme, nous avons recensé les techniques pouvant s'appliquer à des textes non caractérisés en langue. La présente étude s'appuie sur les traitements sans dictionnaire [Vergne 2001], certains concepts comme l'apprentissage robuste générant de nouvelles connaissances (techniques dites d'induction) [Kushmerick 1999] ou la déduction contextuelle [Muslea et al. 2002a, b], techniques ordinairement appliquées à l'exploration de la toile, que nous exploitons aussi dans l'analyse des textes. Quoique l'objectif soit celui de la recherche d'information multilingue (''cross language information retrieval'') [Oard 1997 ; Grefenstette 1998; Collins & Singer 1999], nous ne nous focalisons pas sur la recherche de mots ni d'entités nommées. Nous extrayons plutôt les connecteurs [Déjean 2000].
+
;Affiliation:[[A pour affiliation auteur::Amel Behaz]], Faculté des Sciences, Université de Batna, [[A pour affiliation auteur:: Mahieddine Djoudi ]], Laboratoire SIC et Equipe IRMA. UFR Sciences SP2MI, Université de Poitiers Teleport 2.
  
Partant d'un logiciel d'étude destiné à détecter et à colorier les « unités thématiques » dans des articles en français, nous nous sommes attachés ici à tester les possibilités d'adaptation de ce logiciel à un corpus multilingue et même « multi-script », c'est-à-dire traitant des documents non alphabétiques et sans mot graphique. Nous présentons dans la section 2 le logiciel THEMA dans un contexte français, puis ses avatars dans la section 3. Le premier, EuroTHEM, est destiné à des textes européens (Iso-latin), ce qui ne nécessite pas de modifications profondes du logiciel. Le second avatar, UniTHEM, est adapté à des textes que l'on peut traiter sous Unicode, incluant donc les textes en graphie liée, informatiquement gérables sous utf-8. Nous discutons dans la dernière section des caractéristiques permettant la re-définition du multilinguisme dans la perspective du TAL appliqué aux documents.
+
;Mots-clés: hypermédia adaptatif dynamique ; Ingénierie des connaissances ; web sémantique ; ontologie pédagogique ; modèle apprenant. }}
 
 
== Le fil du discours selon THEMA==
 
===Principes généraux===
 
Le logiciel THEMA est à l'origine un logiciel d'étude, développé pour détecter des unités thématiques. L'objectif de ce travail était de mettre en oeuvre une stratégie d'analyse textuelle à l'échelle du document dans des articles courts en français [Pinatel, 2003]. Cette analyse est basée sur des critères rhétoriques et stylistiques, en cela elle ressemble à celles de Kando et Karlgren [Kando 1997 ; Karlgren 2000]. Mais contrairement à ces travaux, nous avons cherché à limiter la dépendance au lexique, qui est un obstacle à la généricité. Le modèle de référence que nous avons choisi est celui de Yamada [Yamada 1936], linguiste et sémioticien souvent évoqué par des chercheurs japonais en RI [Hirakawa 1989 ; Sakamoto & al. 2002]. Ce modèle met l'accent sur les procédés d'exposition dans le discours. Il met en valeur le fil du discours, et pour cela traite de divers échelons de la hiérarchie des thèmes (l'enchâssement de thèmes subordonnés) et des unités repérées par rapport au titre, les thèmes dérivés notamment. Pour la première étape, le logiciel devait traiter d'un corpus de textes de vulgarisation en français, donc de textes d'abord facile.
 
 
 
Ce logiciel présente un certain nombre de défauts et de limitations. Cependant, il est suffisamment robuste pour produire des analyses correctes dans la majorité des cas et supporter la comparaison avec des logiciels plus classiques de détection des thèmes [Hernandez & Grau 2002]. Les ressources linguistiques utilisées sont légères. Pour le cas où une marque attendue n'est pas détectée dans le texte entrant, des procédures d'induction, exploitant les ressources endogènes (présentes dans le texte à analyser) sont mises en oeuvre, suivant la méthode distributionnelle [Déjean 2002]. Ces propriétés permettent d'envisager une couverture multilingue. Nous avons cherché à tirer parti de la norme ISO-CEI 10646, couramment appelée Unicode, une
 
révolution technologique qui permet d'aborder le traitement informatique de l'écrit avec un degré d'abstraction suffisant [Andries 2002].
 
===Description du logiciel de base===
 
Les documents fournis au format HTML sont segmentés. La mise en forme matérielle ou MFM [Virbel & Pascual 1996] a une grande importance, puisque le titre et le corps de texte doivent être correctement délimités. Il est nécessaire d'initialiser le traitement en extrayant le titre. Nous retenons comme informations pertinentes la position et la mise en forme différentielle d'une sous-chaîne de caractères, qui caractérisent le titre de l'article. Par différentielle, on entend tout simplement une MFM différente du reste de l'article. De même, la position est remarquable, le titre étant soit le premier élément de l'article, soit un élément isolé placé dans le premier tableau. Ce segment (la chaîne de caractères qui est censée contenir le titre) est posé comme thème de niveau 1 ou G pour global.
 
 
 
Notons toutefois que la segmentation typographique n'est qu'une étape. Le logiciel peut renvoyer comme résultat que le titre et le chapeau d'un article forment le segment thématique au niveau global. Dans la version ici présentée de THEMA, la segmentation interne au corps de texte est restée primitive, autrement dit les textes sont segmentés en unités typographiques fixes : paragraphes, phrases et virgulots (unités délimitées par une virgule). Une version ultérieure du logiciel traite des unités typographiques telles que les sections et chapitres, mais pour l'expérience présente nous nous centrons sur l'aspect multilingue et traitons de textes journalistiques courts.
 
 
 
La segmentation du texte est faite par le module ''TextTokenizer'', en unités fixes, paragraphe, phrase et virgulot. Ce module permet également de reconnaître et de garder en mémoire la mise en forme matérielle ainsi que la hiérarchie des composants. Leurs attributs éventuels de MFM (en-ligne) tels que graisse, italique, couleur, sont également mémorisés ainsi que les caractéristiques d'alignement.
 
 
 
La segmentation en paragraphe est une segmentation peu dépendante des familles d'écriture, c'est une délimitation du document HTML. Les codes HTML mal formés forment un obstacle à l'analyse, mais le programme Tidy<ref>http://www.w3.org/People/Raggett/tidy.</ref> de Dave Raggett permet d'en corriger un grand nombre. La segmentation en paragraphe peut être modifiée dans une fenêtre interactive, les paragraphes que l'on ne considère pas comme faisant partie du corps de texte (mentions éditoriales en particulier) peuvent ainsi être décochés et exclus du traitement ultérieur. Cette fonctionnalité n'est pas utilisée dans les exemples proposés, sauf mention contraire. On verra donc le résultat automatique.
 
 
 
Les opérations sous-jacentes au modèle (mise en facteur d'un thème dans une unité thématique) sont implémentées dans un algorithme de mise en relation correspondant au modèle de Yamada, baptisé ''Thematisation''. Nous ne nous attarderons pas ici sur les principes de base de l'algorithme. La structure des exposés est représentée par une série de contraintes sur un développement infini.
 
 
 
Les ressources en mémoire sont les ponctuations et une cinquantaine d'items qui forment une base d'indices dits morphologiques stockés dans une base de données MySQL. Nous avons en effet établi pour le français les marques spécialisées pour la détection d'exposés (marques d'ouverture et clôture de thème, marques de subordination et disjonction). Ces marques sont hiérarchisées. En effet, si l'on trouve deux phrases coordonnées par De plus, cela n'a pas la même valeur que deux phrases coordonnées par Et. Deux paragraphes coordonnés par De plus n'ont pas le même statut que deux phrases coordonnées par ce connecteur, même si en français, la marque de coordination est la même.
 
 
 
Le logiciel ne comporte pas de diagnostic de langue puisqu'il est censé travailler sur le français. Il est important de noter que les ressources en mémoire sont exploitées lorsqu'elles sont présentes dans le texte entrant, mais qu'elles ne sont pas la seule source de connaissances. La déduction contextuelle informée par le modèle, ou si l'on veut, l'induction des marques de bornage (wrapper induction) est implémentée.
 
 
 
===La détection des thèmes===
 
Les unités thématiques sont calculées et présentées sur trois niveaux d'inclusion, autrement dit, pour un article normal le premier niveau G subdivise l'article en titre et corps de texte. On suppose ici que le titre est en fonction thématique détachée, et que le corps de texte est le développement (ou propos) qui apporte de l'information (au niveau global). Le corps de texte est subdivisé ensuite en sous-thèmes au niveau G1 et si besoin est, également à un troisième niveau G11 (si le texte est long ou dense). A ces trois niveaux successifs, les informations pertinentes sont analysées automatiquement, à partir d'indices graphiques (MFM), morphologiques (les marques), d'indices positionnels (début et fin) et d'indices de niveau (trois échelons correspondant aux trois grains ou mesures de texte).
 
 
 
[[Fichier:CIDE 8 Lucas 1.png|center|thumb|600px|'''Figure 1. Le fil du discours déroulé sur trois niveaux d'inclusion''']]
 
La répétition de certaines sous-chaînes (en gras dans l'exemple ci-dessus) constitue un critère, mais il est important de pouvoir situer des répétitions par rapport à une mesure de texte. En ce sens, les répétitions ne sont pas à entendre comme dans les techniques tf-idf, mais dans une acception stylistique ([[anaphore]] et [[épiphore]]). La démarche consistant à exploiter des indices morphologiques et des positions est commune aux systèmes de type syntaxique de complexité réduite [Vergne 2001]. Lorsque les indices morphologiques sont absents, l'algorithme emprunte aux systèmes d'apprentissage de règles grammaticales [Déjean 2002]. Cet apprentissage n'est pas itératif sur un corpus, il ressemble donc davantage aux principes dits d'induction, utilisé pour le dépouillement de sites.
 
 
 
Les résultats sont proposés sous plusieurs formes. La « structure compacte » permet de donner une vue globale du texte avec les débuts des unités thématiques, dont le développement est évidé si le texte est long. Les unités thématiques de rang 1, 2 et 3 sont ensuite présentées séparément, pour permettre la vérification de pertinence des relations hiérarchiques. Les unités de rang 1 sont plus longues et moins nombreuses, et on procède ainsi par raffinement successif jusqu'aux plus petites structures détectées qui sont incluses dans les développements. La structure développée représente les unités thématiques et leurs inclusions pour l'ensemble du texte. Nous présentons ici les structures abrégées dites structures compactes.
 
 
 
[[Fichier:CIDE 8 Lucas 2.png|center|thumb|600px|'''Figure 2. Résultat de la structuration thématique en français]]
 
 
 
On y voit que le thème le plus général G (le titre, en bleu clair) est informé par le corps de texte (en vert clair), qui comprend un seul thème de niveau 2 correspondant à une reformulation plus détaillée (bleu plus soutenu), le rhème étant constitué également d'une unité thématique. On voit ici que le dégradé des thèmes n'est pas accompagné par un dégradé des rhèmes, dans un texte monothématique. Autrement dit, les segments rhématiques et les segments de clôture restent tous au niveau 3 (vert le plus foncé). Le nom d'auteur n'est pas ramené au niveau du titre. Il s'agit d'une maladresse dans l'algorithme et dans la présentation des résultats. Mais pas seulement.
 
 
 
En effet, le modèle de Yamada n'est pas un emboîtement en poupées russes. Il permet en revanche une distinction entre un texte monothématique (exemple 2) et un texte plurithématique comme dans l'exemple 3 où le décrochement G12 signale l'articulation entre le thème 1 et le thème 2. Notre parti-pris dans THEMA a été de mettre en valeur le fil du discours. Une comparaison est proposée avec un autre modèle d'analyse dans la [[#Résultats et évaluation|section 4]].
 
[[Fichier:CIDE 8 Lucas 3.png|center|thumb|600px|'''Figure 3. Résultat de la structuration thématique en français]]
 
 
 
==Version « multilingue »==
 
=== Langues latines et EuroTHEM===
 
La première extension de THEMA a été la couverture aux langues latines (espagnol, portugais, italien, roumain), ce qui ne nécessitait pas de modification du point de vue informatique. En effet, les tests de détection de connecteurs (établis pour le français) ne sont pas conçus comme décisifs. La variation stylistique est assez grande dans le corpus traité (en français) pour que les formes attendues ne soient pas « obligatoires ». Comme on l'a vu, les traitements par défaut exploitent la répétition d'une forme x inconnue à une position y donnée, c'est donc le procédé stylistique qui est capté et exploité. Cette recherche est contrainte par l'examen des positions remarquables, en position de préfixe (au début d'une unité typographique) ou alors en position de suffixe (en fin d'une unité typographique). On spécifie alors un petit espace de recherche et on recense les chaînes répétées, par exemple dans la dépêche en italien (fig.4), partiti.
 
 
 
[[Fichier:CIDE 8 Lucas 4.png|center|thumb|600px|'''Figure 4. Résultat de la structuration thématique en italien''']]
 
 
 
===Ecritures alphabétiques===
 
Pour étendre la couverture de THEMA aux langues à écriture latine, nous avons dû séparer la détection des paragraphes et celle des unités ponctuées (phrase, virgulot). En effet, la structuration en paragraphe est invariante, tandis que la segmentation en phrases est dépendante d'une graphie liée à une famille de langues. En contexte multilingue, les difficultés de segmentation en phrases tiennent essentiellement aux variations dans les abréviations et dans l'utilisation de la capitalisation [Mikheev 2002; Kiss et Strunk 2002, 2004]. L'algorithme proposé par ces auteurs n'est pas implémenté dans notre logiciel, mais cette amélioration est envisagée. La segmentation effectuée par le module "texttokenizer" permet cependant de traiter des textes en anglais, allemand, néerlandais, langues slaves, ainsi que dans les langues latines.
 
 
 
Dans l'étape d'analyse, le logiciel exploite comme précédemment les répétitions pour affecter une valeur de préfixe ou suffixe à des chaînes de caractères. Cette procédure à fondement stylistique permet de délimiter des unités thématiques à partir de ressources strictement endogènes (contenues dans le texte).
 
 
 
[[Fichier:CIDE 8 Lucas 5.png|center|thumb|600px|'''Figure 5. Résultat de la structuration thématique en anglais''']]
 
Le russe, plus exactement l'écriture cyrillique, qui détache les mots, ne pose pas de problèmes particuliers du point de vue informatique. Les textes sont segmentés en paragraphes, puis en phrases et en virgulots. Les codes des glyphes correspondant au point de fin de phrase et à la virgule sont les mêmes qu'en Iso-latin.
 
[[Fichier:CIDE 8 Lucas 6.png|center|thumb|600px|'''Figure 6. Résultat de la structuration thématique en russe''']]
 
 
 
===Version multi-script UniTHEM===
 
Le traitement des caractères en utf-8 est à ce stade indispensable. La détection automatique du jeu de caractères entrant est suivie d'une conversion automatique vers utf-8. Les entités HTML sont également converties vers utf-8. L'ajout de cette fonction dans UniTHEM a pour conséquence un ralentissement de la procédure de segmentation, par rapport à la version en Iso latin, les fichiers sont aussi plus lourds. Le traitement des caractères en utf-8 et les classes d'équivalence de ponctuation nous permet d'aborder des écritures dites à graphie liée, pour des articles en chinois et japonais, qui utilisent des idéogrammes et ne séparent pas les mots. Le coréen, qui ne sépare pas les mots mais utilise un syllabaire n'est pas présenté ici faute de place. Les principes sont les mêmes, mais il est nécessaire de définir des classes de ponctuations [Giguet & al. 2000].
 
 
 
Les documents en japonais et chinois sont segmentés en paragraphes, puis en phrases et en virgulots, ce qui nécessite de prendre en compte les codes des glyphes correspondant au point de fin de phrase et à la virgule. On prend également en compte les ponctuations spécifiques de ces écritures (point de mot équivalent au trait d'union). On notera que la segmentation en mots est tout simplement omise, car elle n'est pas indispensable à l'analyse. Contrairement aux traitements lexicographiques, basés sur la consultation de dictionnaires, notre approche exploite des chaînes de caractères répétés à certaines positions et la disposition d'ensemble du texte.
 
De la même manière que précédemment, nous retenons comme informations pertinentes la position et la mise en forme différentielle de segments de textes ou sous-chaînes, qui délimitent le titre de l'article. Ce segment est posé comme thème de niveau 1. Comme indiqué ci-dessus, dans l'étape d'analyse, le logiciel exploite les répétitions d'une suite de caractères (entre le titre et le corps de texte, et à l'intérieur du corps de texte) pour affecter une valeur à des segments bornés par des préfixes ou suffixes. Les résultats sont tout à fait corrects, avec les mêmes imperfections ou biais que dans les langues latines, mais aussi les mêmes atouts.
 
 
 
[[Fichier:CIDE 8 Lucas 7.png|center|thumb|600px|'''Figure 7. Résultat de la structuration thématique en japonais''']]
 
La figure 7 montre que le thème le plus général G est informé par le corps de texte, lui-même subdivisé en un thème de niveau 2 (le 1er §) et un rhème explicatif en deux parties (G11 objectifs et G12 commentaire). Les unités les plus petites au niveau 3 sont subdivisées en virgulots.
 
 
 
Dans la figure 8 on voit que le thème le plus général G (le titre, en bleu clair) est informé par le corps de texte (en vert clair), lui-même subdivisé en deux sous-thèmes (récit des faits et commentaire). Le dernier § est traité comme un ajout ou digression. La signature apparaît comme dernier rhème (les clôtures n'étant pas différenciées des rhèmes).
 
 
 
[[Fichier:CIDE 8 Lucas 8.png|center|thumb|600px|'''Figure 8. Résultat de la structuration thématique en chinois''']]
 
 
 
[[Fichier:CIDE 8 Lucas 9.png|center|thumb|600px|'''Figure 9. Résultat de la structuration thématique en arabe''']]
 
 
 
Les textes en arabe pris sur les sites de presse ne présentent pas une graphie liée. Ils ne nécessitent pas de traitement particulier, à part la gestion des indications de changement de sens d'écriture (right to left mark). La visualisation gère le calage à droite des paragraphes.
 
 
 
==Résultats et évaluation==
 
Le logiciel UniTHEM donne satisfaction pour le traitement des unités thématiques indépendamment des langues et des écritures. Les exemples cités ci-dessus proviennent d'internet et n'ont pas été retouchés manuellement par décochage des paragraphes. Les possibilités d'exploitation des documents sous Unicode nous semblent parfaitement mises en valeur. L'avantage d'UniTHEM est de présenter une vision synthétique du contenu des articles à travers la structure compacte. Cela permet de saisir l'information très rapidement, fournissant ainsi une aide appréciable à la lecture. Une nouvelle voie est ouverte pour aller au-delà des traitements purement statistiques et des traitements linguistiques lexicaux. Le logiciel a été intégré à la plate-forme « wims » [Giguet 2005] et il fonctionne en ligne.
 
 
 
La couverture des formats de documents est imparfaite. Nous sommes limités par le format d'entrée HTML et nous avons encore des difficultés avec certains documents que l'utilitaire Tidy ne permet pas de corriger.
 
 
 
L'évaluation qualitative de tels outils d'analyse thématique pose des problèmes, car le consensus entre différents courants ou experts n'est pas obtenu aussi facilement que sur l'analyse grammaticale par exemple. Notre algorithme étant déterministe, il y a toujours une solution. Cette solution est discutable. Le choix du modèle de référence peut être critiqué, d'autant qu'il n'est pas beaucoup vulgarisé.
 
 
 
Nous avons soumis des résultats d'analyse à des lecteurs externes (langue maternelle à tester) pour juger de leurs réactions sur des ensembles de 10 dépêches ou articles tirés aléatoirement (structure développée et structure compacte). La question posée était « l'analyse est-elle correcte, permet-elle de souligner le fil du discours ? ».
 
{|class="wikitable"
 
|-
 
|rowspan=2|Langues /jugement
 
|Nbre de textes
 
|
 
|rowspan=2|non
 
|rowspan=2|oui
 
|rowspan=2|ne sait pas
 
|rowspan=2|nb oui/10
 
|-
 
|
 
|dont courts
 
|-
 
|Chinois
 
|10
 
|5
 
|3
 
|5
 
|2
 
|5/10
 
|-
 
|Arabe
 
|10
 
|2
 
|8
 
|1
 
|1
 
|1/10
 
|-
 
|Allemand
 
|10
 
|7
 
|2
 
|8
 
|
 
|8/10
 
|-
 
|Français
 
|20
 
|12
 
|2
 
|17
 
|1
 
|9/10
 
|-
 
|total
 
|50
 
|26
 
|15
 
|31
 
|3
 
|6/10
 
|-
 
!colspan=8|Tableau 1. Jugement des lecteurs sur la pertinence de l'analyse
 
|}
 
Le ratio de « oui » indique un bon taux de satisfaction pour les textes courts. Une limitation patente est que l'analyse est faite sur trois niveaux seulement, ce qui est pénalisant pour les textes longs (plus de 10 §). Cela est net pour l'arabe, où la moyenne des paragraphes par article de notre échantillon avoisinait 20. Les hésitations s'observent sur les textes particuliers (interviews, éditoriaux). Enfin, concernant la visualisation, nous envisageons une représentation des segments de clôture différente de celle des rhèmes profonds, car ce défaut suscite aussi des critiques.
 
 
 
Les commentaires d'auteurs d'articles en français rejoignent ceux des lecteurs, les textes longs étant invariablement jugés moins bien analysés que les textes courts. En complément, nous avons soumis les résultats d'analyse à un analyste de presse (3 articles analysés finement pour le roumain). Les commentaires sont positifs, ils discutent surtout du modèle pour l'organisation des unités incluses.
 
 
 
A titre de comparaison pour le traitement informatique, nous avons analysé un texte en français « Le vin jaune » déjà présenté par [Hernandez & Grau 2002]. Par rapport au résultat proposé par ces auteurs (voir annexe, structure incluse en gris), on remarque que la relation disjointe entre le premier et les deux derniers paragraphes (commentés comme introduction et conclusion) n'est pas représentée dans notre analyse. Contrairement au modèle en poupées russes, notre analyse favorise le suivi du fil du discours en partant du titre. La relation « introduction-conclusion » est constitutive de l'unité thématique, aussi le segment conclusif apparaît dans le rhème. Par ailleurs, dans notre analyse, le thème de niveau 2 englobe deux paragraphes, qui introduisent une séquence explicative. Le modèle invoqué par Hernandez & Grau, au contraire, favorise la relation question-réponse, et traite la réponse comme unité distincte.
 
 
 
[[Fichier:CIDE 8 Lucas 10.png|center|thumb|600px|'''Figure 10. Résultat de la structuration thématique sur le vin jaune''']]
 
 
 
Les textes que nous avons soumis à l'analyse sont des dépêches de presse ou des articles de journaux et de magazines, des textes fortement structurés du point de vue thématique. La MFM est riche et diversifiée. L'algorithme délimite des unités thématiques à partir de ressources endogènes uniquement. Il serait donc possible de désactiver la consultation des indices morphologiques pour le français. Cependant, disposer d'indices a pour avantage une plus grande rapidité du traitement, car le calcul des répétitions est plus coûteux que la détection d'une forme spécifiée. Il serait préférable de rajouter un diagnostic de langue et des ressources morphologiques spécialisées pour traiter d'un corpus stable du point de vue des langues.
 
 
 
En revanche, pour la couverture d'un événement particulier ou d'un jour J, comme l'a réalisé manuellement une équipe d'analystes [van Dijk 1988], il est intéressant de proposer une analyse thématique informatisée de la presse avec une couverture Unicode, sans restriction due au lexique et à la langue. Le suivi de l'actualité sur la toile est une application naturelle pour le modèle de Yamada, bien adapté au genre journalistique. L'efficacité de cette approche dans d'autres genres est à l'étude.
 
 
 
Le revers de la médaille est que le pré-traitement qui consiste à analyser automatiquement la mise en forme matérielle nécessite un soin méticuleux. Les documents sont formatés de façon très variable, or l'analyse stylistique s'appuie sur la reconnaissance des unités typographiques et de leur rang dans la hiérarchie textuelle.
 
 
 
==Discussion==
 
La voie d'approche stylistique est explorée notamment par Karlgren dans l'analyse de la presse [Karlgren 2000, Karlgren & Järvinen 2002]. Les principes informatiques de base retenus dans notre approche sont hérités de la recherche d'information sur la toile, une situation où la langue des sites est inconnue, les règles de formatage également [Stienne & Lucas 2003]. On a donc recours à une alternance de déduction et d'induction à partir d'indices endogènes, dont on cherche à établir le statut informationnel [Mukerjea 1998 ; Muslea & al. 2002a, 2002b]. Il est tentant de relier le traitement des sites et le traitement du contenu en utilisant les mêmes principes discriminatoires à partir de ressources endogènes. La source exogène de connaissance permettant de faire des choix est alors le type de sortie requis par l'utilisateur (choix de la grille d'analyse, du niveau de détail requis, etc.).
 
 
 
L'analyse de documents et la fouille de textes présentent aussi des convergences. La caractérisation différentielle de sites (classés en deux catégories qualitatives d'après leur contenu) a été menée en France suivant des principes structuralistes exploitant des faisceaux de traits [Valette 2004]. La valeur accordée aux indices matériels (ponctuations, couleurs) est dépendante du contexte et des différentiels observables. Pour notre objectif, l'affectation de valeur est dirigée par le modèle psycho-linguistique de Yamada. On pourrait dire que la classification des segments de textes est faite par UniTHEM en autant de classes que le modèle en requiert (au moins 2), et se raffine en autant de classes que le modèle le permet (24 si on se limite à trois niveaux d'inclusion).
 
Pour traiter une autre problématique, par exemple la détection de l'argumentation ou celle des explications, il serait nécessaire d'exploiter un autre modèle de référence et donc d'écrire un algorithme différent. Nous jugeons préférable d'exploiter un seul modèle de référence à la fois.
 
 
 
L'expérience de traitement thématique à couverture multilingue forme un jalon dans une recherche émergente, permettant l'interprétation de données textuelles indépendamment des langues et des écritures (ou presque). L'homogénéité de la norme ISO-CEI 10646, qui utilise un jeu unifié de caractères, sert de socle technologique. Unicode permet de mener des traitements robustes sur un corpus multilingue ou indifférencié en langues, en s'appuyant sur quelques données internes au code ; les tables d'équivalence de glyphes, notamment les ponctuations, deviennent la « pierre de Rosette » du traitement pour UniTHEM. La généricité de l'approche tient à l'exploitation des balises et des graphies qui ont un usage plus large que le lexique d'une langue particulière. Nous souhaitons suivre à l'avenir cette voie d'exploration prometteuse.
 
 
 
==Références bibliographiques==
 
{{CIDE biblio
 
|id=Andries 2002
 
|texte="Introduction à Unicode et à l'ISO 10646" P. Andries, Document numérique Vol. 6 n° 3-4. (2002) pp. 51-88.
 
}}
 
{{CIDE biblio
 
|id=Chen 1997
 
|texte= "Chinese Text Retrieval without using a Dictionary". A. Chen & J. He, SIGIR, 1997.}}
 
{{CIDE biblio
 
|id=Collins et Singer 1999
 
|texte="Unsupervised models for named entity classification" M. Collins and Y. Singer. ''Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora,'' 1999.}}
 
{{CIDE biblio
 
|id=Déjean 2000
 
|texte="ALLiS: a Machine Learning System for Natural Language Learning" H. Déjean ''Conference on Natural Language Learning Lisbon''. 2000.}}
 
{{CIDE biblio
 
|id=Déjean 2002
 
|texte="Learning Rules and Their Exceptions" H. Déjean ''Journal of Machine Learning Research'' 2: 669-693 (2002).
 
}}
 
{{CIDE biblio|id={CIDE biblio|id=Giguet 2005|texte= "Modélisation de l'activité expérimentale du chercheur en traitement des langues sur corpus multilingues" E. Giguet ''Journée de l'ATALA Articuler les traitements sur corpus'', 12 février 2005.}}
 
{{CIDE biblio|id=Giguet & al. 2000|texte= "Document structure identification illustrated on news dispatches" E. Giguet, N. Lucas & G. Cousin CicLing-2000 A. Gelbukh (ed.), Mexico, Instituto politécnico nacional, 2000 pp. 415-428.}}
 
{{CIDE biblio|id=Grefenstette 1998|texte= Cross-Language Information Retrieval G. Grefenstette (ed.) Kluwer, 1998.}}
 
{{CIDE biblio|id=He 2002|texte= Finding the Better Indexing units for Chinese Information Retrieval., H. He, P. He, J. Gao, & C. Huang First SigHAN Workshop on Chinese Language Processing, 2002.}}
 
{{CIDE biblio|id=Hearst 1994|texte= "Multi-Paragraph Segmentation of Expository Text", M. Hearst 32nd Annual Meeting of the Association for Computational Linguistics, Las Cruces,NM, June 1994.}}
 
{{CIDE biblio|id=Hearst 1997|texte= "TextTiling: Segmenting Text into Multi-Paragraph Subtopic Passages" M. Hearst Computational Linguistics, 23:1, (1997) pp. 33-64.}}
 
{{CIDE biblio|id=Hernandez & Grau 2002|texte= "Analyse thématique du discours : segmentation, structuration, description et représentation" N. Hernandez & B. Grau, In Cide 5, Tunis (2002).}}
 
{{CIDE biblio|id=Kando 1999|texte= "Text Structure Analysis as a Tool to Make Retrieved Documents Usable" N. Kando Proceedings of the 4th International Workshop on Information Retrieval with Asian Languages, Taipei, Taiwan, Nov. 11-12, 1999, 126-132.}}
 
{{CIDE biblio|id=Karlgren 2000|texte= Stylistic Experiments for Information Retrieval., J. Karlgren PhD thesis, Stockholm, Université de Stockholm, 2000.}}
 
{{CIDE biblio|id=Karlgren & Järvinen 2002|texte= "Foreground and background text in retrieval" J. Karlgren . & T. Järvinen, In Karlgren, J., Gambäck, B. Kanerva, P. (eds) Acquiring (and Using] Linguistic (and World) Knowledge for Information Access, Menlo Park, Spring 2002, The American Association of Artificial Intelligence.}}
 
{{CIDE biblio|id=Kiss & Strunk 2002|texte= "Viewing sentence boundary detection as collocation identification" Proceedings of KONVENS 2002, Saarbrücken, pp. 75-82.}}
 
{{CIDE biblio|id=Kiss & Strunk 2003|texte= "Multilingual Least Effort Sentence Boundary Detection" Tibor Kiss, Jan Strunk Under review.}}
 
{{CIDE biblio|id=Kushmerick 2000|texte= "Wrapper induction: Efficiency and Expressiveness", N. Kushmerick Artificial Intelligence 118, 2000.}}
 
{{CIDE biblio|id=Mikheev 2002|texte= "Periods, Capitalized Words, etc." Andrei Mikheev Computation Linguistics 28:3 (2002) pp. 289-318.}}
 
{{CIDE biblio|id=Mukherjea 2000|texte= "WTMS: A System for Collecting and Analysing Topic-Specific Web Information", S. Mukherjea. Proceedings of the 9th International World Wide Web Conference, Amsterdam, Netherlands, May 15-19, 2000.
 
|url=http://www9.org/w9cdrom/293/293.html}}
 
{{CIDE biblio|id=Muslea et al. 2002 a|texte= "Adaptive view validation: a case study on wrapper induction" I. Muslea, S. Minton, C. Knoblock. Proceedings19th ICML, 2002.}}
 
{{CIDE biblio|id=Muslea et al. 2002 b|texte= "Active+ Semi-Supervised Learning = Robust Multi-View Learning" I. Muslea, S. Minton, C. Knoblock Proceedings19th ICML, 2002.}}
 
{{CIDE biblio|id=Oard 1997|texte= "Alternative Approaches for Cross-Language Text Retrieval," D. W. Oard, in Cross-Language Text and Speech Retrieval, AAAI Technical Report SS-97-05. |url=http://www.clis.umd.edu/dlrg/filter/sss/papers}}
 
{{CIDE biblio|id=Ogawa 1995|texte= "A new characterbased indexing organization using frequency data for Japanese documents" Y. Ogawa Conference on Research and Development in Information Retrieval, ACMSIGIR, Seattle, 1995, pp. 121-129.}}
 
{{CIDE biblio|id=Pinatel, 2003|texte= Coloriage thématique à l'intérieur d'un document: approche contextuelle P. Pinatel, Rapport de projet DESS RADI. Université de Caen, 2003.}}
 
{{CIDE biblio|id=Sakamoto & al. 2002|texte= "Knowledge Discovery from Semistructured Texts", H. Sakamoto, H. Arimura, & S. Arikawa, in Arikawa & Shinohara (eds) Progress in Discovery Science (LNAI 2281) Springer, 2002 pp. 586-599.}}
 
{{CIDE biblio
 
|id=Salton 1989
 
|texte=Automatic text processing, [[A pour auteur cité::Gerard Salton{{!}}G. Salton]], Addison-Wesley, 1989.
 
}}
 
{{CIDE biblio|id=Segond 2002|texte= Multilinguisme et traitement de l'information, F. Segond (Ed.), Paris, Hermès Lavoisier, 2002.}}
 
{{CIDE biblio|id=Stienne & Lucas 2003|texte= "Exploitation d’information disponible sur Internet et génération d'un portail multilingue sur la thématique cinéma" N. Stienne & N. Lucas Cide 6, Faure et Madelaine (eds) Document électronique dynamique, Paris, Europia, 2003, pp. 239-255.}}
 
{{CIDE biblio|id=Toussaint 2004|texte= "Extraction de connaissances à partir de textes structurés" Y. Toussaint Document numérique Vol.8: 3, (2004) pp. 11-34.}}
 
{{CIDE biblio
 
|id=Valette 2004
 
|texte=Sémantique interprétative appliquée à la détection automatique de documents racistes et xénophobes sur Internet » M. Valette CIDE.7, P. Enjalbert, M. Gaio (eds), pp. 215-230.}}
 
{{CIDE biblio|id=van Dijk 1988|texte= News analysis: case studies of international and national news in the press. T. A. van Dijk Hillsdale, N. J., L. Erlbaum, 1988.}}
 
{{CIDE biblio|id=Vergne 2001|texte= Analyse syntaxique automatique de langue: du combinatoire au calculatoire. J. Vergne, TALN 2001, Tours vol. 1 (pp. 15-29).}}
 
{{CIDE biblio|id=Virbel & Pascual 1996|texte= "Semantic and Layout Properties of Text Punctuation" J. Virbel & E. Pascual, In Proceedings of the workshop on Punctuation in Computational Linguistics, ACL Conference, Santa Cruz, 1996.}}
 
{{CIDE biblio|id=Yamada 1936|texte= Nihon bunpôgaku gairon [Somme sur la grammaire japonaise] Y. Yamada, Tôkyô, Hôbunkan, 1936 (ré-imp. 1989).}}
 
 
 
==Notes==
 
<references/>
 
==ANNEXE==
 
'''Le vin jaune Segmentation thématique Hernandez & Grau 2002.'''
 
<small>
 
{|class="wikitable"
 
|-
 
|En 1991, à la Station INRA de Dijon, Patrick Étiévant et Bruno Martin commençaient l'analyse du vin jaune, produit seulement dans le Jura. Le goût spécifique de ces vins résulte de leur technique d'élevage : on laisse le vin vieillir en tonneau pendant plusieurs années, sous un voile épais de levures Saccharomyces cerevisiae. Ce type de vin est également fabriqué en Alsace, en Bourgogne et à Gaillac sous le nom de vin de fleur ou vin de voile ; il n'a d'équivalent à l'étranger que dans le xérès, les sherrys ou le tokay de Hongrie. Quelles molécules sont responsables de son goût caractéristique?
 
|-
 
|Les vins contiennent des centaines de composés volatils, dont un dixième sont aromatiques, de sorte que la détection des molécules responsables d'un arôme particulier est notoirement difficile : chercher le coupable, parmi 300 suspects... Au début des années 1970, certains avaient cru que la solérone (le 4 acétyl gamma butyrolactone) était l'arôme principal du vin jaune, mais, en 1982, Pierre Dubois, à Dijon, retrouva la solérone dans des vins rouges : la molécule avait un alibi.
 
 
 
On soupçonna alors le 4,5 diméthyl 3 hydroxy 2(5H) furanone, ou sotolon, molécule construite autour d'un cycle de quatre atomes de carbone et d'un atome d'oxygène. Comme le sotolon et la solérone sont en concentrations minimes dans les vins de voile et, de surcroît, chimiquement instables, les chimistes dijonnais ont cherché à optimiser leur extraction afin de déterminer la molécule responsable du goût de jaune.
 
 
 
L'analyse la plus directe d'extraits de vins est la chromatographie : on injecte un échantillon dans un solvant que l'on vaporise et on fait traverser au mélange une colonne revêtue intérieurement d'un polymère, qui retient les divers composés du mélange à des degrés divers ; en bas de la colonne, on détecte la sortie des composés séparés. Le premier travail des chimistes fut la mise au point d'une variante de cette technique pour identifier les composés présents en quantités minimes dans des mélanges complexes.
 
 
 
Les chromatogrammes d'échantillons de vin furent alors comparés à ceux de solutions pures de sotolon et de solérone de synthèse : le sotolon est ainsi présent entre 40 et 150 parties par milliard dans les sherrys ; la solérone semble moins spécifique, et ses concentrations sont supérieures dans les sherrys, ce qui explique pourquoi on l'a d'abord trouvée dans ces vins.
 
 
 
Enfin les dosages, complétés de tests sensoriels des fractions séparées, montrèrent que la solérone, aux concentrations trouvées dans du savagnin (le cépage à partir du quel on fabrique le vin jaune), n'était perçue par les consommateurs ni dans les vins, ni dans des solutions modèles : la solérone n'était pas la molécule caractéristique ; le jugement était sans appel.
 
|-
 
|En 1992, les chimistes se consacrèrent alors complètement au sotolon, qui avait été observé dans des molasses de canne à sucre, dans des graines de fenugrec, dans de la sauce de soja, dans du saké... Il était également présent dans certains vins botrytisés, c'est-à-dire faits à partir de raisins surmaturés et atteints par la pourriture noble : ce champignon, Botrytis cinerea, fait, par exemple, les sauternes ou les vins dits de vendanges tardives. Le sotolon n'a pas été trouvé dans les vins rouges ni dans les vins oxydés et, surtout, il fut déterminé que son seuil de perception était de 15 parties par milliard seulement.
 
 
 
Mieux encore, des tests de consommation montrèrent que les vins de voile étaient jugés typiques, avec une note de noix, quand la concentration en sotolon était forte dans ces vins. A plus forte concentration, les jurys de dégustation décrivirent une note de curry.
 
La piste du sotolon est aujourd'hui suivie par Élisabeth Guichard, qui a mis au point une méthode rapide de dosage : la concentration en sotolon dans le vin de paille (un vin préparé à partir de baies séchées sur des claies), qui n'avait pas été observée, est comprise entre 6 et 15 parties par milliard ; le sotolon du vin jaune est synthétisé à la fin de la phase de croissance exponentielle des levures. Dans des vins vieillis respectivement un an, deux ans, trois ans, quatre ans, cinq ans et six ans, la quantité de sotolon est faible dans les débuts de la maturation et augmente notablement après quatre ans d'élevage, surtout dans les caves pas trop fraîches.
 
 
 
Des prélèvements à différentes profondeurs, sous le voile, dans les tonneaux, ont révélé que le sotolon est deux fois plus concentré au milieu et au fond des tonneaux que juste sous le voile. On suppose que le sotolon est indirectement produit par les levures du voile, quand le degré alcoolique est élevé : celles-ci transformeraient un acide aminé du vin en un cétoacide, qui serait libéré à la mort des levures, tombant au fond du tonneau ; puis une réaction chimique transformerait le cétoacide en sotolon, enrichissant d'abord le fond, puis le milieu, puis les couches supérieures du vin.
 
Puisque le sotolon est bien la molécule du goût de jaune, on cherche aujourd'hui des souches de levures qui ont la capacité d'en produire beaucoup ; on cherche aussi les conditions qui favorisent la production de ce goût.
 
|}
 
</small>
 
{{CIDE fin corps}}
 
__SHOWFACTBOX__ -->
 
 
 
 
 
<!-- *** TO_DO *** -->
 
<!-- 1 qu'est-ce qu'on fait de la session : <a href="index.php?id=92">Session Le document numérique scientifique à des fins pédagogiques</a> -->
 
 
 
{{Titre page article
 
|titre=Création dynamique de documents hypermédias adaptatifs
 
}}
 
{{CIDE boîte bibliographique|texte=
 
;Titre:[[A pour titre::Création dynamique de documents hypermédias adaptatifs]]
 
;Auteurs:[[A pour premier auteur::Amel Behaz]] et [[A pour auteur::Mahieddine Djoudi]].
 
::amelbehaz@hotmail.com
 
::mahieddine.djoudi@univ-poitiers.fr
 
;Affiliation:[[A pour affiliation auteur::GREYC]], CNRS UMR 6072, [[A pour affiliation auteur::Université de Caen Basse-Normandie|Université de Caen]], 14032 Caen Cedex
 
<!-- Faculté des Sciences, Université de Batna (05000) Algérie
 
Laboratoire SIC et Equipe IRMA. UFR Sciences SP2MI, Université de Poitiers Teleport 2, boulevard Marie et pierre Curie, BP 30179, 86962 Futuroscope Chasseneuil Cedex – France -->
 
;In: [[Est dans les actes::CIDE 10 Nancy|Actes du colloque CIDE'10]] (Nancy 2007)
 
;En ligne::http://lodel.irevues.inist.fr/cide/index.php?id=281
 
;Mots-clés:hypermédia adaptatif dynamique ; Ingénierie des connaissances ; web sémantique ; ontologie pédagogique ; modèle apprenant.
 
}}
 
 
__TOC__
 
__TOC__
;Résumé : Les hypermédias adaptatifs dynamiques pour l’enseignement sont particulièrement caractérisés par le fait d’offrir un hypermédia virtuel. Le système dans ce cas n’est pas constitué de pages et de liens prédéfinis. Ces derniers sont construits dynamiquement et doivent adapter leur formation en fonction des règles pédagogiques et des réactions des apprenants. Les travaux présentés dans notre article s'inscrivent dans ce contexte. Nous décrivons le document hypermédia pédagogique, ses caractéristiques et structures. Nous présentons notre approche de modélisation. Sur la base de ce modèle, nous présentons l’environnement numérique de travail MEDYNA de  type hypermédia adaptatif dynamique conçu  pour la rédaction et la génération dynamique des contenus adaptés.
+
.Résumé : Les hypermédias adaptatifs dynamiques pour l’enseignement sont particulièrement caractérisés par le fait d’offrir un hypermédia virtuel. Le système dans ce cas n’est pas constitué de pages et de liens prédéfinis. Ces derniers sont construits dynamiquement et doivent adapter leur formation en fonction des règles pédagogiques et des réactions des apprenants. Les travaux présentés dans notre article s'inscrivent dans ce contexte. Nous décrivons le document hypermédia pédagogique, ses caractéristiques et structures. Nous présentons notre approche de modélisation. Sur la base de ce modèle, nous présentons l’environnement numérique de travail MEDYNA de  type hypermédia adaptatif dynamique conçu  pour la rédaction et la génération dynamique des contenus adaptés.
{{boîte déroulante
+
|titre=English description
  |titre=English description
 
 
   |contenu=
 
   |contenu=
;Abstract : In the hypermedia systems the reinforcement of the learner interest requires the production, edition and diffusion of various type of teaching documents (courses, exercises, etc). The aim of our work, is the elaboration of a model of documents and teaching activities. This model describes parameters and functionalities to integrate in pedagogical contexts witch supports different activities. Based on this model, we conceived and carried out a dynamic adaptive hypermedia environment called MEDYNA, witch helps us to draft documents for e-learning. The system takes into account parameters and elements of the proposed model. It allows the dynamic generation of adaptive context to the learner. We exploited the XML technology for the implementation of our system.
+
;Abstract :In the hypermedia systems the reinforcement of the learner interest requires the production, edition and diffusion of various type of teaching documents (courses, exercises, etc). The aim of our work, is the elaboration of a model of documents and teaching activities. This model describes parameters and functionalities to integrate in pedagogical contexts witch supports different activities. Based on this model, we conceived and carried out a dynamic adaptive hypermedia environment called MEDYNA, witch helps us to draft documents for e-learning. The system takes into account parameters and elements of the proposed model. It allows the dynamic generation of adaptive context to the learner. We exploited the XML technology for the implementation of our system.
 
+
}}
 
 
<!-- code source Lodel :
 
<div id="inside" class="article">
 
            <ul id="ariane">
 
              <li><a href="index.php">accueil</a>&nbsp;&gt;</li>
 
              <li><a href="index.php?id=56">CIDE 10</a>&nbsp;&gt;</li>
 
              <li><a href="index.php?id=92">Session Le document numérique scientifique à des f...</a>&nbsp;&gt;</li>
 
            </ul>       
 
            <h2 class="publiParente"><a href="index.php?id=92">Session Le document numérique scientifique à des fins pédagogiques</a></h2>
 
            <div id="iconelegende"><img src="./docannexe/image/56/cide10-small100.gif"/></div>
 
            <div id="enteteDocument">                             
 
              <table class="iconepdf">
 
                <tr>
 
                  <td></td>
 
                </tr>
 
              </table>
 
              <h3>Création dynamique de documents hypermédias adaptatifs</h3>Amel <span class="familyName">Behaz</span> et  Mahieddine <span class="familyName">Djoudi</span><div class="type">Article</div>
 
            </div>
 
            <div id="motcles">
 
              <h4>Mots-clés :</h4>hypermédia adaptatif dynamique ; Ingénierie des connaissances ; web sémantique ; ontologie pédagogique ; modèle apprenant</div>
 
            <div id="resume">
 
              <h4>Résumé</h4>
 
              <p class="resume" dir="ltr">Les hypermédias adaptatifs dynamiques pour l’enseignement sont particulièrement caractérisés par le fait d’offrir un hypermédia virtuel. Le système dans ce cas n’est pas constitué de pages et de liens prédéfinis. Ces derniers sont construits dynamiquement et doivent adapter leur formation en fonction des règles pédagogiques et des réactions des apprenants. Les travaux présentés dans notre article s'inscrivent dans ce contexte. Nous décrivons le document hypermédia pédagogique, ses caractéristiques et structures. Nous présentons notre approche de modélisation. Sur la base de ce modèle, nous présentons l’environnement numérique de travail MEDYNA de  type hypermédia adaptatif dynamique conçu  pour la rédaction et la génération dynamique des contenus adaptés.</p>
 
              <h4>Abstract</h4>
 
              <p class="abstract" dir="ltr">In the hypermedia systems the reinforcement of the learner interest requires the production, edition and diffusion of various type of teaching documents (courses, exercises, etc). The aim of our work, is the elaboration of a model of documents and teaching activities. This model describes parameters and functionalities to integrate in pedagogical contexts witch supports different activities. Based on this model, we conceived and carried out a dynamic adaptive hypermedia environment called MEDYNA, witch helps us to draft documents for e-learning. The system takes into account parameters and elements of the proposed model. It allows the dynamic generation of adaptive context to the learner. We exploited the XML technology for the implementation of our system.</p>
 
            </div>
 
            <div id="toc">
 
              <h4>Table des matières</h4>                                         
 
              <div class="toc_section1"><a href="#tocto1n1" name="tocfrom1n1">Introduction  </a></div>                                                                                                                                                                                                                                                                                                   
 
              <div class="toc_section1"><a href="#tocto1n2" name="tocfrom1n2">Les hypermédias adaptatifs dynamiques </a></div>                                                                                                                                                                                                                                                                                                                                             
 
              <div class="toc_section2"><a  href="#tocto2n1" name="tocfrom2n1">Document virtuel personnalisable </a></div>                                                                                                                                                                                                                                                         
 
              <div class="toc_section1"><a href="#tocto1n3" name="tocfrom1n3">Modélisation de l’approche  </a></div>                                                                                                                                                                                                                                                                                                                                             
 
              <div class="toc_section2"><a  href="#tocto2n2" name="tocfrom2n2">Représentation de connaissances </a></div>                                                                                                                                                                                                                                                                                                   
 
              <div class="toc_section2"><a  href="#tocto2n3" name="tocfrom2n3">Modèles et ontologies spécifiques </a></div>                                                                                                                                                                                                                                                                                                                                             
 
              <div class="toc_section3"><a  href="#tocto3n1" name="tocfrom3n1">Modèle de document générique </a></div>                                                                                                                                                                                                                                                                                                   
 
              <div class="toc_section3"><a  href="#tocto3n2" name="tocfrom3n2">Ontologie de domaine </a></div>                                                                                                                                                                                                                                                                                                   
 
              <div class="toc_section3"><a  href="#tocto3n3" name="tocfrom3n3">Modèle apprenant </a></div>                                                                                                                                                                                                               
 
              <div class="toc_section1"><a href="#tocto1n4" name="tocfrom1n4">Génération dynamique  </a></div>                                                                                                                                                                                                                                                                                                   
 
              <div class="toc_section1"><a href="#tocto1n5" name="tocfrom1n5">Conclusion </a></div>                                                                                                                                                                                                                                                          </div>
 
            <h4>Texte intégral</h4>
 
            <div id="texte">
 
              <h1 dir="ltr" id="heading1"><a href="#tocfrom1n1" id="tocto1n1"><span class="lettrine">I</span>ntroduction </a></h1>
 
              <p class="texte" dir="ltr">L’ingénierie éducative est une réalité qui dépasse de loin le cadre de l’école et de l’université. Il existe dans le monde quantité d’universités virtuelles, de réseaux d’enseignement à distance, de professeurs impliqués dans la médiation pédagogique par les TIC. Ces nouvelles technologies constituent des ressources appréciables pour réaliser des applications à caractère pédagogique et permettent de mettre à la disposition des enseignants des outils efficaces pour répondre aux exigences des apprenants et à leurs attentes. La complexité grandissante de l’environnement technique, impose que l’enseignement soit intégré comme composant de base dans une quantité grandissante de produits et de services. De nos jours, beaucoup d’outils sont disponibles pour faciliter la construction des documents mais ne tirent pas assez partie des avancés des TIC.</p>
 
              <p class="texte" dir="ltr">A l’ère du web et du multimédia, la notion de document pédagogique devient difficile à  identifier.  En effet ces documents ne sont plus seulement textuels, plusieurs média (texte, image, son, vidéo …) de base sont aujourd’hui utilisés. Nous savons très bien l’apport du multimédia, dans le cadre éducatif et ses bénéfices au transfert de la connaissance et du  savoir. Plus on stimule les sens des apprenants, et on capte leur attention,  plus l’information est compréhensible. D’un autre coté, une information multimédia est souvent plus facile à mémoriser qu’une information  mono média.</p>
 
              <p class="texte" dir="ltr">La qualité de l’enseignement peut être améliorée si la composante hypertexte est ajoutée dans la structuration de ces documents <a href="#bib16">[16]</a>. Nous savons aussi, que les hypertextes aident beaucoup l’apprenant à mieux représenter la connaissance <a href="#bib15">[15]</a> et favorisent l’initiative de l’apprenant, puisque  ce dernier doit interagir avec le système  et  devient donc actif dans le processus d’apprentissage. Cependant, les documents multimédias sont non seulement caractérisés par des contenus de nature diverse mais aussi par l’organisation de ces contenus. Aussi, l’apprentissage en enseignement à distance ne peut être réalisé de façon linéaire et globale mais plutôt, par agencement cohérent de petites activités d’apprentissage, par rapport à des objectifs à atteindre. Ces petites activités doivent être précises et imbriquées les unes par rapport aux autres, sur lesquelles il est possible de construire sans cesse de nouvelles connaissances. Cette approche est souvent appelée la « granulation » des apprentissages. Elle vise à segmenter les apprentissages à acquérir en petites unités cohérentes (éléments textuels, graphiques, des images, des sons et des vidéos) qui, une fois réorganisées, formeront un tout cohérent plus structurant que l’ensemble des unités prises individuellement. La difficulté est comment peut-on définir le niveau adéquat de granularité de ces unités élémentaires?</p>
 
              <p class="texte" dir="ltr">Par ailleurs, le document est non seulement défini par un contenu mais aussi par des traitements qu’il est possible d’y appliquer (rédaction, lecture, navigation, ajout d’annotation, etc.) et aussi par des acteurs qui peuvent agir sur le document. Il en découle une difficulté pour la mise en place de modèles généraux pour intégrer différents besoins de traitements des documents pédagogiques. C’est donc un travail de modélisation qu’il faut effectuer pour représenter, structurer, indexer, filtrer, adapter, personnaliser la recherche au sein de ces documents.</p>
 
              <p class="texte" dir="ltr">Deux directions se font jour à ce sujet : soit on offre à l'apprenant un ensemble d'outils pour qu'il construise lui-même son parcours d’apprentissage, soit on guide sa recherche en fonction d'une connaissance de l'apprenant obtenue directement à partir de questions qui lui sont posées ou indirectement par les essais et erreurs de son parcours (agents intelligents par exemple). Dans la première direction l'usager reste maître de sa progression il peut construire un parcours au fur et à mesure de l'évolution de son besoin d'information. Dans la seconde, il reçoit des connaissances sans qu'il ait la maîtrise de l'évolutivité de son besoin d'information. </p>
 
              <p class="texte" dir="ltr">Il est question d’élaborer une méthodologie de conception de documents pédagogiques par un contenu orienté vers l’enseignement à distance. Nous visons particulièrement à structurer et adapter l’information diffusée conformément au profil de l’apprenant. L’idée de base est l’intégration de paramètres au sein même du contenu pédagogique produit et de rajouter des informations de nature sémantique. Nous espérons obtenir ainsi une description plus détaillée et précise qui soit susceptible d’afficher de manière personnalisée les documents à chaque apprenant.</p>
 
              <p class="texte" dir="ltr"> A l’heure actuelle les ontologies constituent une solution très prometteuse pour la représentation et le partage des connaissances dans le domaine des environnements numériques pour l’apprentissage humain <a href="#bib7">[7]</a> : indexation de documents pédagogiques, classification, conception de scénarios, apprentissage par exploration. C’est dans ce contexte que va se poursuivre aussi notre recherche afin d’intégrer une nouvelle vision de représentation formelle qui va sans doute apporter  des améliorations pour la conception des cours et indexation des objets pédagogiques, ceci permettra la consultation et la navigation au sein des contenus.</p>
 
              <p class="texte" dir="ltr">Dans cet article, nous donnons une vue d’ensemble sur l’évolution des systèmes hypermédias adaptatifs. Nous présentons ensuite notre approche de modélisation fondée sur des ontologies. Sur la base de ces modèles, nous décrivons l’environnement numérique de travail MEDYNA de  type  hyperMEdia aDaptatif dYNAmique destiné à l’enseignement médiatisé permettant la génération dynamique des contenus adaptés. </p>
 
              <h1 dir="ltr" id="heading2"><a href="#tocfrom1n2" id="tocto1n2">Les hypermédias adaptatifs dynamiques</a></h1>
 
              <p class="texte" dir="ltr">De part la nature hypermédia du  document pédagogique, nous nous sommes orienté sur les stratégies d’adaptation utilisées dans ce type de document. </p>
 
              <p class="texte" dir="ltr">L’objectif de ces systèmes est d’adapter la présentation de la connaissance et aider l’apprenant à naviguer à travers le graphe composé par  l’ensemble des pages et des liens hypermédia. Selon Brusilovsky <a href="#bib6">[6]</a> ils sont de deux sortes :</p>
 
              <ul class="listlevel1WW8Num25">
 
                <li>
 
                  <p class="puces" dir="ltr">Les systèmes qui adaptent le contenu présenté à l’apprenant </p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Les systèmes qui adaptent les liens présentés à l’apprenant </p>
 
                </li>
 
              </ul>
 
              <p class="texte" dir="ltr">De ce fait, nous devons modifier aussi bien le contenu des pages que les liens entre ces dernières. Différentes techniques d’adaptation des liens ont été développées au fil des années, entre autres, le guidage direct, l’ordonnancement des liens, le masquage des liens, l’annotation des liens ou encore les cartes adaptatives <a href="#bib5">[5]</a>. Les différents types de systèmes hypermédias adaptatifs se caractérisent par la relation qu’ils entretiennent avec l’apprenant pour lui présenter la connaissance. En dépit de l’évolution importante réalisée par ces systèmes, il subsiste encore plusieurs problèmes. En effet, bien que l’adaptation des liens semble facile, l’adaptation des contenus en revanche reste à ses débuts encore. Il est plus facile de cacher des liens ou de les annoter, mais plus difficile de remplacer une partie d’une page ou de modifier sa structure. Parmi les systèmes qui adaptent le contenu présenté se distinguent trois types : ceux qui adaptent le texte, ceux qui choisissent le média le plus approprié et ceux qui adaptent le mode de présentation. Pour l’instant, très peu de systèmes effectuent une adaptation du contenu, et lorsqu’ils le font, l’adaptation n’a souvent lieu qu’au niveau des données textuelles.</p>
 
              <p class="texte" dir="ltr">Les hypermédias adaptatifs dynamiques sont particulièrement caractérisés par le fait d’offrir un hypermédia virtuel <a href="#bib12">[12]</a>. Le système n’est pas constitué de pages et de liens prédéfinis. Ces derniers sont construits dynamiquement et doivent adapter leur offre de formation de manière dynamique, en fonction des règles pédagogiques et des réactions des apprenants. Ceci permet la construction de cours adaptés à un apprenant conformément à ses caractéristiques et à ses exigences. Ces systèmes donnent un moyen d'accès intuitif et non linéaire à l'information et facilitent la navigation. En revanche ces systèmes souffrent d’une limite assez importante, en l’occurrence leur complexité. Cette complexité est due d’une part aux différents traitements de sélection et de combinaisons (assemblage) effectués sur les données, et d’autre part à la manière de caractériser les ressources pédagogiques impliquées.</p>
 
              <h2 dir="ltr" id="heading3"><a href="#tocfrom2n1" id="tocto2n1">Document virtuel personnalisable</a></h2>
 
              <p class="texte" dir="ltr">Le document virtuel personnalisable est un concept qui a émergé avec le développement de ces systèmes, il est généré à partir d’une composition de fragments de contenu (texte, image ou son) en utilisant des programmes et en définissant des liens vers d’autres fragments ou documents. Le document virtuel est dit dynamique car il est généré dynamiquement de manière à répondre instantanément à un besoin particulier de l’apprenant.</p>
 
              <p class="texte" dir="ltr">Iksal <a href="#bib12">[12]</a> définit un document virtuel adaptatif personnalisable comme un document composé d’un ensemble de fragments d’informations, ainsi que d’un moteur de composition sémantique permettant la sélection des fragments pertinents, leur assemblage. Autrement dit, leur organisation en fonction d’une spécification de l’auteur et/ou de l’objectif du lecteur et finalement d’adapter certains aspects visibles  du document fournis au lecteur. </p>
 
              <p class="texte" dir="ltr">De ce fait, la génération automatique de document personnalisable sur le Web repose sur deux éléments, un système de recherche d’information (sélection de fragments) et un système d’organisation de l’information (assemblage de ces fragments). Le processus de sélection des fragments et l’organisation de ceux –ci s’appuient généralement d’une part, sur la caractérisation de ces fragments et leur indexation, d’autre part  sur les critères d’adaptation. Or le document virtuel personnalisable en tant que support pédagogique est un document où on a plusieurs types d’adaptabilités. Orientés vers les intérêts du lecteur (apprenant) ou de l’auteur (enseignant). Ces deux stratégies sont définies comme suit, soit par :</p>
 
              <p class="texte" dir="ltr">- L’auteur : Le système adapte le document dont la structure et le contenu sont définis par l’auteur, il est nécessaire de respecter les contraintes de ce dernier, ce qui assure la cohérence narrative du document pédagogique. Afin de pouvoir retrouver ces fragments, il faut lors de l’intégration des fragments leur associer des méta données. La structure narrative consiste en un graphe composé d’un ensemble de fragments et de relations sémantiques. L’utilisation d’un modèle de domaine par exemple peut servir de guide de navigation au sein du document.</p>
 
              <p class="texte" dir="ltr">- Le lecteur: Le système compose automatiquement un document virtuel adaptable en fonction des contraintes liées aux objectifs de l’apprenant. Une sorte d’un modèle de tâches à réaliser. Dans ce cas, le système recherche les fragments d’information permettant d’atteindre ces objectifs, ces préférences ou son niveau de connaissance. Pour cela,  il dispose  de pré requis situés dans l’indexation des pages (méta données) et des règles pédagogiques <a href="#bib18">[18]</a>. Le but donc est de composer un document personnalisé à un instant donné en fonction des caractéristiques de l’apprenant. </p>
 
              <h1 dir="ltr" id="heading4"><a href="#tocfrom1n3" id="tocto1n3">Modélisation de l’approche </a></h1>
 
              <h2 dir="ltr" id="heading5"><a href="#tocfrom2n2" id="tocto2n2">Représentation de connaissances</a></h2>
 
              <p class="texte" dir="ltr">Un document pédagogique dans notre cas est un module d’enseignement sur lequel un apprenant va effectuer différentes activités pédagogiques. Le module d’enseignement est rattaché le plus souvent à un champ d’enseignement appelé matière (domaine).</p>
 
              <p class="texte" dir="ltr">Nous avons fragmenté le contenu du document conformément aux activités et objectifs pédagogiques correspondants <a href="#bib8">[8]</a>. Ces activités vont aider La création de contenus pédagogiques de qualité, améliorant une forme d’adaptation automatique selon l’objectif d’apprentissage recherché, assimilation d’un cours, ou résolution d’une série d’exercices. Pour cela, il était nécessaire de spécifier les paramètres décrivant ces fragments et fournir ainsi des fonctionnalités facilitant la  recherche, le filtrage et la construction (assemblage) du contenu. Notre travail nous a amené à construire un modèle <a href="#bib2">[2]</a> générique permettant la production de différents types de documents, ainsi chaque enseignant pourra conserver sa vision spécifique de rédaction. </p>
 
              <p class="texte" dir="ltr">Nous avons proposer une granularité assez fine du cours, afin qu’il puisse constituer une source effective aux diverses activités proposées aux apprenants <a href="#bib3">[3]</a>. Nous affirmons toujours que si le contenu est fragmenté en petites unités, ces unités seront plus partageables entre les acteurs du système donc plus réutilisables ce qui va augmenter et favoriser énormément l’adaptation aux apprenants. Nous avons décomposer les unités d’apprentissage en plusieurs fragments de contenus appelées : Unités d’aPprentissage Elémentaire (UPE) qui peuvent être : une Introduction, un Théorème, une Formule, une Illustration, une Définition, une Conclusion, un Exemple, une Explication, QCM, Exercice etc., ces UPEs sont les objets pédagogiques. </p>
 
              <p class="texte" dir="ltr">Aussi, il fallait définir un ensemble de méta données pour décrire ces UPEs, cet ensemble doit être partageable et reconnaissable entre les créateurs et les utilisateurs d’ou le choix d’une norme. LOM (Learning Object Metadata) est plus complet <a href="#bib1">[1]</a>, <a href="#bib4">[4]</a>, <a href="#bib11">[11]</a> et <a href="#bib14">[14]</a>, il permet de décrire tout ce qui caractérise un objet pédagogique, neuf catégories de descripteurs sont prises en compte à savoir une description du contenu que des objectifs visés, du public ou de la configuration matérielle nécessaire. Pour ces raisons nous avons repris la normalisation de LOM, mais aux besoins de notre application et pour faciliter l’analyse nous avons défini un sous-ensemble de vocabulaire. Après avoir typé les UPEs (Introduction, Théorème, Définition, Conclusion, etc.) et décrit  leur format (texte, image, vidéo, etc.), nous avons aussi intégré d’autres informations de nature sémantique pouvant faciliter la caractérisation de ces UPEs. A titre d’exemple, nous pouvons citer le niveau de difficulté, ou le temps d’apprentissage nécessaire. Tous ces éléments intégrés dans les UPEs vont servir à l’adaptation. En effet on peut sélectionner ces différentes UPEs selon leur niveau de difficulté, leur type ou format et  prévoir en conséquence des contenus pédagogiques personnalisés. </p>
 
              <h2 dir="ltr" id="heading6"><a href="#tocfrom2n3" id="tocto2n3">Modèles et ontologies spécifiques</a></h2>
 
              <p class="texte" dir="ltr">L’ontologie désigne l’étude de ce qui existe, c'est-à-dire l’ensemble des connaissances que l’on a sur le monde. Avec l’émergence de l’ingénierie des connaissances que les ontologies sont apparues, comme réponse aux problématiques de représentation et de manipulation des connaissances au sein des systèmes informatique. <a href="#bib9">[9]</a></p>
 
              <p class="texte" dir="ltr">Une ontologie est la partie fondamentale d’une représentation conceptuelle. La conceptualisation consiste en un ensemble d’objets, les concepts, et en un ensemble de relation entre les concepts. Une ontologie peut prendre la forme d’une hiérarchie de termes atomiques ou bien accompagnés de définitions, de schémas conceptuels spécifiant la structure de certaines connaissances, d’une théorie, d’un ensemble de règles logiques définissants un ensemble de termes et de contraintes sur leur utilisation. <a href="#bib13">[13]</a></p>
 
              <p class="texte" dir="ltr">Afin de concevoir notre environnement numérique MEDYNA de type hypermédia adaptatif dynamique nous avons utilisé 3 modèles représentés sous formes d’ontologies : un modèle de document générique, un modèle de domaine et un modèle apprenant.</p>
 
              <h3 dir="ltr" id="heading7"><a href="#tocfrom3n1" id="tocto3n1">Modèle de document générique</a></h3>
 
              <p class="texte" dir="ltr">Le modèle de document permet de modéliser la structure globale de document. Cette structure narrative est représentée par un modèle de document qui permet d’éditer différents types de documents pédagogiques. Nous avons donc créé une grammaire définissant une sémantique générique élaborée par une DTD. Cette DTD a été voulue volontairement simple et assez générale. Ceci constitue une solution satisfaisante pour simplifier le maintien en bon état et les mises à jour des documents pédagogiques qui va accroître leur utilité. (Fig. 1), (Fig. 2)</p>
 
              <table id="Tableau17Ctable" cellspacing="0" dir="ltr" style="margin-left:-0.0521in;margin-right:0mm;margin-top:0mm;margin-bottom:0mm;border-collapse:separate;border-spacing:0pt">
 
                <tbody>
 
                  <tr>
 
                    <td style="margin-left:0mm;margin-right:0mm;margin-top:0mm;margin-bottom:0mm;padding-top:0in;padding-bottom:0in;padding-left:0.075in;padding-right:0.075in;border:0.0007in solid #000000;vertical-align:top">
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT Document (profil, Résumé*, pré-requis<sup>+</sup>, Sommaire?, Introduction générale?,  Activité<sup>+</sup>,  Conclusion générale,  Bibliographie, Annexe*) &gt;</p>
 
                      <p class="texte" dir="ltr">&lt; !ATTLIST  Module intitulé CDATA #REQUIRED &gt;</p>
 
                      <p class="texte" dir="ltr">&lt; !  ENTITY profil  SYSTEM “ profil.xml”&gt;</p>
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT Résumé (#PCDATA)&gt;</p>
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT pré-requis ANY&gt;</p>
 
                      <p class="texte" dir="ltr">&lt; !ATTLIST  pré-requis  url CDATA #REQUIRED &gt;</p>
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT Sommaire (#PCDATA)&gt;</p>
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT Introduction générale (#PCDATA)&gt;…..</p>
 
                    </td>
 
                  </tr>
 
                </tbody>
 
              </table>
 
              <p class="titreillustration" dir="ltr">Figure 1 : DTD Générique du document</p>
 
              <table id="Tableau27Ctable" cellspacing="0" dir="ltr" style="margin-left:-0.0521in;margin-right:0mm;margin-top:0mm;margin-bottom:0mm;border-collapse:separate;border-spacing:0pt">
 
                <tbody>
 
                  <tr>
 
                    <td style="margin-left:0mm;margin-right:0mm;margin-top:0mm;margin-bottom:0mm;padding-top:0in;padding-bottom:0in;padding-left:0.075in;padding-right:0.075in;border:0.0007in solid #000000;vertical-align:top">
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT  UPE (url+, niveau-difficulté, Format<sup>+</sup>, time,Objectif…)</p>
 
                      <p class="texte" dir="ltr">&lt; !ATTLIST  UPE</p>
 
                      <p class="texte" dir="ltr">type (Titre | Introduction | Théorème | Définition |Explication | Exemple |lllustration | Exercice | QCM….)’titre’</p>
 
                      <p class="texte" dir="ltr">intitulé CDATA #REQUIRED&gt;</p>
 
                      <p class="texte" dir="ltr">&lt;ELEMENT url (#PCDATA)&gt;</p>
 
                      <p class="texte" dir="ltr">&lt;ELEMENT niveau-difficulté (#PCDATA)&gt;</p>
 
                      <p class="texte" dir="ltr">&lt; ! ELEMENT  Format <span style="font-family:Symbol,serif;">?</span> texte | image | vidéo |……<span style="font-family:Symbol,serif;">?</span>&gt;</p>
 
                    </td>
 
                  </tr>
 
                </tbody>
 
              </table>
 
              <p class="titreillustration" dir="ltr">Figure 2 : DTD associée à l’unité pédagogique élémentaire</p>
 
              <p class="texte" dir="ltr">La DTD a souvent besoin d’être modifiée pour lui rajouter de nouvelles extensions. Le rajout d’une sous DTD peut se faire de diverses façons, une solution consiste à utiliser les espaces de noms, s’il n’y a pas un risque de conflit entre les noms et des éléments.</p>
 
              <p class="texte" dir="ltr">Nous avons proposé un vocabulaire non exhaustif pour traiter et produire différents types de documents pédagogiques. Cette DTD est utilisée pour valider l’éditeur que nous avons construit. Nous affirmons que la facilité d’utilisation et la rapidité de construction sont les caractéristiques essentielles que nous voulons atteindre pour l’édition des documents pédagogiques par les enseignants. </p>
 
              <h3 dir="ltr" id="heading8"><a href="#tocfrom3n2" id="tocto3n2">Ontologie de domaine</a></h3>
 
              <p class="texte" dir="ltr">Les termes employés ci-dessus nous ont permis de définir une ontologie comme suit.</p>
 
              <p class="texte" dir="ltr">Les ressources liées au domaine sont décrites par les concepts suivants : domaine (Informatique, physique, biologie,…) module d’enseignement (Système d’exploitation, java, mécanique du point,..) cours (Sémaphores, forces, vibration,…) et concepts correspondant aux objectifs pédagogiques des différents UPEs Introduction, Définition, QCM, Exercice,…  (Fig. 2).</p>
 
              <p class="texte" dir="ltr">Les relations entre ces concepts sont de 2 types :</p>
 
              <p class="texte" dir="ltr">EST-COMPOSE-DE : Un domaine  EST-COMPOSE-DE  modules d’enseignements</p>
 
              <p class="texte" dir="ltr">                                    Un module d’enseignement EST-COMPOSE-DE plusieurs cours </p>
 
              <p class="texte" dir="ltr">                                    Un cours EST-COMPOSE-DE plusieurs UPEs</p>
 
              <p class="texte" dir="ltr">EST-PRE-REQUIS-DU : CoursX  EST-PRE-REQUIS-DU CoursY</p>
 
              <p class="texte" dir="ltr">                                        UPE Introduction  EST-PRE-REQUIS-DU  UPE Définition</p>
 
              <p class="texte" dir="ltr">Ce dernier concept permet de savoir ce qui doit être connu et acquis pour bien comprendre l’unité pédagogique courante, par  exemple le cours « Système d’exploitation 2 » ne peut être abordé que si le cours « Système d’exploitation 1 » est acquis (assimilé).</p>
 
              <p class="texte" dir="ltr">Des relations sémantiques relient les instances du cours aux différents UPEs, chaque UPE constitue une ressource pédagogique qui est annotée. Les annotations expriment les relations sémantiques avec les objets pédagogiques exemples Introduction<strong>.</strong>Sémaphores ou Définition<strong>.</strong>Sémaphoresou encoreQCM<strong>.</strong>Sémaphores</p>
 
              <p class="texte" dir="ltr">
 
                <div class="textIcon"><a href="image.php?source=docannexe/image/281/img-1.png&amp;titlepos=down" title="Zoom" rel="nofollow" onclick="window.open(this.href, '', '','','','','','','','','','','','','','top=0, left=0, width=577, height=731, resizable=yes, scrollbars=yes'); return false;"><img src="docannexe/image/281/img-1-small400.png" alt="Agrandir Image1" /></a><p class="titreillustration" dir="ltr"><a id="Image17Cgraphics"></a>Figure 3 : Ontologie du domaine et ses instances</p>
 
                </div>
 
              </p>
 
              <h3 dir="ltr" id="heading9"><a href="#tocfrom3n3" id="tocto3n3">Modèle apprenant</a></h3>
 
              <p class="texte" dir="ltr">Pour qu’un système d’apprentissage soit « intelligent », il faut qu’il soit capable de s’adapter à l’apprenant qui se trouve devant la machine. Ceci ne peut être atteint que par la connaissance du modèle de l’apprenant. L’ensemble des connaissances aidera à définir les caractéristiques des apprenants de façon à ce qu’il soit plus facile d’adapter les contenus en fonction de leur profil d’apprentissage, de surveiller leur progression, de fournir un encadrement administratif et cognitif adapté, etc.</p>
 
              <p class="texte" dir="ltr">Si on reprend la métaphore du choix d’un cours ou d’un ouvrage éducatif, ce choix est fonction :</p>
 
              <ul class="listlevel1WW8Num25">
 
                <li>
 
                  <p class="puces" dir="ltr">De la présentation du cours : son organisation (structure), les média utilisés,</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Du contexte d’apprentissage de l’apprenant, si pour une compréhension ou pour la préparation d’un examen, l’expérience montre que les étudiants tentent de chercher les ouvrages rédigés par un enseignant donné (dans ce cas la sélection se fera par rapport aux enseignants),</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Du sujet d’étude (sélection par rapport au domaine ou du module).</p>
 
                </li>
 
              </ul>
 
              <p class="texte" dir="ltr">Nous avons donc décidé d’organiser les connaissances intrinsèques au modèle apprenant en quatre catégories en plus de son identité (nom, age,…) :</p>
 
              <ul class="listlevel1WW8Num25">
 
                <li>
 
                  <p class="puces" dir="ltr"><strong>Capacité</strong> : l’état des connaissances (débutant, moyen, avancé) Lors de la phase d’initialisation, les apprenants ont tous le même niveau de connaissances (débutant). L’évolution du niveau de connaissance de l’apprenant durant une session d’apprentissage est induite par une méthode d’évaluation. La présentation d’une partie ou d’un chapitre d’un document est toujours suivie d’un test ou exercice. L’apprenant n’est alors acheminé vers la partie ou le chapitre suivant que s’il réussit ce test. Aussi, des évaluations de pré requis sont effectuées avant la présentation des UPEs.</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr"><strong>Objectifs </strong>: tâches ou activités à réaliser. Cette catégorie définie les objectifs pédagogiques de l’état courant. Ces objectifs vont avoir une influence sur le comportement du système. Soit que l’apprenant est concerné par l’aspect information de la matière, dans ce cas une exploration libre du document sans aucun guidage est prévue par le système. Soit que l’apprenant est concerné par l’aspect formation, il a besoin d’être guidé et évalué dans son apprentissage, dans ce cas le système doit être capable de lui prodiguer cette aide. </p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr"><strong>Préférences</strong>: Vont permettre à l’apprenant de spécifier les types de média préférés. Ainsi il a possibilité de définir un classement sur les types physiques de média  pour la présentation des contenus (texte, image, vidéo,…). Il serait donc intéressant de présenter un même contenu suivant différentes formes comme l’a recommandé Dufresne <a href="#bib10">[10]</a>.</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr"><strong>Son passé</strong> : garder trace de l’état de son historique. Mémorisation de la navigation et des éléments lus dans les documents, information sur la session courante de l’apprenant.</p>
 
                </li>
 
              </ul>
 
              <p class="texte" dir="ltr">Tous ces attributs peuvent évoluer pour enrichir plus le modèle apprenant selon son comportement ou interaction avec notre système. Le modèle apprenant est un modèle individuel puisqu’il permet de gérer des informations individuelles. Un apprenant désirant suivre un module pédagogique à travers notre système d’apprentissage doit pouvoir le choisir conformément aux compétences qu’il souhaite acquérir. Une fois le cours choisi, des activités pédagogiques sont demandées  à travers la visualisation de contenus personnalisés selon les préférences de l’apprenant. </p>
 
              <h1 dir="ltr" id="heading10"><a href="#tocfrom1n4" id="tocto1n4">Génération dynamique </a></h1>
 
              <p class="texte" dir="ltr">La génération de contenus démarre lorsque l’apprenant décide d’activer un cours qu’il voudrait suivre, qui est propre à un enseignant, ou lorsqu’il clique sur un lien hypertexte qui l’amène vers un autre concept du même cours ou d’un autre cours. Le Générateur de contenus (GC) (Fig 4) récupère la liste des éléments de la structure de cet enseignant. Ensuite, pour chaque élément de cette structure le GC récupère l’ensemble des UPEs associées à cet élément. Pour chaque type cognitif de cet ensemble le GC récupère deux sous ensembles. Pour cela nous avons pensé à utiliser deux sortes de filtres le premier permet d’extraire un sous ensemble d’UPEs ayant le même niveau de difficulté et le deuxième filtre permet d’effectuer  le même genre d’extraction mais pour un type physique donné. Une fois que le GC a construit le contenu d’une page, il faut que le système détermine les liens hypertextes permettant à l’apprenant d’accéder à d’autres concepts en rapport avec la page courante. Nous prenons en considération Les relations définies par l’enseignant auteur du document. Lorsque l’apprenant clique sur un lien, il requiert le contenu d’une page décrite par une URL. En général, l’url spécifie une page dynamique dont le contenu est calculé et peut donc dépendre de nombreux facteurs. En effet, ceci permet de réaliser quelques effets de  transformations appréciées pédagogiquement comme le masquage, insertion de liens ou ajout d’annotation. De ce fait, nous pouvons affirmer qu’une adaptation tant au niveau du contenu, qu’au niveau des liens est réalisée. </p>
 
              <p class="texte" dir="ltr">
 
                <div class="textIcon"><a href="image.php?source=docannexe/image/281/img-2.png&amp;titlepos=down" title="Zoom" rel="nofollow" onclick="window.open(this.href, '', '','','','','','','','','','','','','','top=0, left=0, width=663, height=555, resizable=yes, scrollbars=yes'); return false;"><img src="docannexe/image/281/img-2-small400.png" alt="Agrandir Image2" /></a><p class="titreillustration" dir="ltr"><a id="Image27Cgraphics"></a>Figure 4 : Processus de génération dynamique des pages</p>
 
                </div>
 
              </p>
 
              <p class="texte" dir="ltr">En ce qui concerne le module générateur de contenus, nous avons opté pour la solution des pages dynamiques. Avec un modèle de données au niveau du serveur. A cet effet, une architecture client/serveur est implémentée, imposant l’utilisation d’un serveur fiable.  Notre démarche nous a conduit à utiliser Tomcat. Il permet l’exécution de Java Server Pages. Les servlets autrement dit JSP permettent de créer des programmes en Java des pages actives dont le contenu est calculé lorsque la page est demandée. Ce calcul peut s’appuyer sur toutes les données recueillies auprès de l’apprenant et peut donc s’adapter aux préférences qu’il a pu exprimer, à sa progressions, à ses résultats d’évaluations,etc.</p>
 
              <p class="texte" dir="ltr">Nous avons fait en sorte que le résultat de ces pages passe par une couche de filtrage. Cette couche de filtrage est un programme Java permettant de réaliser quelques effets intéressant comme : </p>
 
              <ul class="listlevel1WW8Num17">
 
                <li>
 
                  <ul>
 
                    <li>
 
                      <p class="texte" style="margin-left:0.0in; margin-right:0.0in; margin-top:0.0in; margin-bottom:0.0835in; text-indent:0.0in; text-align:justify;" dir="ltr">Masquage ou remplacement de zones</p>
 
                    </li>
 
                    <li>
 
                      <p class="texte" style="margin-left:0.0in; margin-right:0.0in; margin-top:0.0in; margin-bottom:0.0835in; text-indent:0.0in; text-align:justify;" dir="ltr"> Insertion de liens </p>
 
                    </li>
 
                    <li>
 
                      <p class="texte" style="margin-left:0.0in; margin-right:0.0in; margin-top:0.0in; margin-bottom:0.0835in; text-indent:0.0in; text-align:justify;" dir="ltr">Ajout d’annotation</p>
 
                    </li>
 
                  </ul>
 
                </li>
 
              </ul>
 
              <p class="texte" dir="ltr">Les traitements de présentation concernant la mise en forme des pages XML sont réalisés par des feuilles de styles. A chaque document XML généré est associée une feuille de style XSL permettant la représentation du document en HTML sur le navigateur de l’apprenant.</p>
 
              <p class="texte" dir="ltr">Le système <span style="font-family:Helvetica,sans-serif;  font-size:8.0pt;"><strong>MEDYNA</strong></span>  propose à l’apprenant une série d’onglets lui permettant de spécifier ses choix. Cela passe par le choix d’un module d’enseignement (visualisation des cours disponibles), ou d’un enseignant (visualisation de l’ensemble des enseignants inscrits dans le système), ou bien de ses préférences au sujet du type physique des médias des UPEs. L’apprenant aura la liberté de navigation dans le document tout en l’acheminant vers des parties adéquates à ses capacités. Des tests (QCU) associés à chaque fin de partie ou chapitre obligent l’apprenant à y répondre.</p>
 
              <p class="texte" dir="ltr">La page visualisée est divisée en deux parties (Fig. 5). La partie de gauche présente le plan du cours de façon hiérarchique, sur la partie de droite on peut visualiser le contenu de la partie qui est active et qui est en adéquation avec le modèle de l’apprenant.</p>
 
              <p class="texte" dir="ltr">Nous remarquons dans les figures (Fig. 5) et (Fig. 6) une génération dynamique d’un même cours « SQL language » présenté à des apprenants de profils  différents un de niveau de connaissances débutant et l’autre de niveau avancé.</p>
 
              <p class="texte" style="margin-left:0.0in; margin-right:0.0in; text-indent:0.0in; text-align:center;" dir="ltr">
 
                <div class="textIcon"><a href="image.php?source=docannexe/image/281/img-3.png&amp;titlepos=down" title="Zoom" rel="nofollow" onclick="window.open(this.href, '', '','','','','','','','','','','','','','top=0, left=0, width=895, height=820, resizable=yes, scrollbars=yes'); return false;"><img src="docannexe/image/281/img-3-small400.png" alt="Agrandir Image3" /></a><p class="titreillustration" dir="ltr"><a id="Image37Cgraphics"></a>Figure 5 : Cours niveau débutant</p>
 
                </div>
 
              </p>
 
              <p class="texte" style="margin-left:0.0in; margin-right:0.0in; text-indent:0.0in; text-align:center;" dir="ltr">
 
                <div class="textIcon"><a href="image.php?source=docannexe/image/281/img-4.png&amp;titlepos=down" title="Zoom" rel="nofollow" onclick="window.open(this.href, '', '','','','','','','','','','','','','','top=0, left=0, width=894, height=822, resizable=yes, scrollbars=yes'); return false;"><img src="docannexe/image/281/img-4-small400.png" alt="Agrandir Image4" /></a><p class="titreillustration" dir="ltr"><a id="Image47Cgraphics"></a>Figure 6 : Même cours niveau Avancé</p>
 
                </div>
 
              </p>
 
              <p class="texte" dir="ltr">Afin de vérifier la qualité des fonctions offertes par notre système MEDYNA, nous avons simulé le travail d’un apprenant en lui demandant d’accéder au cours et d’effectuer des opérations prévues par le système (consultation sans ou avec guidage, réponses à un questionnaire…) ainsi nous résumons les commentaires de 10 apprenants de différentes disciplines comme suit :</p>
 
              <ul class="listlevel1WW8Num25">
 
                <li>
 
                  <p class="puces" dir="ltr">Le système offre aux apprenants la possibilité d’être actifs dans la phase d’apprentissage, dialogue entre le système et l’apprenant pour que ce dernier puisse ramener la matière à son rythme, à sa compréhension et pour que le système puisse le guider et  l’appuyer dans sa démarche.</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Le nombre de fonctions pédagogiques est impressionnant.</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Il y’a effectivement des contenus adaptés aux niveaux des connaissanses des apprenants, ainsi que des liens imposés sur la page personnelle.</p>
 
                </li>
 
                <li>
 
                  <p class="puces" dir="ltr">Les icônes traduisent bien leurs fonctions. Mais on met un peu de temps à comprendre à quoi servent certaines commandes. </p>
 
                </li>
 
              </ul>
 
              <p class="texte" dir="ltr">Ce prototype est encore à un stade expérimental au niveau de notre département. Nous confirmons l’importance du nombre des UPEs impliqués dans les documents pour pouvoir prétendre avoir un système qui s’adapte réellement à l’apprenant. Or la production de ces UPEs n’est pas des plus triviale, et coûte énormément cher en terme de temps et d’efforts. Mais un atout important est la finesse des descriptions des unités d’apprentissage en UPEs. Nous affirmons encore que si le contenu est fragmenté en petites unités, elles seront plus partageables et réutilisables, ce qui va constituer une source effective favorisant beaucoup l’adaptation. Par ailleurs, pour que l'adaptabilité soit gérée facilement, nous avons incorporé dans ces documents toutes les descriptions susceptibles de produire dynamiquement des documents de meilleure qualité et d’une plus grande utilité. </p>
 
              <h1 dir="ltr" id="heading11"><a href="#tocfrom1n5" id="tocto1n5">Conclusion</a></h1>
 
              <p class="texte" dir="ltr">Nous avons présenté dans cet article, une nouvelle approche de modélisation et d’adaptation des documents pédagogiques hypermédias. Sur la base des modèles proposés, nous avons élaboré un environnement adaptatif dynamique MEDYNA permettant la réalisation de différentes activités pédagogiques, du moment que plusieurs profils d’apprenants sont détectés et intégrés dans le système, et plusieurs formes de présentations des contenus sont définies. Nous avons proposé une granulation assez fine du document afin qu’il puisse constituer une source effective aux diverses activités proposées aux apprenants. </p>
 
              <p class="texte" dir="ltr">Nous sommes conscients que notre travail est loin d’être fini et qu’il est appelé à évoluer dans un futur proche. Pour l’enrichissement du modèle apprenant, nous pensons intégrer dans l’enchaînement des activités suivies par un apprenant des aspects de style d’apprentissage. Par exemple, un apprenant logique préfère un cours bien structuré théorie puis les exercices. Un apprenant intuitif préfère un cours flexible, il commence d’abord par une série d’exercices puis la théorie, donc une navigation rapide. Un apprenant introverti préfère un environnement tranquille, aime le travail personnel. Un apprenant extroverti préfère le travail en groupe et les échanges avec d’autres apprenants. Il serait donc plus intéressant de prévoir pour chacune de ces catégories des activités différentes et des contenus plus adaptatifs. Aussi, pour rompre l’isolement de l’apprenant et utiliser les facilités du Web, nous proposons une approche de collaboration qui consiste à utiliser les connaissances du système sur différents apprenants (stockées dans leurs modèles d’apprenant) pour former un groupe de travail. Par exemple les apprenants qui ont des objectifs d’enseignements similaires sont identifiés par le système, regroupés et proposés à celui qui sollicite de la collaboration <a href="#bib17">[17]</a>. </p>
 
            </div>
 
            <div id="remerciements"></div>
 
            <div id="annexes">
 
              <h4>Bibliographie</h4>
 
              <div id="bibliographie">
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib1"></a><a id="bkmbib1"></a>[1] ARIADNE, <a href="http://ariadne-eu.org/"><span style="font-size:11.0pt; color:#0000ff; text-decoration:underline;">http://ariadne-eu.org</span></a><span style="font-size:11.0pt; color:#0000ff; text-decoration:underline;">,</span></p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib2"></a><a id="bkmbib2"></a>[2] Behaz A., Djoudi M., « Modélisation et adaptation des documents pédagogiques hypermédias en enseignement à distance » 7ème Colloque Africain sur la Recherche en Informatique (CARI’04), Hammamet, Tunisie, 22-27 novembre 2004.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib3"></a><a id="bkmbib3"></a>[3] Behaz A., Djoudi M., « Génération dynamique de documents hypermédias adaptatifs dans un environnement numérique de travail.» Journal africain de recherches en informatique et application mathématiques. ARIMA, pp 25-53 Novembre 2005.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib4"></a><a id="bkmbib4"></a>[4] Bourda Y. Helier M.  « Métadonnées  et XML : Application aux objets pédagogiques ». Conférence TICE 2000, Troyes, octobre 2000.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib5"></a><a id="bkmbib5"></a>[5] Brusilovsky P. « Adaptive hypermedia », in User Modelling and User-Adapted Interaction, pp 87-110, Kluwer Academic Publishers, 2001.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib6"></a><a id="bkmbib6"></a>[6] Brusilovsky P. Nejdl, « Adaptive hypermedia and Adaptive Web », In: M. P. Singh (ed.) Practical Handbook of Internet Computing. Baton Rouge: Chapman Hall &amp; CRC Press, pp. 1.1-1.14,  2005.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib7"></a><a id="bkmbib7"></a>[7]Corby et Al « Querying the Semantic Web with the Corese conception &amp; development search Engine,», proceeding of European Conference on Artificial Intelligence ECAI2004.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib8"></a><a id="bkmbib8"></a>[8] David J.P. « Modélisation d’activités pédagogiques avec le langage XML », <a href="http://www.inrp.fr/atief/eiao/accueil.htm">Journées</a> EIAO 2001, Environnements Interactifs d'Apprentissage avec Ordinateur, Paris, 25-27 avril 2001.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib9"></a><a id="bkmbib9"></a>[9] Dehors S. « QBLS : web sémantique de formation pour  un apprentissage par questionnement», EIAH Montpellier 2005.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib10"></a><a id="bkmbib10"></a>[10] Dufresne A., « Modèles et outils pour définir le soutien dans les environnements hypermédias. ExploraGraph », Revue Sciences et Techniques Educatives, Edition Hermès, Paris,  2001.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib11"></a><a id="bkmbib11"></a>[11] Draft for Learning Object Metadata , LTSC-IEEE LOM Working Group, 2001 <a href="http://ltsc.ieee.org/wg12/"><span style="font-size:11.0pt; color:#0000ff; text-decoration:underline;">http://ltsc.ieee.org/wg12/</span></a></p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib12"></a><a id="bkmbib12"></a>[12] Iskal S., Garlatti S. « Spécification déclarative des documents virtuels personnalisables » In: Actes de DVP 2002, Brest (France), p. 127-140 10-11 Juillet 2002.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib13"></a><a id="bkmbib13"></a>[13] Lando P. « Conception et développement d’applications informatiques utilisant des ontologies : application aux EIAH» RJC-EIAH 2006 </p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib14"></a><a id="bkmbib14"></a>[14] Mc Murray E. « Des normes pour les technologies de la formation », <span style="color:#000000;">Publications du domaine IT de l'EPFL, Suisse</span>,  FI-4-00 du 9 mai 2000.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib15"></a><a id="bkmbib15"></a>[15]  Queinnec C. Giroire H., « Pages dynamiques par filtrage : Mise en oeuvre sur un cédérom à but pédagogique », In Environnements Interactifs d'Apprentissage avec l'Ordinateur, EIAO2001, pp. 190-191, Hermès.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib16"></a><a id="bkmbib16"></a>[16] Réty J.-H., « Spécification de structures de liens hypertextuels adaptatives », in H2PTM’01, Hermès, 2001.  </p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib17"></a><a id="bkmbib17"></a>[17] Talhi S., M. Djoudi and M. Batouche. « Authoring Groupware for Intelligent Tutoring Systems », Information Technology Journal (ITJ), 5: 860-867. 2006.</p>
 
                <p class="bibliographie" dir="ltr"><a href="javascript:parent.history.go(-1);"><img src="./images/flechehaut.gif"></a>&nbsp;<a id="bib18"></a><a id="bkmbib18"></a>[18] Tazi S., Altawki Y., « Création de documents virtuels,  Cas des supports de cours », Workshop sur les Documents Virtuels Personnalisables,  Journées IHM’99, Montpellier, 1999.</p>
 
              </div>
 

Version du 7 mai 2012 à 09:18

Création dynamique de documents hypermédias adaptatifs


 
 


 
Titre
L’ACCES MULTILINGUE A L’INFORMATION SCIENTIFIQUE ET TECHNOLOGIQUE : LIMITATIONS DES MOTEURS DE RECHERCHE EN LANGUE ARABE.
Auteurs
Amel Behaz et Mahieddine Djoudi.
Algérieamelbehaz@hotmail.com
Francemahieddine.djoudi@univ-poitiers.fr
Affiliation
Amel Behaz, Faculté des Sciences, Université de Batna, Mahieddine Djoudi, Laboratoire SIC et Equipe IRMA. UFR Sciences SP2MI, Université de Poitiers Teleport 2.
Mots-clés
hypermédia adaptatif dynamique ; Ingénierie des connaissances ; web sémantique ; ontologie pédagogique ; modèle apprenant.

.Résumé : Les hypermédias adaptatifs dynamiques pour l’enseignement sont particulièrement caractérisés par le fait d’offrir un hypermédia virtuel. Le système dans ce cas n’est pas constitué de pages et de liens prédéfinis. Ces derniers sont construits dynamiquement et doivent adapter leur formation en fonction des règles pédagogiques et des réactions des apprenants. Les travaux présentés dans notre article s'inscrivent dans ce contexte. Nous décrivons le document hypermédia pédagogique, ses caractéristiques et structures. Nous présentons notre approche de modélisation. Sur la base de ce modèle, nous présentons l’environnement numérique de travail MEDYNA de type hypermédia adaptatif dynamique conçu pour la rédaction et la génération dynamique des contenus adaptés. |titre=English description

  |contenu=
Abstract 
In the hypermedia systems the reinforcement of the learner interest requires the production, edition and diffusion of various type of teaching documents (courses, exercises, etc). The aim of our work, is the elaboration of a model of documents and teaching activities. This model describes parameters and functionalities to integrate in pedagogical contexts witch supports different activities. Based on this model, we conceived and carried out a dynamic adaptive hypermedia environment called MEDYNA, witch helps us to draft documents for e-learning. The system takes into account parameters and elements of the proposed model. It allows the dynamic generation of adaptive context to the learner. We exploited the XML technology for the implementation of our system.

}}