T. Daunois 2011 Édition hypertexte : Différence entre versions

De Wicri Incubateur
imported>Thierry Daunois
imported>Thierry Daunois
 
(9 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus. Il s'agit donc d'une ébauche, en cours de chantier.
+
'''Ce travail a été déplacé, et s'effectue désormais sur le wiki [[artist.priv:Édition hypertexte 2011 Thierry Daunois|Artist privé]]''' ''(accès restreint aux personnes enregistrées)''.
  
==Introduction==
 
  
Longtemps, le travail de nombreux chercheurs a consisté à travailler sur des documents physiques, et, dans de nombreuses disciplines, sur des ouvrages accessibles essentiellement dans des bibliothèques. Ces dernières étaient - et sont encore largement - un lieu de travail privilégié des chercheurs de nombreuses disciplines.
+
Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus, les ''[[Chrestien de Lihus 1804 Principes d’agriculture et d’économie|Principes d'agriculture et d'économie]]'', publié en 1804. Il s'agit donc d'une ébauche, en cours de chantier.
  
Depuis l'arrivée d'Internet, chacun sent, plus ou moins confusément, que l'activité de recherche est en évolution. L'exercice de la bibliographie s'adapte aux conditions nouvelles. Un nombre croissant de ressources sont désormais disponibles en ligne.
+
==Bribes d'introduction==
  
Dans un premier temps - et il s'agit là d'un mécanisme que l'on observe à l'occasion de tous les bouleversements dans les pratiques -, cela n'a provoqué aucun changement de méthode : au lieu de consulter le document dans une salle de bibliothèque, armés de leur papier et de leur crayon, les chercheurs se sont mis à pratiquer de même, mais directement sur leur poste de travail.
+
Interpelés par un chercheur sur sa difficulté à trouver des versions exploitable de certains documents (livres et manuscrits plus ou moins anciens, numérisés mais accessibles uniquement sous la forme de pdf, parfois avec un OCR de qualité variable...) et sur le fait qu'il disposait, sur son poste de travail, d'extraits, de chapitre, et, pour certains de livres entiers qu'il avait du, pour pouvoir les utiliser, retaper entièrement dans son propre traitement de texte, nous avons décidé, initialement, de tester la possibilité de proposer à ces chercheurs d'éviter que leur travail de re-saisie ne soit pas perdu. En effet, par extrapolation, il n'est pas difficile d'imaginer la masse disponible en la matière, accumulée au fil de la carrière des uns et des autres, et qui est, pour l'essentiel, perdue à la fin de celle-ci.
  
Interpelés par un chercheur, voilà quelques mois, sur l'accessibilité de documents en ligne, nous avons décidé d'expérimenter la mise en ligne de ressources textuelles dans le cadre du réseau de wikis sémantiques Wicri. En effet, la question qui nous a été posée alors était de savoir s'il était possible de valoriser le travail des chercheurs qui, dans le cadre de leurs travaux, ont été amenés à retranscrire sur leur poste de travail des paragraphes, des chapitres, parfois des ouvrages entiers dont ils ne pouvaient trouver le texte sur internet.
+
L'idée initiale a donc été de tester, sur le réseau de wikis Wicri, la mise en ligne par des volontaires de ressources éditoriales ayant déjà fait l'objet du travail ingrat de re-saisie en format de type word.
  
Si l'on regarde la façon dont de nombreux textes sont accessibles sur Internet, force est de constater que la plupart sont disponibles, à la suite d'une numérisation plus ou moins fine, en pdf. Y compris lorsque l'on utilise un logiciel de reconnaissance optique de caractères (OCR), le résultat est classique : un texte brut qui nécessite un retravail en profondeur (voir les extraits du ''Théâtre d'agriculture et mesnage des champs'' d'Olivier de Serres pris sur internet.org et sur google.books).
+
À l'occasion de cet exercice - qui s'inscrit dans une démarche d'information scientifique et technique (IST) et d'édition de "service public" -, nous avons eu l'intuition, puis la conviction croissante qu'il était possible d'aller plus loin et de dépasser ce cadre initial, pour proposer un enrichissement des textes, notamment au travers d'annotations collectives, mais également, dans une optique de recherche, une palette d'outils permettant l'exploitation et la capitalisation de textes : enrichissement hypertexte, analyse des données textuelles, paléographie, codicologie, philologie... Une première recherche sur les expériences existantes en la matière nous donne à penser que nous avons entre les mains une technologie pouvant permettre, rapidement et dans des conditions de coût très raisonnables, d'offrir une alternative intéressante.
 +
 
 +
Cet article s'attachera donc à présenter, dans un premier temps, les projets d'édition hypertexte qui nous semblent les plus riches, leurs objectifs et leurs limites. Puis nous proposerons un retour d'expérience concernant notre expérimentation, depuis sa phase initiale jusque dans ses développements les plus récents. Enfin nous tenterons de tracer les perspectives qu'ouvre le travail effectué dans le cadre du réseau Wicri, autant dans une optique d'IST que de culture scientifique et technique, et à destination de différents publics : grand public, enseignement, recherche.
 +
 
 +
''"Le livre, comme livre, appartient à l'auteur, mais comme pensée, il appartient, le mot n'est pas trop vaste, au genre humain. Toutes les intelligences y ont droit. Si l'un des deux droits, le droit de l'écrivain et le droit de l'esprit humain, devait être sacrifié, ce serait, certes, le droit de l'écrivain, car l'intérêt public est notre préoccupation unique, et tous, je le déclare, doivent passer avant nous."''
 +
 
 +
Victor Hugo, [http://fr.wikisource.org/wiki/Discours_d%27ouverture_du_Congr%C3%A8s_litt%C3%A9raire_international Discours d'introduction du Congrès littéraire international de 1878] (paragraphe 14).
  
 
==Plan==
 
==Plan==
 +
 +
===Présentation du réseau Wicri - Contexte - Enjeux de l'e-science===
 +
 +
===Les projets d'édition hypertexte===
 +
 +
===L'expérimentation sur les ''Principes d'agriculture et d'économie'' de Chrestien de Lihus===
 +
 +
===Perspectives : le réseau Wicri et l'édition hypertexte de ressources textuelles===

Version actuelle datée du 16 juin 2011 à 10:46

Ce travail a été déplacé, et s'effectue désormais sur le wiki Artist privé (accès restreint aux personnes enregistrées).


Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus, les Principes d'agriculture et d'économie, publié en 1804. Il s'agit donc d'une ébauche, en cours de chantier.

Bribes d'introduction

Interpelés par un chercheur sur sa difficulté à trouver des versions exploitable de certains documents (livres et manuscrits plus ou moins anciens, numérisés mais accessibles uniquement sous la forme de pdf, parfois avec un OCR de qualité variable...) et sur le fait qu'il disposait, sur son poste de travail, d'extraits, de chapitre, et, pour certains de livres entiers qu'il avait du, pour pouvoir les utiliser, retaper entièrement dans son propre traitement de texte, nous avons décidé, initialement, de tester la possibilité de proposer à ces chercheurs d'éviter que leur travail de re-saisie ne soit pas perdu. En effet, par extrapolation, il n'est pas difficile d'imaginer la masse disponible en la matière, accumulée au fil de la carrière des uns et des autres, et qui est, pour l'essentiel, perdue à la fin de celle-ci.

L'idée initiale a donc été de tester, sur le réseau de wikis Wicri, la mise en ligne par des volontaires de ressources éditoriales ayant déjà fait l'objet du travail ingrat de re-saisie en format de type word.

À l'occasion de cet exercice - qui s'inscrit dans une démarche d'information scientifique et technique (IST) et d'édition de "service public" -, nous avons eu l'intuition, puis la conviction croissante qu'il était possible d'aller plus loin et de dépasser ce cadre initial, pour proposer un enrichissement des textes, notamment au travers d'annotations collectives, mais également, dans une optique de recherche, une palette d'outils permettant l'exploitation et la capitalisation de textes : enrichissement hypertexte, analyse des données textuelles, paléographie, codicologie, philologie... Une première recherche sur les expériences existantes en la matière nous donne à penser que nous avons entre les mains une technologie pouvant permettre, rapidement et dans des conditions de coût très raisonnables, d'offrir une alternative intéressante.

Cet article s'attachera donc à présenter, dans un premier temps, les projets d'édition hypertexte qui nous semblent les plus riches, leurs objectifs et leurs limites. Puis nous proposerons un retour d'expérience concernant notre expérimentation, depuis sa phase initiale jusque dans ses développements les plus récents. Enfin nous tenterons de tracer les perspectives qu'ouvre le travail effectué dans le cadre du réseau Wicri, autant dans une optique d'IST que de culture scientifique et technique, et à destination de différents publics : grand public, enseignement, recherche.

"Le livre, comme livre, appartient à l'auteur, mais comme pensée, il appartient, le mot n'est pas trop vaste, au genre humain. Toutes les intelligences y ont droit. Si l'un des deux droits, le droit de l'écrivain et le droit de l'esprit humain, devait être sacrifié, ce serait, certes, le droit de l'écrivain, car l'intérêt public est notre préoccupation unique, et tous, je le déclare, doivent passer avant nous."

Victor Hugo, Discours d'introduction du Congrès littéraire international de 1878 (paragraphe 14).

Plan

Présentation du réseau Wicri - Contexte - Enjeux de l'e-science

Les projets d'édition hypertexte

L'expérimentation sur les Principes d'agriculture et d'économie de Chrestien de Lihus

Perspectives : le réseau Wicri et l'édition hypertexte de ressources textuelles