T. Daunois 2011 Édition hypertexte : Différence entre versions

De Wicri Incubateur
imported>Thierry Daunois
imported>Thierry Daunois
Ligne 1 : Ligne 1 :
Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus. Il s'agit donc d'une ébauche, en cours de chantier.
+
Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus, les ''[[Chrestien de Lihus 1804 Principes d’agriculture et d’économie|Principes d'agriculture et d'économie]]'', publié en 1804. Il s'agit donc d'une ébauche, en cours de chantier.
  
==Introduction==
+
==Bribes d'introduction==
  
Longtemps, le travail de nombreux chercheurs a consisté à travailler sur des documents physiques, et, dans de nombreuses disciplines, sur des ouvrages accessibles essentiellement dans des bibliothèques. Ces dernières étaient - et sont encore largement - un lieu de travail privilégié des chercheurs de nombreuses disciplines.
+
Interpelés par un chercheur sur sa difficulté à trouver des versions exploitable de certains documents (livres et manuscrits plus ou moins anciens, numérisés mais accessibles uniquement sous la forme de pdf, parfois avec un OCR de qualité variable...) et sur le fait qu'il disposait, sur son poste de travail, d'extraits, de chapitre, et, pour certains de livres entiers qu'il avait du, pour pouvoir les utiliser, retaper entièrement dans son propre traitement de texte, nous avons décidé, initialement, de tester la possibilité de proposer à ces chercheurs d'éviter que leur travail de re-saisie ne soit pas perdu. En effet, par extrapolation, il n'est pas difficile d'imaginer la masse disponible en la matière, accumulée au fil de la carrière des uns et des autres, et qui est, pour l'essentiel, perdue à la fin de celle-ci.
  
Depuis l'arrivée d'Internet, chacun sent, plus ou moins confusément, que l'activité de recherche est en évolution. L'exercice de la bibliographie s'adapte aux conditions nouvelles. Un nombre croissant de ressources sont désormais disponibles en ligne.
+
L'idée initiale a donc été de tester, sur le réseau de wikis Wicri, la mise en ligne par des volontaires de ressources éditoriales ayant déjà fait l'objet du travail ingrat de re-saisie en format de type word.
  
Dans un premier temps - et il s'agit là d'un mécanisme que l'on observe à l'occasion de tous les bouleversements dans les pratiques -, cela n'a provoqué aucun changement de méthode : au lieu de consulter le document dans une salle de bibliothèque, armés de leur papier et de leur crayon, les chercheurs se sont mis à pratiquer de même, mais directement sur leur poste de travail.
+
À l'occasion de cet exercice - qui s'inscrit dans une démarche d'information scientifique et technique (IST) et d'édition de "service public" -, nous avons eu l'intuition, puis la conviction croissante qu'il était possible d'aller plus loin et de dépasser ce cadre initial, pour proposer un enrichissement des textes, notamment au travers d'annotations collectives, mais également, dans une optique de recherche, une palette d'outils permettant l'exploitation et la capitalisation de textes : analyse des données textuelles, paléographie, codicologie, philologie... Une première recherche sur les expériences existantes en la matière nous donne à penser que nous avons entre les mains une technologie pouvant permettre, rapidement et dans des conditions de coût très raisonnables, d'offrir une alternative intéressante.
  
Interpelés par un chercheur, voilà quelques mois, sur l'accessibilité de documents en ligne, nous avons décidé d'expérimenter la mise en ligne de ressources textuelles dans le cadre du réseau de wikis sémantiques Wicri. En effet, la question qui nous a été posée alors était de savoir s'il était possible de valoriser le travail des chercheurs qui, dans le cadre de leurs travaux, ont été amenés à retranscrire sur leur poste de travail des paragraphes, des chapitres, parfois des ouvrages entiers dont ils ne pouvaient trouver le texte sur internet.
+
Cet article s'attachera donc à présenter, dans un premier temps, les projets d'édition qui nous semblent les plus riches, leurs objectifs et leurs limites. Puis un retour d'expérience concernant notre expérimentation, depuis sa phase initiale jusque dans ses développements. Enfin nous tenterons de tracer les perspectives qu'ouvre le travail effectué dans le cadre du réseau Wicri.
  
Si l'on regarde la façon dont de nombreux textes sont accessibles sur Internet, force est de constater que la plupart sont disponibles, à la suite d'une numérisation plus ou moins fine, en pdf. Y compris lorsque l'on utilise un logiciel de reconnaissance optique de caractères (OCR), le résultat est classique : un texte brut qui nécessite un retravail en profondeur (voir les extraits du ''Théâtre d'agriculture et mesnage des champs'' d'Olivier de Serres pris sur internet.org et sur google.books).
+
==Plan==
  
==Plan==
+
===Présentation du réseau Wicri - Contexte - Enjeux de l'e-science===
 +
 
 +
===Les projets d'édition numérique===
 +
 
 +
===L'expérimentation sur les ''Principes d'agriculture et d'économie'' de Chrestien de Lihus===
 +
 
 +
===Perspectives : le réseau Wicri et l'édition numérique de ressources textuelles===

Version du 10 juin 2011 à 10:56

Les éléments qui suivent constituent le travail préparatoire à la rédaction d'un article décrivant l'expérience menée sur l'ouvrage de Chrestien de Lihus, les Principes d'agriculture et d'économie, publié en 1804. Il s'agit donc d'une ébauche, en cours de chantier.

Bribes d'introduction

Interpelés par un chercheur sur sa difficulté à trouver des versions exploitable de certains documents (livres et manuscrits plus ou moins anciens, numérisés mais accessibles uniquement sous la forme de pdf, parfois avec un OCR de qualité variable...) et sur le fait qu'il disposait, sur son poste de travail, d'extraits, de chapitre, et, pour certains de livres entiers qu'il avait du, pour pouvoir les utiliser, retaper entièrement dans son propre traitement de texte, nous avons décidé, initialement, de tester la possibilité de proposer à ces chercheurs d'éviter que leur travail de re-saisie ne soit pas perdu. En effet, par extrapolation, il n'est pas difficile d'imaginer la masse disponible en la matière, accumulée au fil de la carrière des uns et des autres, et qui est, pour l'essentiel, perdue à la fin de celle-ci.

L'idée initiale a donc été de tester, sur le réseau de wikis Wicri, la mise en ligne par des volontaires de ressources éditoriales ayant déjà fait l'objet du travail ingrat de re-saisie en format de type word.

À l'occasion de cet exercice - qui s'inscrit dans une démarche d'information scientifique et technique (IST) et d'édition de "service public" -, nous avons eu l'intuition, puis la conviction croissante qu'il était possible d'aller plus loin et de dépasser ce cadre initial, pour proposer un enrichissement des textes, notamment au travers d'annotations collectives, mais également, dans une optique de recherche, une palette d'outils permettant l'exploitation et la capitalisation de textes : analyse des données textuelles, paléographie, codicologie, philologie... Une première recherche sur les expériences existantes en la matière nous donne à penser que nous avons entre les mains une technologie pouvant permettre, rapidement et dans des conditions de coût très raisonnables, d'offrir une alternative intéressante.

Cet article s'attachera donc à présenter, dans un premier temps, les projets d'édition qui nous semblent les plus riches, leurs objectifs et leurs limites. Puis un retour d'expérience concernant notre expérimentation, depuis sa phase initiale jusque dans ses développements. Enfin nous tenterons de tracer les perspectives qu'ouvre le travail effectué dans le cadre du réseau Wicri.

Plan

Présentation du réseau Wicri - Contexte - Enjeux de l'e-science

Les projets d'édition numérique

L'expérimentation sur les Principes d'agriculture et d'économie de Chrestien de Lihus

Perspectives : le réseau Wicri et l'édition numérique de ressources textuelles