CIDE (2009) Buckland : Différence entre versions

De CIDE
imported>Abdelhakim Aidene
imported>Abdelhakim Aidene
Ligne 56 : Ligne 56 :
 
===Ouvrages de référence===
 
===Ouvrages de référence===
 
Pendant des siècles, on a développé plusieurs genres d’ouvrages de référence, par exemples, des bibliographies et des catalogues de documents, les dictionnaires biographiques, les cartes et dictionnaires géographiques, les histoires et chronologies d’événements, les encyclopédies et les dictionnaires. Par conséquent, la salle de bibliographies d’une bibliothèque constitue un milieu admirable, plein de ressources dignes de confiance pour s’instruire sur n’import quel domaine, y compris le patrimoine.
 
Pendant des siècles, on a développé plusieurs genres d’ouvrages de référence, par exemples, des bibliographies et des catalogues de documents, les dictionnaires biographiques, les cartes et dictionnaires géographiques, les histoires et chronologies d’événements, les encyclopédies et les dictionnaires. Par conséquent, la salle de bibliographies d’une bibliothèque constitue un milieu admirable, plein de ressources dignes de confiance pour s’instruire sur n’import quel domaine, y compris le patrimoine.
C’est la même Suzanne Briet qui, en 1934, a fait naître à la Bibliothèque Nationale la Salle de Catalogues et Bibliographies. Elle a sélectionnés les ouvrages de références les plus utiles, les a retirés des rayons sans libre accès, et les a rassemblés dans une salle avec libre accès bien adaptée  pour les lecteurs [{{CIDE lien citation|10}}]. Malheureusement, le service si éducatif d’une collection d’ouvrages de référence d’une bibliothèque n’existe guère sur le Web. Nous avons besoin d’un tel service [11].
+
C’est la même Suzanne Briet qui, en 1934, a fait naître à la Bibliothèque Nationale la Salle de Catalogues et Bibliographies. Elle a sélectionnés les ouvrages de références les plus utiles, les a retirés des rayons sans libre accès, et les a rassemblés dans une salle avec libre accès bien adaptée  pour les lecteurs [{{CIDE lien citation|10}}]. Malheureusement, le service si éducatif d’une collection d’ouvrages de référence d’une bibliothèque n’existe guère sur le Web. Nous avons besoin d’un tel service [{{CIDE lien citation|11}}].
Notons qu’une version numérique d’un ouvrage imprimé ne suffit pas. L’adoption de technologies numériques implique deux étapes. D’abord  on utilise des techniques numériques pour obtenir les mêmes résultats de manière plus efficace ; ensuite les capacités du logiciel sont exploitées à fin de développer de nouveaux services plus utiles. Considérons un dictionnaire géographique de l’Irlande, le Onomasticon Goedelicum par Edmund Hogan [12] qui a indexé les noms géographiques mentionnés dans plusieurs documents anciens (Fig 1). Cet œuvre essentielle, parue en 1910, symbolise les ressources imprimées : le texte est très abrégé et peu commode. Les exemplaires sont assez rares mêmes dans les bibliothèques. Une version numérisée du texte imprimé se trouve sure le Web <ref>The Locus project : < http://www.ucc.ie/locus/></ref>.
+
Notons qu’une version numérique d’un ouvrage imprimé ne suffit pas. L’adoption de technologies numériques implique deux étapes. D’abord  on utilise des techniques numériques pour obtenir les mêmes résultats de manière plus efficace ; ensuite les capacités du logiciel sont exploitées à fin de développer de nouveaux services plus utiles. Considérons un dictionnaire géographique de l’Irlande, le Onomasticon Goedelicum par Edmund Hogan [{{CIDE lien citation|12}}] qui a indexé les noms géographiques mentionnés dans plusieurs documents anciens (Fig 1). Cet œuvre essentielle, parue en 1910, symbolise les ressources imprimées : le texte est très abrégé et peu commode. Les exemplaires sont assez rares mêmes dans les bibliothèques. Une version numérisée du texte imprimé se trouve sure le Web <ref>The Locus project : < http://www.ucc.ie/locus/></ref>.
  
 
  [[Fichier:CIDE (2009) Buckland fig 1.gif|center|400px|thumb|Figure 1 : Page typique de l’Onomasticon Goedelicum par Edmund Hogan]]
 
  [[Fichier:CIDE (2009) Buckland fig 1.gif|center|400px|thumb|Figure 1 : Page typique de l’Onomasticon Goedelicum par Edmund Hogan]]
Ligne 67 : Ligne 67 :
 
   
 
   
  
3.2 Contexte et vocabulaire
+
===Contexte et vocabulaire===
Un vocabulaire évolue au sein d'une communauté et d'un domaine discursif. Chaque contexte culturel ou scientifique développe sa terminologie spécialisée, son propre dialecte. Donc pour s’instruire sur n’import quel contexte il faut employer la terminologie spécialisée du domaine [15].
+
Un vocabulaire évolue au sein d'une communauté et d'un domaine discursif. Chaque contexte culturel ou scientifique développe sa terminologie spécialisée, son propre dialecte. Donc pour s’instruire sur n’import quel contexte il faut employer la terminologie spécialisée du domaine [{{CIDE lien citation|15}}].
 
De plus, dans les systèmes d'indexation les termes sont très souvent des adaptions plus ou moins artificielles de la langue courante (par  exemple:
 
De plus, dans les systèmes d'indexation les termes sont très souvent des adaptions plus ou moins artificielles de la langue courante (par  exemple:
 
« God -- Knowableness -- History of Doctrines -- Early Church, ca. 30- 600 »)  ou  alors  une  notation  artificielle  est  employée  (par    exemple
 
« God -- Knowableness -- History of Doctrines -- Early Church, ca. 30- 600 »)  ou  alors  une  notation  artificielle  est  employée  (par    exemple
 
« 330 » signifie « Sciences Economiques » dans la Classification Décimale de Dewey). Ce sont des systèmes pour coder le savoir (KOS). On a reconnu depuis longtemps que les systèmes d'indexation sont des langues.    On    parle    aujourd'hui    de « métadonnées »,    mais    avant
 
« 330 » signifie « Sciences Economiques » dans la Classification Décimale de Dewey). Ce sont des systèmes pour coder le savoir (KOS). On a reconnu depuis longtemps que les systèmes d'indexation sont des langues.    On    parle    aujourd'hui    de « métadonnées »,    mais    avant
« métadonnées » on parlait de « langages documentaires », « langages d'indexation », ou bien « métalangages » (c.f. Maurice Coyaud [16]).
+
« métadonnées » on parlait de « langages documentaires », « langages d'indexation », ou bien « métalangages » (c.f. Maurice Coyaud [{{CIDE lien citation|16}}]).
  
 
==Conditions requises==
 
==Conditions requises==
Ligne 83 : Ligne 83 :
  
 
===Service recommandeur de termes de recherche===
 
===Service recommandeur de termes de recherche===
Tout système de recherche parcourt de multiples vocabulaires [17].  Même quand un texte non-édité est parcouru avec une requête simple, au moins deux vocabulaires son présents :
+
Tout système de recherche parcourt de multiples vocabulaires [{{CIDE lien citation|17}}].  Même quand un texte non-édité est parcouru avec une requête simple, au moins deux vocabulaires son présents :
 
#Le vocabulaire de l'auteur du document, ou bien les vocabulaires de plusieurs auteurs; et
 
#Le vocabulaire de l'auteur du document, ou bien les vocabulaires de plusieurs auteurs; et
 
#Le vocabulaire du chercheur.
 
#Le vocabulaire du chercheur.
Ligne 92 : Ligne 92 :
 
Il y a toujours des vocabulaires multiples en jeu et cette multiplicité est une cause fréquente d’erreurs. Un chercheur peut employer le terme A et un auteur a employé le terme B, même s’ils voulaient indiquer le même signifiant -- des synonymes. Cependant, il est possible que tous les deux employaient le terme A pour indiquer deux sens différents -- des homographes.
 
Il y a toujours des vocabulaires multiples en jeu et cette multiplicité est une cause fréquente d’erreurs. Un chercheur peut employer le terme A et un auteur a employé le terme B, même s’ils voulaient indiquer le même signifiant -- des synonymes. Cependant, il est possible que tous les deux employaient le terme A pour indiquer deux sens différents -- des homographes.
 
Les vocabulaires intermédiaires (que ce soit celui du documentaliste, d’une requête formulée, ou la structure de renvois) normalisent l'usage de termes afin de rectifier des discordances. Les termes d’indexation du documentaliste rectifient le titre donné par l'auteur en représentant le sujet du document à travers un vocabulaire standardisé. Les chercheurs expérimentés savent comment modifier leurs requêtes ou celles des autres d'une façon que le système y réponde utilement.
 
Les vocabulaires intermédiaires (que ce soit celui du documentaliste, d’une requête formulée, ou la structure de renvois) normalisent l'usage de termes afin de rectifier des discordances. Les termes d’indexation du documentaliste rectifient le titre donné par l'auteur en représentant le sujet du document à travers un vocabulaire standardisé. Les chercheurs expérimentés savent comment modifier leurs requêtes ou celles des autres d'une façon que le système y réponde utilement.
Il y a autant de re-représentations que de transitions d'un vocabulaire à un autre. Chacune de ces re-représentations présente une opportunité de rectifier les dissonances entre chercheur et document, mais aussi la possibilité de nouvelles dissonances. Un bon intermédiaire de recherche (humain ou informatisé) sait adapter sa terminologie au vocabulaire du système. L’accès efficace aux sources spécialisées exige des services recommandeurs de termes de recherche [18].
+
Il y a autant de re-représentations que de transitions d'un vocabulaire à un autre. Chacune de ces re-représentations présente une opportunité de rectifier les dissonances entre chercheur et document, mais aussi la possibilité de nouvelles dissonances. Un bon intermédiaire de recherche (humain ou informatisé) sait adapter sa terminologie au vocabulaire du système. L’accès efficace aux sources spécialisées exige des services recommandeurs de termes de recherche [{{CIDE lien citation|18}}].
Les bases de données ont un seul index créé pour la base entière même si celle-ci couvre plusieurs domaines discursifs. A cause de cette multiplicité, on voudrait trouver autant d’indexes que de communautés d’utilisateurs [19].
+
Les bases de données ont un seul index créé pour la base entière même si celle-ci couvre plusieurs domaines discursifs. A cause de cette multiplicité, on voudrait trouver autant d’indexes que de communautés d’utilisateurs [{{CIDE lien citation|19}}].
 
===Extrêmement convenable===
 
===Extrêmement convenable===
Les éducateurs et les bibliothécaires se plaignent que les services les plus faciles,  surtout  Google  et  le  Wikipédia,  sont  les  services  les       plus
+
Les éducateurs et les bibliothécaires se plaignent que les services les plus faciles,  surtout  Google  et  le  Wikipédia,  sont  les  services  les plus fréquemment choisi au lieu des ressources les plus dignes de confiance. La solution est évidente: Il nous faut construire de services aussi convenables que Google et le Wikipédia et aussi fiables que les ouvrages de référence imprimés. C’est une question d’art, de génie documentaire.
 
 
 
fréquemment choisi au lieu des ressources les plus dignes de confiance. La solution est évidente: Il nous faut construire de services aussi convenables que Google et le Wikipédia et aussi fiables que les ouvrages de référence imprimés. C’est une question d’art, de génie documentaire.
 
  
 
==Un projet de documentation patrimoniale==
 
==Un projet de documentation patrimoniale==
 
Depuis quelques années une équipe à l’Université de Californie, Berkeley, travaille sur les techniques nécessaires pour l’exploitation avec la moindre difficulté les meilleures ressources disponibles à travers l’internet [20]. Nous voulons construire trois outils :
 
Depuis quelques années une équipe à l’Université de Californie, Berkeley, travaille sur les techniques nécessaires pour l’exploitation avec la moindre difficulté les meilleures ressources disponibles à travers l’internet [20]. Nous voulons construire trois outils :
1. Le « Context Finder » trouve le contexte de toute chose. Si on rencontre quelque chose d’intéressant, on reçoit un éclaircissement d’une ressource de confiance avec deux « clics ». Le lecteur clique sur un nom dans le texte en ligne; l’ordinateur pose la question si c’est le nom d’une personne ou d’un endroit et répond par une liste brève de ressources recommandées adaptée au texte et, en principe, à la compréhension du lecteur. Un deuxième clic sélectionne la ressource et un lien dynamique lance un recherche automatique et présente le résultat.
+
#Le « Context Finder » trouve le contexte de toute chose. Si on rencontre quelque chose d’intéressant, on reçoit un éclaircissement d’une ressource de confiance avec deux « clics ». Le lecteur clique sur un nom dans le texte en ligne; l’ordinateur pose la question si c’est le nom d’une personne ou d’un endroit et répond par une liste brève de ressources recommandées adaptée au texte et, en principe, à la compréhension du lecteur. Un deuxième clic sélectionne la ressource et un lien dynamique lance un recherche automatique et présente le résultat.
2. Le « Context Builder » construit le contexte trouvé. Il insère les détails de la recherche, de la ressource exploitée, et de l’explication dans le texte même en format XML. Ainsi ces données sont prêtes pour la lecture prochaine et le lecteur prochain.
+
#Le « Context Builder » construit le contexte trouvé. Il insère les détails de la recherche, de la ressource exploitée, et de l’explication dans le texte même en format XML. Ainsi ces données sont prêtes pour la lecture prochaine et le lecteur prochain.
3. Le « Context Provider » récupère les liens en tout sens. Le « Context builder » permet l’accumulation de liens dynamiques à sens unique entre un texte et les ouvrages explicatifs. Ces liens peuvent être insérés aussi en sens inverse à fin d’enrichir les ouvrages explicatifs avec les liens aux textes  qui  mentionnent  ces  mots  comme  indiqué  dans  l’exemple   du
+
#Le « Context Provider » récupère les liens en tout sens. Le « Context builder » permet l’accumulation de liens dynamiques à sens unique entre un texte et les ouvrages explicatifs. Ces liens peuvent être insérés aussi en sens inverse à fin d’enrichir les ouvrages explicatifs avec les liens aux textes  qui  mentionnent  ces  mots  comme  indiqué  dans  l’exemple du « Hogan ».
« Hogan ».
 
  
 
==Un prototype d’interface==
 
==Un prototype d’interface==
 
Notre premier prototype d’interface est montrée dans les figures 2 bis 4. Figure 2 : Un étudiant lit en ligne le page 341 d’un livre numérisé de l’Open-Access Text Archive de l’Internet Archive <ref>Internet Archive Open-Access Text Archive : <http://www.archive.org/details/texts></ref> : The Story of the Irish Nation par Francis Hackett (New York: The Century Co., 1922). Le logiciel de l’interface discerne automatiquement les noms propres qui apparaissent dans cette page : Edward Martyn, George Moore, William Butler Yeats, etc., et génère le liste à droite. Le lecteur qui veut  s’informer sur Yeats met le curseur sur ce nom soit dans la liste soit dans la page et « Yeats » s’allume.
 
Notre premier prototype d’interface est montrée dans les figures 2 bis 4. Figure 2 : Un étudiant lit en ligne le page 341 d’un livre numérisé de l’Open-Access Text Archive de l’Internet Archive <ref>Internet Archive Open-Access Text Archive : <http://www.archive.org/details/texts></ref> : The Story of the Irish Nation par Francis Hackett (New York: The Century Co., 1922). Le logiciel de l’interface discerne automatiquement les noms propres qui apparaissent dans cette page : Edward Martyn, George Moore, William Butler Yeats, etc., et génère le liste à droite. Le lecteur qui veut  s’informer sur Yeats met le curseur sur ce nom soit dans la liste soit dans la page et « Yeats » s’allume.
  
 
 
  
 
  [[Fichier:CIDE (2009) Buckland fig 2.png|center|400px|thumb|Figure 2 : L’interface « Context Finder » : Le lecteur met le curseur sur le nom William Butler Yeats]]
 
  [[Fichier:CIDE (2009) Buckland fig 2.png|center|400px|thumb|Figure 2 : L’interface « Context Finder » : Le lecteur met le curseur sur le nom William Butler Yeats]]
Ligne 143 : Ligne 137 :
 
==La documentation du patrimoine irlandais==
 
==La documentation du patrimoine irlandais==
 
Les études irlandaises n’existent guère comme domaine scientifique. Il y a des études nombreuses touchant l’histoire de l’Irlande, l’archéologie, le géographie humaine, la langue gaélique irlandaise, la littérature (en anglais et en gaélique), les beaux arts, la musique, la politique, et beaucoup d’autres sujets, mais l’édition de ces études est fragmentaire et dispersée. Surtout, les périodiques des sociétés régionales des 18e, 19e et 20e siècles contiennent des articles toujours d’intérêt. La plupart de ces périodiques manquent d’indexation et la bibliographie de ces matières est inachevée. Elles sont rarement disponibles dans les fonds de bibliothèques, et on ne les trouve guère en dehors d’Irlande. Maintes ressources numérisées existent, mais les normes et les protocoles qui assurent l’accès convenable sont peu adoptés. De même ceux qui font des recherches sur des sujets relatifs à l’Irelande sont dispersés dans de multiples établissements universitaires. Ces conditions sont caractéristiques de la documentation des patrimoines.
 
Les études irlandaises n’existent guère comme domaine scientifique. Il y a des études nombreuses touchant l’histoire de l’Irlande, l’archéologie, le géographie humaine, la langue gaélique irlandaise, la littérature (en anglais et en gaélique), les beaux arts, la musique, la politique, et beaucoup d’autres sujets, mais l’édition de ces études est fragmentaire et dispersée. Surtout, les périodiques des sociétés régionales des 18e, 19e et 20e siècles contiennent des articles toujours d’intérêt. La plupart de ces périodiques manquent d’indexation et la bibliographie de ces matières est inachevée. Elles sont rarement disponibles dans les fonds de bibliothèques, et on ne les trouve guère en dehors d’Irlande. Maintes ressources numérisées existent, mais les normes et les protocoles qui assurent l’accès convenable sont peu adoptés. De même ceux qui font des recherches sur des sujets relatifs à l’Irelande sont dispersés dans de multiples établissements universitaires. Ces conditions sont caractéristiques de la documentation des patrimoines.
En 2007-2009 le Centre for Data Digitisation and Analysis a numérisé quatre-vingts périodiques irlandais (environ 600,000 pages) et cette collection numérisée constitue la « Ireland Collection » de JSTOR <ref>http://www.jstor. org/templates/jsp/_jstor/templates/info/about/archives/aboutCollections/aboutIreland.pdf</ref>  [21]. Nous examinons comment lier les détails de ces articles (et autres textes du patrimoine irlandais) aux ouvrages de référence. Quoique notre projet traite de l’Irlande, les techniques qui sont efficaces dans la documentation du patrimoine irlandais seront utiles pour gérer les autres ressources patrimoniales.
+
En 2007-2009 le Centre for Data Digitisation and Analysis a numérisé quatre-vingts périodiques irlandais (environ 600,000 pages) et cette collection numérisée constitue la « Ireland Collection » de JSTOR <ref>http://www.jstor. org/templates/jsp/_jstor/templates/info/about/archives/aboutCollections/aboutIreland.pdf</ref>  [{{CIDE lien citation|21}}]. Nous examinons comment lier les détails de ces articles (et autres textes du patrimoine irlandais) aux ouvrages de référence. Quoique notre projet traite de l’Irlande, les techniques qui sont efficaces dans la documentation du patrimoine irlandais seront utiles pour gérer les autres ressources patrimoniales.
  
 
==Conclusion==
 
==Conclusion==
Ligne 150 : Ligne 144 :
 
L’Université de Californie, Berkeley, a le projet de développer un tel service en trois phases. Une interface « Context finder » permet les recherches convenables dans les ressources recommandées. Un    système
 
L’Université de Californie, Berkeley, a le projet de développer un tel service en trois phases. Une interface « Context finder » permet les recherches convenables dans les ressources recommandées. Un    système
 
« Context builder » note les liens à chaque ressource explicative dans le texte du lecteur en XML. La technique « Context provider » ajoute ces liens en sens inverse de la ressource vers les textes. Ainsi un réseau explicatif s’accumule.
 
« Context builder » note les liens à chaque ressource explicative dans le texte du lecteur en XML. La technique « Context provider » ajoute ces liens en sens inverse de la ressource vers les textes. Ainsi un réseau explicatif s’accumule.
Comme toujours, les tâches sont quelque peu déléguées au logiciel. L’interface assume le rôle du bibliothécaire et doit être sensible aux demandes du lecteur, mais aussi prendre des initiatives pour arriver au but. C’est un rôle selon Briet « . . . comme le chien du chasseur – tout à fait en avant, guidé, guidant.” [22, 43]
+
Comme toujours, les tâches sont quelque peu déléguées au logiciel. L’interface assume le rôle du bibliothécaire et doit être sensible aux demandes du lecteur, mais aussi prendre des initiatives pour arriver au but. C’est un rôle selon Briet « . . . comme le chien du chasseur – tout à fait en avant, guidé, guidant.” [{{CIDE lien citation|22}}, {{CIDE lien citation|43}}]  
  
  

Version du 23 juin 2016 à 14:32

Contexte et connexions: L’Irlande et le patrimoine irlandais


 
 

 
titre
Contexte et connexions: L’Irlande et le patrimoine irlandais
auteurs
Michael Buckland(1), Ryan Shaw(1) et Daniel Melia(2).
Affiliations
(1):School of Information, University of California, Berkeley,Californie, États-Unis ,
(2):Celtic Studies Program, University of California, Berkeley,Californie, États-Unis ,
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Buckland.pdf
Mots-clés 
Documents, Irlande, meta-données, patrimoine, recherche, vocabulaire.
Keywords
Documents, Ireland, metadata, cultural heritage, search, vocabulary.
Résumé
Le savoir nécessite qu’on s’informe du contexte et de ses connexions. Comment faciliter la compréhension du contexte historique et culturel d’un patrimoine ? A l’Université de Californie, Berkeley, l’Electronic Cultural Atlas Initiative et la School of Information développent un environnement en ligne qui reproduit le milieu éducatif d’une collection de référence dans une bibliothèque. Une interface « Context finder » facilite les recherches dans les sources recommandées. Le système « Context builder » ajoute des liens à une source d’explication du texte en XML. La technique « Context provider » ajoute en sens inverse au texte ces liens vers la source d’explication. Ainsi un réseau explicatif s’établit.