<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="fr">
	<id>https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?action=history&amp;feed=atom&amp;title=Serveur_d%27exploration_sur_l%27hypertexte_%28maquette_2012%29</id>
	<title>Serveur d'exploration sur l'hypertexte (maquette 2012) - Historique des versions</title>
	<link rel="self" type="application/atom+xml" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?action=history&amp;feed=atom&amp;title=Serveur_d%27exploration_sur_l%27hypertexte_%28maquette_2012%29"/>
	<link rel="alternate" type="text/html" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Serveur_d%27exploration_sur_l%27hypertexte_(maquette_2012)&amp;action=history"/>
	<updated>2026-05-13T21:38:00Z</updated>
	<subtitle>Historique des versions pour cette page sur le wiki</subtitle>
	<generator>MediaWiki 1.31.10</generator>
	<entry>
		<id>https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Serveur_d%27exploration_sur_l%27hypertexte_(maquette_2012)&amp;diff=3697&amp;oldid=prev</id>
		<title>imported&gt;Jacques Ducloy le 22 septembre 2015 à 09:57</title>
		<link rel="alternate" type="text/html" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Serveur_d%27exploration_sur_l%27hypertexte_(maquette_2012)&amp;diff=3697&amp;oldid=prev"/>
		<updated>2015-09-22T09:57:22Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nouvelle page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{header serveur hypertexte}}&lt;br /&gt;
{{Wicri musée&lt;br /&gt;
 |titre=Musée du wiki H&amp;lt;sup&amp;gt;2&amp;lt;/sup&amp;gt;PTM&lt;br /&gt;
 |texte=Cette page fait référence à une ancienne expérimentation.&lt;br /&gt;
&lt;br /&gt;
L'expérimentation en cours est le [[Serveur d'exploration hypertexte et hypermédia]].&lt;br /&gt;
}}&lt;br /&gt;
Cette page introduit une expérimentation en cours sur la génération automatique d'un système de navigation hypertexte à partir d'un ensemble de corpus. Cet ensemble de données est lui-même centré sur la thématique cœur de ce wiki : l'hypertexte. &lt;br /&gt;
&lt;br /&gt;
Ce type de service web vise par exemple à aider un spécialiste à situer l'activité de la communauté H&amp;lt;sup&amp;gt;2&amp;lt;/sup&amp;gt;PTM dans le contexte international de l'hypertexte.&lt;br /&gt;
&lt;br /&gt;
Cette expérimentation est également un test de faisabilité sur l'apport des wikis sémantiques pour la curation et l'exploration des données de la recherche. Le cadre de ce premier test est relativement limité : homogénéisation des noms de pays d'affiliations sur quatre corpus de données pour alimenter un serveur d'investigation. Il constitue de fait la première étape d'une réflexion sur l'évolution du réseau Wicri en relation avec le [[ISTEX (Investissements d'avenir)|projet ISTEX]].&lt;br /&gt;
&lt;br /&gt;
Une deuxième étape est en cours de développement (voir [[Serveur d'exploration sur l'hypertexte]]).&lt;br /&gt;
&lt;br /&gt;
==Les serveurs d'investigation==&lt;br /&gt;
Dans la terminologie [[Dilib]], un [[serveur d'investigation]] est un site web qui permet d'explorer un ensemble de ressources, éventuellement hétérogènes. Il s'agit en fait d'un système de recherche d'information doté d'outils infométriques qui vont offrir divers chemins de navigation. La figure ci-dessous montre une copie d'écran de visualisation des relations entre affiliations françaises et luxembourgeoises.&lt;br /&gt;
&lt;br /&gt;
[[File:Wicri SI Assoc France Luxembourg.png|500px|thumb|center|élément d'analyse d'une association ([[France]] et [[Luxembourg (pays)|Luxembourg]]) ]]&lt;br /&gt;
&lt;br /&gt;
D'un point de vue technique, un tel ensemble est réalisé par assemblage de composants de base, ce qui donne une forte flexibilité.&lt;br /&gt;
&lt;br /&gt;
Un élément important de la démarche est l'utilisation de ressources hétérogènes et de structuration variable. Par exemple, dans l'application actuelle 4 sources de données sont utilisées. Ceci implique une phase préalable de curation de données. &lt;br /&gt;
&lt;br /&gt;
[[File:Wicri Curation investigation.png|400px|center|thumb|projet de chaîne de génération]]&lt;br /&gt;
&lt;br /&gt;
La figure ci-dessus donne une première idée de l'application visée.&lt;br /&gt;
&lt;br /&gt;
Avant de servir à produire des résultats, le serveur d'investigation va déjà servir à réaliser diverses opérations de curation de données, et par exemple :&lt;br /&gt;
* homogénéisation des structures vers un format pivot (ici la TEI),&lt;br /&gt;
* homogénéisation des éléments décrivant le réseau d'acteurs depuis les notions géographiques jusqu'aux auteurs en passant par les affiliations, &lt;br /&gt;
* homogénéisation des éléments d'indexation.&lt;br /&gt;
&lt;br /&gt;
==Un premier exemple d'investigation==&lt;br /&gt;
&lt;br /&gt;
Cette application est en démarrage et se limite encore à quelques tests de faisabilité. Le point d'entrée de la dernière version est :&lt;br /&gt;
* http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/index.html&lt;br /&gt;
Cela dit, elle peut déjà être utilisée pour des analyses simples. Voici par exemple des premiers éléments sur l'hypertexte au [[Brésil]].&lt;br /&gt;
* la page [http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/DataBase/indexPays.php?key=Br%C3%A9sil pays, associée au Brésil], permet de localiser :&lt;br /&gt;
** une activité déjà significative (52 documents sur un corpus de 5000 notices).&lt;br /&gt;
** un premier ensemble d'auteurs dont [[A pour personnalité citée::Daniel Schwabe]] (qui est d'ailleurs membre des comités de programme H&amp;lt;sup&amp;gt;2&amp;lt;/sup&amp;gt;PTM.&lt;br /&gt;
* Concernant par exemple Daniel Schwabe :&lt;br /&gt;
** une [http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/DataBase/assoc.php?i1=tei.pays&amp;amp;k1=Br%C3%A9sil&amp;amp;i2=tei.aut&amp;amp;k2=Daniel%20Schwabe page « association pays - auteur »] donne une vision relative de sa présence dans le corpus,&lt;br /&gt;
** une « [http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/DataBase/indexPerson.php?key=Daniel%20Schwabe page auteur] » donne un profil de sa recherche à travers l'indexation Pascal,&lt;br /&gt;
** enfin l'exploration des notices bibliographiques permet d'accéder aux affiliations :&lt;br /&gt;
*** Par exemple la [http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/DataBase/bibRecord.php?hk=000229 notice 000229 (encore embryonnaire dans sa présentation)] donne accès à une [http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/CorpusTei/bibRecord.php?hk=000229 version plus complète dans l'espace corpus].&lt;br /&gt;
*** Sur un poste de travail, en utilisant Dilib en mode Unix, un spécialiste peut déjà regrouper les affiliations et repérer par exemple le PUC-RIO ([[Université pontificale catholique de Rio de Janeiro]]).&lt;br /&gt;
{{boîte déroulante|titre=détail de l'exemple|contenu=&lt;br /&gt;
La suite de commandes unix/Dilib :&lt;br /&gt;
&amp;lt;div&amp;gt;&lt;br /&gt;
::&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
IndexSelect -S -h Hypertext/CorpusTei/tei.aut.i -k &amp;quot;Daniel Schwabe&amp;quot;                             \&lt;br /&gt;
  | DamHfdSelect -h Hypertext/CorpusTei/biblio                                                  \&lt;br /&gt;
  | SgmlSelect -s record/TEI/teiHeader/fileDesc/titleStmt/author/affiliation/inist:fA14 -p @s1  \&lt;br /&gt;
  | SgmlFast -c sZ | SgmlIndent&lt;br /&gt;
&amp;lt;/source&amp;gt;&amp;lt;/div&amp;gt;&lt;br /&gt;
:::extrait les documents de Daniel Schwabe, d'où on sélectionne toutes les affiliations. Ceci donne :&lt;br /&gt;
&amp;lt;div&amp;gt;&lt;br /&gt;
::&amp;lt;source lang=&amp;quot;xml&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;01&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Grupo ROCA / Instituto Politécnico, Campus Regional de Nova Friburgo -Universidade Estadual do Rio de Janeiro (UERJ) -Caixa Postal 97282&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;28610-974 -Friburgo -RJ&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;02&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Departamento de Informática -Pontiffcia Universidade Católica do Rio de Janeiro (PUC-Rio) -Caixa Postal 38.097&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;22.453-900 -Rio de Janeiro -RJ&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;02&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Departamento de Informática -Pontiffcia Universidade Católica do Rio de Janeiro (PUC-Rio) -Caixa Postal 38.097&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;22.453-900 -Rio de Janeiro -RJ&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;01&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;LIFIA, Facultad de Informática, UNLP&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;La Plata&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;ARG&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;01&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;LIFIA, Facultad de Informática, UNLP&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;La Plata&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;ARG&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;04&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Departamento de Informática, PUC-Rio&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;Rio de Janeiro&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;01&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Depto de Informática, PUC-RIO, R. Marquês de Silo Vicente, 225, Gávea&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;Rio de Janeiro - RJ - 22453-900&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;inist:fA14 i1=&amp;quot;01&amp;quot;&amp;gt;&lt;br /&gt;
  &amp;lt;s1&amp;gt;Depto de Informática, PUC-RIO, R. Marquês de Silo Vicente, 225, Gávea&amp;lt;/s1&amp;gt;&lt;br /&gt;
  &amp;lt;s2&amp;gt;Rio de Janeiro - RJ - 22453-900&amp;lt;/s2&amp;gt;&lt;br /&gt;
  &amp;lt;s3&amp;gt;BRA&amp;lt;/s3&amp;gt;&lt;br /&gt;
&amp;lt;/inist:fA14&amp;gt;&lt;br /&gt;
&amp;lt;/source&amp;gt;&amp;lt;/div&amp;gt;&lt;br /&gt;
::On repère une forte fréquence du PUC-RIO. Une recherche sur Internet permet de préciser l'affiliation du PUC-RIO : [[Université pontificale catholique de Rio de Janeiro]].&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
Voir aussi :&lt;br /&gt;
* [[Serveur d'investigation sur l'hypertexte, exemples]]&lt;br /&gt;
&lt;br /&gt;
==Les corpus==&lt;br /&gt;
Pour cette expérimentation ({{formatnum[[A pour volumétrie (serveur d'exploration)::5000]]}} références), des corpus ont été constitués à partir d'une requête élémentaire, « ''présence du terme '''hypertext''''' » dans différentes sources d'information :&lt;br /&gt;
* les bases [[A pour base utilisée::Pascal (base de données)|Pascal]] et Francis de l'[[Institut de l'information scientifique et technique|Inist]], via le serveur Stanalyst ([[A pour taille Pascal::2763]] notices),&lt;br /&gt;
* le service Hal du [[Centre pour la communication scientifique directe|CCSD]] ([[A pour taille HAL::143]] notices),&lt;br /&gt;
* les bases [[A pour base utilisée::PubMed (MEDLINE)|PubMed]] et [[A pour base utilisée::PubMed Central]] de la [[NLM]] (respectivement [[A pour taille PubMed::769]] et [[A pour taille PubMed Central::1374]] notices ou documents).&lt;br /&gt;
===Les bases Pascal et Francis===&lt;br /&gt;
Le service Stanalyst permet notamment d'extraire des corpus sous deux formats :&lt;br /&gt;
* le format standard, basé sur la norme ISO 2709, avec une adaptation Xml.&lt;br /&gt;
* un format d'édition dit « format serveur ».&lt;br /&gt;
Les notices de l'Inist donnent les affiliations de tous les auteurs et bénéficient d'une indexation contrôlée.&lt;br /&gt;
&lt;br /&gt;
===Les bases PubMed et PubMed Central===&lt;br /&gt;
Ces bases sont accessibles au public à partir du site de la NLM.&lt;br /&gt;
&lt;br /&gt;
==Premiers exemples d'interactions entre le réseau Wicri et les serveurs==&lt;br /&gt;
===Curation des noms de pays===&lt;br /&gt;
La génération des serveurs utilise des tables qui sont construites et mises à jour dans le réseau Wicri. Par exemple la curation des pays utilise les tables contenues dans deux pages du wiki Wicri/Métadonnées :&lt;br /&gt;
* La codification [[wicri-meta.fr:ISO 3166-1|ISO 3166-1]] qui donne les codes ISO des noms de pays et une correspondance avec la forme littérale utilisée sur Wicri (et sur Wikipédia).&lt;br /&gt;
* Une [[wicri-meta.fr:Table des noms de pays en anglais|Table des noms de pays en anglais]], utilisée notamment pour PubMed et PubMed Central qui n'utilisent pas les codes ISO.&lt;br /&gt;
Sur l'espace Curation du serveur d'investigation on peut alors évaluer les mécanismes de reconnaissance, voir par exemple les 2 listes :&lt;br /&gt;
* http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/Curation/indexHead.php?index=tei.ncy&lt;br /&gt;
* http://ticri.inpl-nancy.fr/Tic/H2PTM/corpus/Hypertext/Site/fr/Curation/indexHead.php?index=tei.pays&lt;br /&gt;
&lt;br /&gt;
==Régions identifiées dans le serveur==&lt;br /&gt;
Cette liste a été produite par l'exécution d'une commande sur le serveur d'investigation. Pour les régions en bleu l'appel d'un modèle permet également de générer un lien sur le serveur (voir pour la [[Lorraine]]).&lt;br /&gt;
&lt;br /&gt;
[[a pour région repérée::Alsace]],&lt;br /&gt;
[[a pour région repérée::Angleterre]],&lt;br /&gt;
[[a pour région repérée::Aquitaine]],&lt;br /&gt;
[[a pour région repérée::Auvergne]],&lt;br /&gt;
[[a pour région repérée::Basse-Normandie]],&lt;br /&gt;
[[a pour région repérée::Bourgogne]],&lt;br /&gt;
[[a pour région repérée::Grand Londres]],&lt;br /&gt;
[[a pour région repérée::Haute-Normandie]],&lt;br /&gt;
[[a pour région repérée::Languedoc-Roussillon]],&lt;br /&gt;
[[a pour région repérée::Latium]],&lt;br /&gt;
[[a pour région repérée::Lorraine]],&lt;br /&gt;
[[a pour région repérée::Midi-Pyrénées]],&lt;br /&gt;
[[a pour région repérée::Nord-Pas-de-Calais]],&lt;br /&gt;
[[a pour région repérée::Pays de la Loire]],&lt;br /&gt;
[[a pour région repérée::Picardie]],&lt;br /&gt;
[[a pour région repérée::Poitou-Charentes]],&lt;br /&gt;
[[a pour région repérée::Provence-Alpes-Côte d'Azur]],&lt;br /&gt;
[[a pour région repérée::Rhône-Alpes]],&lt;br /&gt;
[[a pour région repérée::Région Bretagne]],&lt;br /&gt;
[[a pour région repérée::Région Centre]],&lt;br /&gt;
[[a pour région repérée::Utah]],&lt;br /&gt;
[[a pour région repérée::Île-de-France]],&lt;br /&gt;
&lt;br /&gt;
==Voir aussi==&lt;br /&gt;
* [[Serveur d'exploration sur l'hypertexte (maquette), aspects techniques]]&lt;br /&gt;
* [[Wicri:HypertextV4]]&lt;br /&gt;
[[Catégorie:génération de système hypertexte]]&lt;br /&gt;
[[Catégorie:Serveur d'exploration]]&lt;br /&gt;
__SHOWFACTBOX__&lt;/div&gt;</summary>
		<author><name>imported&gt;Jacques Ducloy</name></author>
		
	</entry>
</feed>