<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="fr">
	<id>https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?action=history&amp;feed=atom&amp;title=Wicri%3AHypertextV6</id>
	<title>Wicri:HypertextV6 - Historique des versions</title>
	<link rel="self" type="application/atom+xml" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?action=history&amp;feed=atom&amp;title=Wicri%3AHypertextV6"/>
	<link rel="alternate" type="text/html" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Wicri:HypertextV6&amp;action=history"/>
	<updated>2026-04-27T08:26:16Z</updated>
	<subtitle>Historique des versions pour cette page sur le wiki</subtitle>
	<generator>MediaWiki 1.31.10</generator>
	<entry>
		<id>https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Wicri:HypertextV6&amp;diff=2942&amp;oldid=prev</id>
		<title>imported&gt;Jacques Ducloy : 1 révision importée</title>
		<link rel="alternate" type="text/html" href="https://wicri-demo.istex.fr/Wicri/Sic/H2PTM/fr/index.php?title=Wicri:HypertextV6&amp;diff=2942&amp;oldid=prev"/>
		<updated>2017-07-20T13:02:37Z</updated>

		<summary type="html">&lt;p&gt;1 révision importée&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nouvelle page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{header serveur hypertexte}}&lt;br /&gt;
Cette page introduit les aspects techniques de la version [[Wicri:HypertextV6|HypertextV6]] du « [[Serveur d'exploration hypertexte et hypermédia]] ».&lt;br /&gt;
&lt;br /&gt;
Voir aussi :&lt;br /&gt;
*[[Wicri:HypertextV6/Paramètres, data]] - ''génération des données''&lt;br /&gt;
*[[Wicri:HypertextV6/Paramètres, fr]] - ''génération de l'interface''&lt;br /&gt;
*[[Wicri:HypertextV6/Paramètres, génération des cartes]] - ''génération de cartes géographiques''&lt;br /&gt;
*[[Wicri:HypertextV6/Études techniques]]&lt;br /&gt;
==Mise en œuvre==&lt;br /&gt;
===Sur la machine de développement===&lt;br /&gt;
====Initialisation====&lt;br /&gt;
;Génération des pages wikis:&lt;br /&gt;
Compte tenu de la complexité de l'application le générateur de pages n'a pas été utilisé.&lt;br /&gt;
;Définition $EXPLOR_AREA:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
EXPLOR_AREA=$WICRI_ROOT/Ticri/H2ptm/corpus/Hypertext.storage/HypertextV6&lt;br /&gt;
export EXPLOR_AREA&lt;br /&gt;
export LC_ALL='C'&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
;Création répertoires:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
mkdir $EXPLOR_AREA&lt;br /&gt;
mkdir $EXPLOR_AREA/Import&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
====Récupération des corpus ISTEX====&lt;br /&gt;
Compte tenu du volume du corpus (ordre de grandeur {{formatnum:20000}}), le téléchargement est découpé en 9 étapes de 2500 documents.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
IstexGetCorpusSize -q &amp;quot;hypertext* OR hypermedia&amp;quot;&lt;br /&gt;
21596&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
;En cas de reprise complète au niveau du téléchargement:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
rm -rf $EXPLOR_AREA/Import/IstexDownload.*.h*&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.00000&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 2500 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.02500&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 5000 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.05000&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 7500 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.07500&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 10000 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.10000&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 12500 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.12500&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 15000 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.15000&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 17500 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.17500&lt;br /&gt;
&lt;br /&gt;
time IstexGetCorpus -q &amp;quot;hypertext* OR hypermedia&amp;quot; -s 2500 -f 20000 -A \&lt;br /&gt;
     | IstexToSxml     \&lt;br /&gt;
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.20000&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
;Vérification:&lt;br /&gt;
Vérfier l'identité de résultats des 2 commandes : &lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
HfdCat /Users/jacquesducloy/Documents/WicriRoot/Ticri/H2ptm/corpus/Hypertext.storage/HypertextV6/Import/IstexDownload.*.hfd | wc&lt;br /&gt;
&lt;br /&gt;
IstexGetCorpusSize -q &amp;quot;hypertext* OR hypermedia&amp;quot;&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
Un résultat de &amp;quot;IstexGetCorpusSize&amp;quot; différent de celui du départ signifie une évolution de la plateforme INIST pendant le téléchargement. Il faut alors reprendre l'ensemble de l'opération.&lt;br /&gt;
&lt;br /&gt;
Un résultat du HfdCat différent du IstexCorpusSize indique (au moins) un transfert partiel erroné. Il faut alors localiser et faire un télechargement partiel. &lt;br /&gt;
====Construction du repository ISTEX plein texte====&lt;br /&gt;
{{Wicri travaux|texte=Attention problème avec JSON sur BMJ voir paragraphe suivant}}&lt;br /&gt;
Ce repository contient les documents en texte intégral. Il doit rester sur la machine de développement (ou être limité en lecture sur un site accessible par internet).&lt;br /&gt;
;En cas de reprise au niveau du téléchargement:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
rm -rf $EXPLOR_AREA/Import/IstexRepository.h*&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
time HfdCat $EXPLOR_AREA/Import/IstexDownload.*.hfd \&lt;br /&gt;
 | SgmlFast -c 1  | HfdBuild -bh $EXPLOR_AREA/Import/IstexRepository&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
====Palliatif JSON/BMJ====&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
cat &amp;lt;&amp;lt;... &amp;gt; $EXPLOR_AREA/bmjJsonPatch.lex&lt;br /&gt;
%START CC&lt;br /&gt;
%START TO_CAMEL_CASE&lt;br /&gt;
%%&lt;br /&gt;
&amp;quot;&amp;lt;&amp;quot;/[^ &amp;gt;]+&amp;quot; &amp;quot;[^=&amp;gt;]+&amp;quot;&amp;gt;&amp;quot;  {ECHO; BEGIN TO_CAMEL_CASE;}&lt;br /&gt;
&amp;quot;&amp;lt;/&amp;quot;/[^ &amp;gt;]+&amp;quot; &amp;quot;[^&amp;gt;]+&amp;quot;&amp;gt;&amp;quot;  {ECHO; BEGIN TO_CAMEL_CASE;}&lt;br /&gt;
&amp;lt;TO_CAMEL_CASE&amp;gt;[ ]+&amp;quot;&amp;gt;&amp;quot;  {putchar ('&amp;gt;'); BEGIN 0;}&lt;br /&gt;
&amp;lt;TO_CAMEL_CASE&amp;gt;&amp;quot;&amp;gt;&amp;quot;      {putchar ('&amp;gt;'); BEGIN 0;}&lt;br /&gt;
&amp;lt;TO_CAMEL_CASE&amp;gt;[ ]+      BEGIN CC;&lt;br /&gt;
&amp;lt;CC&amp;gt;[A-Z]                {ECHO; BEGIN TO_CAMEL_CASE;}&lt;br /&gt;
&amp;lt;CC&amp;gt;[a-z]               {putchar(toupper(*yytext)); BEGIN TO_CAMEL_CASE;}&lt;br /&gt;
&amp;lt;CC&amp;gt;.                   {ECHO; BEGIN TO_CAMEL_CASE;}&lt;br /&gt;
%%&lt;br /&gt;
main()&lt;br /&gt;
{&lt;br /&gt;
   yylex();&lt;br /&gt;
}&lt;br /&gt;
...&lt;br /&gt;
lex $EXPLOR_AREA/bmjJsonPatch.lex&lt;br /&gt;
gcc lex.yy.c -ll -o $EXPLOR_AREA/bmjJsonPatch.bin&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
;Construction du repository ISTEX plein texte avec le palliatif:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
rm -rf $EXPLOR_AREA/Import/IstexRepository.h*&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
(&lt;br /&gt;
 HfdCat $EXPLOR_AREA/Import/IstexDownload.*.hfd \&lt;br /&gt;
    | grep -v bmj&lt;br /&gt;
 HfdCat $EXPLOR_AREA/Import/IstexDownload.*.hfd \&lt;br /&gt;
    | grep bmj | $EXPLOR_AREA/bmjJsonPatch.bin&lt;br /&gt;
)       | SgmlFast -c 1  | HfdBuild -bh $EXPLOR_AREA/Import/IstexRepository&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
====Construction du Repository de métadonnées====&lt;br /&gt;
Celui ci est en fait la base biblio de l'étape Corpus elle est alignée par les clé HFD sur le repository fulltext. &lt;br /&gt;
;En cas de reprise:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
;Construction corpus biblio:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
time HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \&lt;br /&gt;
  | IstexCleanFullText                         \&lt;br /&gt;
  | SgmlFast -c1                               \&lt;br /&gt;
  | IstexToTei                                \&lt;br /&gt;
  | TeiPutRefToIdno -t wicri:Area/ISTEX/Corpus \&lt;br /&gt;
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
====Récupération des autres corpus====&lt;br /&gt;
;PubMed:&lt;br /&gt;
Pour PubMed/MEDLINE, la requête hypertext dans la boîte de dialogue entraîne :&lt;br /&gt;
&lt;br /&gt;
 &amp;quot;hypermedia&amp;quot;[MeSH Terms] OR &amp;quot;hypermedia&amp;quot;[All Fields] OR &amp;quot;hypertext&amp;quot;[All Fields]&lt;br /&gt;
&lt;br /&gt;
Le résultat est rangé dans $EXPLOR_AREA/Import/pubmed_result.xml&lt;br /&gt;
;PubMed Central:&lt;br /&gt;
Même requête que pour PubMed, le résultat est rangé dans $EXPLOR_ARE/Import/pmc_result.xml&lt;br /&gt;
;Pascal/Francis:&lt;br /&gt;
requête (Stanalyst) :&lt;br /&gt;
 hypertext* ou hypermedia*&lt;br /&gt;
Résultats&lt;br /&gt;
* format Serveur : $EXPLOR_AREA/Import/inistServer.txt &lt;br /&gt;
* format Standard/SGML : $EXPLOR_AREA/Import/inistStandard.txt&lt;br /&gt;
;HAL:&lt;br /&gt;
Sur CCSD/HAL&lt;br /&gt;
Critère : &lt;br /&gt;
 hypertexte OR hypertext OR hypermedia&lt;br /&gt;
&lt;br /&gt;
====Génération des FTP====&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
cd $EXPLOR_AREA&lt;br /&gt;
rm Site.tar.gz &lt;br /&gt;
tar -cvf Site.tar Site &lt;br /&gt;
gzip Site.tar &lt;br /&gt;
rm Data.tar.gz &lt;br /&gt;
tar -cvf Data.tar Data &lt;br /&gt;
gzip Data.tar &lt;br /&gt;
&lt;br /&gt;
rm ImportMetadata.tar.gz&lt;br /&gt;
tar -cvf ImportMetadata.tar Import/istexMetadata.hcs Import/istexMetadata.hfd&lt;br /&gt;
gzip ImportMetadata.tar&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
===Sur la machine cible===&lt;br /&gt;
Aller sur le répertoire corpus correspondant au wiki cible&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
. ... Dilib/init.sh  &lt;br /&gt;
newgrp ticri&lt;br /&gt;
EXPLOR_AREA=$WICRI_ROOT/Wicri/France/corpus/Aussois.storage/AussoisV1.20150722&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
Si nouveau code générique :&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
mkdir $WICRI_ROOT/Ticri/H2ptm/corpus/HypertextV6.storage&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
Création du répertoire plateforme&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
mkdir $EXPLOR_AREA&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
;Transfert par FileZilla:&lt;br /&gt;
Transférer les fichiers Site.tar.gz, Data.tar.gz de AussoisV1 (émetteur) vers AussoisV1 (cible).&lt;br /&gt;
;Installation:&lt;br /&gt;
&amp;lt;source lang=&amp;quot;sh&amp;quot;&amp;gt;&lt;br /&gt;
cd $EXPLOR_AREA&lt;br /&gt;
gunzip Site.tar.gz &lt;br /&gt;
tar -xvf Site.tar &lt;br /&gt;
gzip Site.tar &lt;br /&gt;
&lt;br /&gt;
gunzip Data.tar.gz &lt;br /&gt;
tar -xvf Data.tar &lt;br /&gt;
gzip Data.tar &lt;br /&gt;
&lt;br /&gt;
gunzip ImportMetadata.tar.gz&lt;br /&gt;
tar -xvf ImportMetadata.tar&lt;br /&gt;
gzip ImportMetadata.tar&lt;br /&gt;
&lt;br /&gt;
cd Data/ISTEX/Corpus&lt;br /&gt;
rm biblio.hcs&lt;br /&gt;
rm biblio.hfd&lt;br /&gt;
ln -s ../../../Import/istexMetadata.hcs biblio.hcs&lt;br /&gt;
ln -s ../../../Import/istexMetadata.hfd biblio.hfd&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
==Voir aussi==&lt;br /&gt;
* [[Wicri:HypertextV5]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Jacques Ducloy</name></author>
		
	</entry>
</feed>