Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

Discussion:Serveur d'exploration sur la philologie

De Wicri Linguistique

Eléments sur les dates de publication

Le tableau ci dessous donne des éléments sur les dates de publication du corpus VM2 (23.000 documents). Pour chaque couple, le deuxième nombre représente une date et le premier le nombre de documents édités avec cette date.

811	2009
783	2007
725	2011
721	2008
642	2010
593	2006
493	1965
400	1995
377	1996
372	1991
363	2001
356	2000
350	1994
346	1988
337	1992
325	1993
319	1989
315	1978
313	1990
313	1987
307	1985
297	2005
292	1983
290	1979
288	1980
287	1999
281	1986
273	2004
273	1997
270	1998
263	1975
261	1981
260	1984
259	1982
258	2002
258	1976
240	1977
232	1970
222	1971
218	2003
217	1969
208	1974
197	1972
195	1973
191	1968
187	1967
169	1966
165	1961
163	1956
162	1957
160	1963
153	1964
151	1960
 
145	1954
144	1938
138	1937
135	1962
134	1959
134	1949
130	1950
128	1955
126	1932
126	1929
125	1953
123	1952
122	1951
121	1946
121	1916
119	1958
119	1935
117	1927
116	1933
114	1934
113	1922
112	1936
111	1948
110	1919
108	1939
105	1931
104	1923
103	1941
103	1921
98	1944
97	1918
93	1917
89	1942
88	1928
85	1943
84	1920
83	1940
82	1930
79	1945
66	1925
65	1947
59	1858
58	1924
53	1926
53	1867
48	1913
42	1909
39	1912
38	1914
38	1908
37	1887
36	1859
35	1884
35	1874
32	1910
31	1860
30	1891
30	1881
30	1853
29	1907
29	1890
29	1866
28	1865
27	1850
26	1915
26	1899
26	1856
26	1854
26	1849
25	1911
 

25	1904
25	1869
25	1843
24	1892
24	1848
23	1905
23	1855
22	1895
22	1862
22	1844
21	1902
20	1906
20	1897
20	1846
19	1876
19	1864
19	1851
18	1896
18	1894
18	1879
18	1845
17	1857
16	1903
16	1852
16	1847
15	1898
14	1901
14	1900
14	1889
14	1888
13	1871
12	1886
12	1885
12	1880
12	1870
11	1893
10	1883
10	1882
9	1873
9	1842
8	1868
7	1837
6	1877
6	1875
6	1872
6	1861
5	1863
4	1878
4	1841
4	1838
3	1831
2	2012
2	1836
2	1832
2	1827
1	1840
1	1835
1	1830
1	1826
1	1825
1	1817
1	1816
1	1808
1	1804

Un essai sur le Cardinal de Lorraine

Filtrage initial 
HfdCat PhilologieVM2/Import/IstexRepository.hfd      \
     | grep Lorraine                                 \
     | SxmlFindText -r "[Cc]ardin" -b 100 -a 100 | grep Lor > carLor.txt
Résultat
000B28  1/11/4/2/1/1/8/6        istex/fulltext/istex:fulltextTEI/text/body/div/p[8]/l[6]        104     ce de Cl~ves, to seek the hand of Mlle de Chartres. A similar antipathy for the Vidame provokes the     Cardin  al de Lorraine to refuse his brother, the Chevalier de Guise, permission to seek marriage with Mlle 
001495  1/11/4/2/1/1/182/8      istex/fulltext/istex:fulltextTEI/text/body/div/p[182]/l[8]      138      extreme political catholic, and with him the return of the Huguenots’ direst enemy, the detested       cardin  al of Lorraine, disgraced since 1570. Protestant grievanceswere thus against an erstwhile evil counc
001E52  1/11/4/2/1/1/43/13      istex/fulltext/istex:fulltextTEI/text/body/div/p[43]/l[13]      46      and had his moments of warm sympathy with the   Cardin  al of Lorraine.
004E70  1/11/4/2/1/1/182/8      istex/fulltext/istex:fulltextTEI/text/body/div/p[182]/l[8]      390      too much unassimilated detail. A typical sentence runs: ‘What was more obvious for the Lorrainer       cardin  al bishop and head of the strict wing of Church reform than to think of the ducal brothers Gudfrey a
005024  1/11/4/2/1/1/207/10     istex/fulltext/istex:fulltextTEI/text/body/div/p[207]/l[10]     134     561, and offered a platform for some of the leading figures on either side (e.g. Theodore Beza, the     Cardin  al of Lorraine, Peter
005F01  1/12/1/3/1/3/265/2/1    istex/metadata/istex:metadataXml/istex:document/book/text/page[265]/pageContent/sectionHeader   0       (null)  Cardin  al Fleury, and the late Lord Chatham
006900  1/10/4/2/1/1/6/9        istex/fulltext/istex:fulltextTEI/text/body/div/p[6]/l[9]        33      In an epistle to his patron, the        Cardin  al of Lorraine, Ramus announces the objective that he had set for himself as he began to write his b
007B87  1/11/4/2/1/1/64/3       istex/fulltext/istex:fulltextTEI/text/body/div/p[64]/l[3]       276     f the Guise family and party, M. Romier as far back as 1913 pointed to the sinister activity of the     Cardin  al of Lorraine and his supporters in Rome and elsewhere, and showed reason to think that they pursue
00D618  1/11/4/2/1/1/103/3      istex/fulltext/istex:fulltextTEI/text/body/div/p[103]/l[3]      184     tics reflects the domination of the council by these extreme political Catholics, in particular the     cardin  al of Lorraine, a servant of
00E895  1/11/4/2/1/1/36/18      istex/fulltext/istex:fulltextTEI/text/body/div/p[36]/l[18]      55      Fr20); an important article by Donald Nugent on ‘The    Cardin  al of Lorraine and the Colloquy of Poissy’ (Hist. J., xii): the third volume of S. J. Lenselink‘

Construction d'une table de correspondance
HfdCat PhilologieVM2/Data/Main/Exploration/biblio.hfd   \
 | SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 -p@1 \
 | grep "Area/Istex/Corpus"                                                    \
 | SxmlSelect -g idno/1 -p @g1 -p @2                                           \
 | sort > testIstex2Main.dict
Constructions des lignes du tableau

Cette partie est manuelle mais peut être partiellement automatisée.

Pour chaque occurrence, on recherche la page dans le serveur d'exploration via la table de correspondance. Exemple :

grep 005024 testIstex2Main.dict

Ceci permet, de retrouver le document sur le serveur d'exploration et d'établir un lien. Ici à 005024 correspond 00A766 sur Area/Main/Exploration. La page permet de récupérer un lien par un appel de modèle :

{{Explor lien
   |wiki=    Wicri/Linguistique
   |area=    PhilologieVM2
   |flux=    Istex
   |étape=   Corpus
   |type=    RBID
   |clé=     ISTEX:9EFED4DC8A8B960E66646A61733F00F67E9651F9
   |texte=    bla bla bla
}}

Ce fragment peut alors être intégré dans le tableau.

Pour retrouver l'extrait, sur la machine de développement, on utilise les chemins fournis par la commande SxmlFindText :

HfdSelect -h PhilologieVM2/Import/IstexRepository.hfd -nk 005024 \
 | SxmlSelect -g istex/fulltext/istex:fulltextTEI/text/body/div/p[207] -p @g1