Discussion:Serveur d'exploration sur Mozart

De Wicri Musique
Révision datée du 15 janvier 2021 à 13:58 par Jacques Ducloy (discussion | contributions) (1 révision importée)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Repérage des œuvres les plus citées

Dans le flux de convergence

On utilise ici la numérotation du Catalogue Köchel.

Par exemple pour repérer les œuvres les plus citées au niveau des métadonnées (après filtrage), on peut faire :

HfdCat Data/Main/Exploration/biblio.hfd             \
   | SxmlFindText -r "[K][Vv]*[ \.]*[0-9][0-9]*"    \
   | SxmlSelect -p @5 -p @1 | sort | IndexBuildRec

On repère alors facilement la sonate pour 2 pianos (K 488).

Repérage plus spécialisé

On part ici d'une revue de musicologie (qui évite de nombreuses ambiguïtés). Avec les outils actuellement disponibles on doit gérer la variété de formes comme « K440 K. 440 ou KV 440 » (voir détails techniques en page discussion)


HfdIndexSelect -h $EXPLOR_AREA/Data/Istex/Checkpoint/ISSN.i  -Sk "0027-4224"     \
     | HfdSelect -Kh $EXPLOR_AREA/Data/Istex/Checkpoint/biblio.hfd               \
     | SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1  \
     | grep Corpus                                                              \
     | SxmlSelect -g idno/1 -p @g1                                             \
     | HfdSelect -Kh Import/IstexRepository.hfd                              \
     | SxmlFindText -r "[K][Vv]*[ \.]*[0-9][0-9]*"                        \
     | SxmlSelect -p@1 -p "<a>@5</a>"                                      \
     | SxmlFindText -r "[0-9]+"                                          \
     | SxmlSelect -p @5 -p @1                                           \
     | sort -u | IndexBuildRec |  SxmlSelect -g idx/f/1 -g idx/k/1 -p @g1 -p @g2 | sort -rn

Le résultat brut est le suivant :

34      6
34      491
27      449
26      550
26      467
25      595
24      466
24      453
24      387
23      488
23      271
21      413
20      503
20      465
fréquence numéro commentaire
34 K.6 résultat à approfondir - on trouve par exemple un K6 issu d'un OCR sur Köchel
34 K.491 Concerto pour piano nº 24
27 K.449 Concerto pour piano nº 14
26 K.550 Symphonie nº 40
26 K.467 Concerto pour piano nº 21
25 K.595 Concerto pour piano nº 27
24 K.466 Concerto pour piano nº 20
24 K.453 Concerto pour piano nº 17
24 K.387 Quatuor en sol majeur, K. 387 (dédié à Haydn)
23 K.488 Concerto pour piano nº 23
23 K.271 Concerto pour piano nº 9, dit "jeune homme"
21 K.413
20 K.503
20 K.465