Discussion:Serveur d'exploration sur Mozart
De Wicri Musique
Repérage des œuvres les plus citées
Dans le flux de convergence
On utilise ici la numérotation du Catalogue Köchel.
Par exemple pour repérer les œuvres les plus citées au niveau des métadonnées (après filtrage), on peut faire :
HfdCat Data/Main/Exploration/biblio.hfd \
| SxmlFindText -r "[K][Vv]*[ \.]*[0-9][0-9]*" \
| SxmlSelect -p @5 -p @1 | sort | IndexBuildRec
On repère alors facilement la sonate pour 2 pianos (K 488).
- Repérage plus spécialisé
On part ici d'une revue de musicologie (qui évite de nombreuses ambiguïtés). Avec les outils actuellement disponibles on doit gérer la variété de formes comme « K440 K. 440 ou KV 440 » (voir détails techniques en page discussion)
HfdIndexSelect -h $EXPLOR_AREA/Data/Istex/Checkpoint/ISSN.i -Sk "0027-4224" \
| HfdSelect -Kh $EXPLOR_AREA/Data/Istex/Checkpoint/biblio.hfd \
| SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
| grep Corpus \
| SxmlSelect -g idno/1 -p @g1 \
| HfdSelect -Kh Import/IstexRepository.hfd \
| SxmlFindText -r "[K][Vv]*[ \.]*[0-9][0-9]*" \
| SxmlSelect -p@1 -p "<a>@5</a>" \
| SxmlFindText -r "[0-9]+" \
| SxmlSelect -p @5 -p @1 \
| sort -u | IndexBuildRec | SxmlSelect -g idx/f/1 -g idx/k/1 -p @g1 -p @g2 | sort -rn
Le résultat brut est le suivant :
34 6 34 491 27 449 26 550 26 467 25 595 24 466 24 453 24 387 23 488 23 271 21 413 20 503 20 465
fréquence | numéro | commentaire |
---|---|---|
34 | K.6 | résultat à approfondir - on trouve par exemple un K6 issu d'un OCR sur Köchel |
34 | K.491 | Concerto pour piano nº 24 |
27 | K.449 | Concerto pour piano nº 14 |
26 | K.550 | Symphonie nº 40 |
26 | K.467 | Concerto pour piano nº 21 |
25 | K.595 | Concerto pour piano nº 27 |
24 | K.466 | Concerto pour piano nº 20 |
24 | K.453 | Concerto pour piano nº 17 |
24 | K.387 | Quatuor en sol majeur, K. 387 (dédié à Haydn) |
23 | K.488 | Concerto pour piano nº 23 |
23 | K.271 | Concerto pour piano nº 9, dit "jeune homme" |
21 | K.413 | |
20 | K.503 | |
20 | K.465 |