CIDE (2016) von Hooland : Différence entre versions
De CIDE
imported>Jacques Ducloy (Page créée avec « {{Wicri avertissement création lien}} ;Résumé : Ces dernières années ont vu la numérisation en masse, par de nombreuses institutions, de divers fonds d’archives. Cett... ») |
imported>Jacques Ducloy |
||
Ligne 1 : | Ligne 1 : | ||
{{Wicri avertissement création lien}} | {{Wicri avertissement création lien}} | ||
+ | {{Titre page article | ||
+ | |titre=Evaluation critique de l’usage du Topic Modeling et l’extraction d’entités nommées pour l’exploration des fonds d’archives historiques | ||
+ | }} | ||
;Résumé : Ces dernières années ont vu la numérisation en masse, par de nombreuses institutions, de divers fonds d’archives. Cette tendance offre des perspectives intéressantes pour faire évoluer à la fois les méthodes de recherche quantitatives et qualitatives pour les historiens. Par contre, le manque de métadonnées constitue souvent un frein pour l’exploration de ces grand volumes de textes non-structurés. Malgré la popularité du concept du “distant reading”, introduit par Franco Moretti avec son ouvrage “Graphs, maps and trees” (2007), l’exploration automatisée de fonds d’archives numérisés soulève à la fois des questions conceptuelles et opérationnelles importantes. Sur base d’un fonds d’archives de la Commission Européenne, cette intervention propose une analyse critique des possibilités et limites de l’usage du Topic Modelling et de l’extraction d’entités nommées pour les archives historiques. | ;Résumé : Ces dernières années ont vu la numérisation en masse, par de nombreuses institutions, de divers fonds d’archives. Cette tendance offre des perspectives intéressantes pour faire évoluer à la fois les méthodes de recherche quantitatives et qualitatives pour les historiens. Par contre, le manque de métadonnées constitue souvent un frein pour l’exploration de ces grand volumes de textes non-structurés. Malgré la popularité du concept du “distant reading”, introduit par Franco Moretti avec son ouvrage “Graphs, maps and trees” (2007), l’exploration automatisée de fonds d’archives numérisés soulève à la fois des questions conceptuelles et opérationnelles importantes. Sur base d’un fonds d’archives de la Commission Européenne, cette intervention propose une analyse critique des possibilités et limites de l’usage du Topic Modelling et de l’extraction d’entités nommées pour les archives historiques. |
Version du 11 septembre 2016 à 23:41
Evaluation critique de l’usage du Topic Modeling et l’extraction d’entités nommées pour l’exploration des fonds d’archives historiques
- Résumé
- Ces dernières années ont vu la numérisation en masse, par de nombreuses institutions, de divers fonds d’archives. Cette tendance offre des perspectives intéressantes pour faire évoluer à la fois les méthodes de recherche quantitatives et qualitatives pour les historiens. Par contre, le manque de métadonnées constitue souvent un frein pour l’exploration de ces grand volumes de textes non-structurés. Malgré la popularité du concept du “distant reading”, introduit par Franco Moretti avec son ouvrage “Graphs, maps and trees” (2007), l’exploration automatisée de fonds d’archives numérisés soulève à la fois des questions conceptuelles et opérationnelles importantes. Sur base d’un fonds d’archives de la Commission Européenne, cette intervention propose une analyse critique des possibilités et limites de l’usage du Topic Modelling et de l’extraction d’entités nommées pour les archives historiques.