Humanités numériques
Un rapport [1] sur les enjeux et perspectives dans le domaine des humanités numériques (digital humanities) a été publié par l'Institut Français en 2014 par Marin Dacos et Pierre Mounier. Cette publication aborde les enjeux stratégiques concernant le positionnement de la France dans le domaine des humanités numériques et établit une cartographie de la communauté mondiale des digital humanists.
Note : le contenu de cette page s'inspire notamment de ce rapport.
Sommaire
Définition
Les humanités numériques ont aujourd'hui remplacé ce que l'on appelait les « humanities computing » qui recouvraient les sciences humaines assistées par ordinateur. Elles sont aussi appelées « digital humanities » et ont fait leur apparition il y a environ une décennie. Plus globalement, les humanités numériques font partie d'un mouvement de partage, de diffusion et de valorisation des connaissances qui mobilise les outils numériques. Il y a un désir d'inscrire les nouveaux contenus numériques (digital natives) au même titre que les contenus dit traditionnels (obtenus en numérisant des supports classiques, notamment papier).
Une définition a été rédigée par les participants du THATCamp qui s'est tenu à Paris en 2010. Elle est donnée dans le Manifeste des Digital Humanities[2]. Le constat de base énoncé dans le Manifeste est que "les humanités numériques ne font pas table rase du passé", elles rassemblent tout ce qui provient des humanités (arts, lettres et sciences humaines) ainsi que les savoir-faire et les connaissances qui leurs sont propres, d'une part, et le numérique (nouvelles technologies, ordinateurs et réseaux) en mobilisant les outils et possibilités particulières qui en découlent, d'autre part. Elles sont donc par nature transdisciplinaires et associées aux méthodes de recherche liées au numérique dans les sciences humaines et sociales.
Les humanités numériques sont la marque de l'évolution en cours des pratiques de recherche et de la variation des supports. Le monde de la recherche en sciences humaines et sociales connait un bouleversement avec l'ère du numérique et se trouve être en pleine révolution puisque la recherche s'inscrit à présent, avec les humanités numériques, dans un espace dont les frontières sont à redéfinir (voire à inventer). Désormais, les contenus sont dématérialisés et sont accessibles plus rapidement et de manière permanente.
Dans le cadre des bibliothèques, la numérisation des documents disponibles nécessite de faire évoluer les fonctionnements classiques, pour laisser la place aux "learning centers" qui constituent un espace favorable à l'open access.
Métaphore du Chapiteau
Le terme de "chapiteau" met en exergue la multitude de points de vue et de disciplines dans le domaine des humanités numériques. Cette métaphore du chapiteau est, selon Melissa Terras [3] adapté aux "humanités" puisqu'elle rassemble des chercheurs qui s'intéressent aux sociétés humaines. Les humanités numériques proposent ainsi avec les nouvelles technologies numériques plusieurs approches universitaires. Le chapiteau représente également une image d'ouverture à la communauté des digital humanists qui peuvent adopter de nouvelles pratiques dans l'étude des sciences humaines. La structuration de la communauté pose cependant problème en raison du nombre de disciplines que touchent les humanités numériques.
Historique
Literary and linguistic computing
Ce mouvement débute dans les années 1970 avec la création de corpus de références qui peuvent être utilisés pour l'analyse d’œuvres ou de textes (Brown Corpus). Ces corpus sont réalisés dans plusieurs langues : le British National Corpus pour l'anglais ou Frantext pour le français (par l'ATILF). Cette période est marquée par le développement des analyses linguistiques avec la stylométrie, qui conjugue les statistiques et la linguistique en permettant l'identification de style de texte ou d'auteur, puis la lexicométrie, qui étudie l'usage des mots par des moyens statistiques.
Le Brown Corpus est un corpus linguistique de description de la langue anglaise. Ainsi, le Brown Corpus for Use on Digital Computers[4] corpus a été réalisé grâce à un système d'indexation, par l'intermédiaire de machines, de tous les mots de la langue anglaise en fonction du discours dans lequel ils étaient employés. La première version de ce corpus comptait plus d'un million de mots intégrés manuellement dans la base de données.Ce projet a fait partie des premier à intégrer une méthode de normalisation et de standardisation dans la création d'un corpus.
Aujourd'hui une revue Literary and linguistic computing existe toujours, elle a été créée en 1976 par des chercheurs.
Les Humanities computing
Dans les années 1980 et 1990, les technologies numériques ont beaucoup évoluées notamment dans leurs usages dans le domaine des sciences humaines et sociales. Ce terme apparaît au début des années 1980 et porte sur la réflexion concernant l'utilisation de l'informatique pour la recherche. Selon Willard McCarty, on ne se limite plus à une seule discipline, la réflexion devient donc interdisciplinaire.
- Création de la Text Encoding Initiative (TEI) en 1987 qui deviendra ensuite une norme d'encodage XML utilisable pour toutes les données textuelles numérisées.
- La TEI mène à l'élaboration de nouveaux outils, méthodes et espaces partagés entre plusieurs disciplines. C'est ainsi que la structuration, la diffusion et l'archivage des corpus fait son apparition. Ainsi, les outils et les méthodes migrent d'une discipline à une autre.
Il y a eu un véritable phénomène d'institutionnalisation, les écoles ont commencé à s'équiper d'ordinateurs, les programmes de certaines écoles anglaises ont mit en place des enseignements en programmation (BASIC), et les enseignants se sont vu proposer des formations technologiques pour apprendre à utiliser les ordinateurs et et ainsi voir l'étendue des possibilités liées au numérique.
Cette période a été marquée par de nombreuses inventions telles que l'e-mail, les listes de diffusion et les CD-ROM et la création de formations universitaires.
Les Digital humanities
Avec l'arrivée du web à partir de la seconde moitié des années 1990, le terme de "Digital humanities" apparaît (plus précisément en 2004 lors de la publication de A Companion to Digital Humanities[5]).
- La nouvelle problématique est centrée sur la communication en ligne et sur les réseaux sociaux. Désormais, tous les corpus doivent être disponibles en ligne avec les problèmes que cela peut engendrer, à savoir les critères de diffusion et d'organisation des données (de la simple lecture à l'ajout d'informations et de commentaires).
- Les recherches en sciences humaines sont aujourd'hui immergées dans l'usage du numérique. Le lien est de plus en plus présent avec les sciences du numérique qui est un domaine disciplinaire large qui apporte des avantages aux humanités. À présent les chercheurs sont amenés à travailler avec les outils numériques et le plus souvent en réseau.
- C'est la méthode de visualisation des supports numérisés ou numériques qui permet le lien entre les différentes spécialités (histoire, sociologie, géographie...), se pose à nouveau la question des frontières.
Centre d’humanités numériques
Il est difficile d'évaluer la supériorité d'un pays à un autre pays dans ce domaine. Pourtant, les Etats-Unis semblent avoir développé d'avantage leurs équipes de recherche, et plus particulièrement avec la création de centre spécialisés en humanités numériques. Ce type de structure représente un "projet phare" pour les universités et dispose d'un financement important et permet ainsi l'accumulation des compétences et des technologies, ce qui favorise la structuration des humanités numériques.
Les centres d'humanités numériques ne dépendant d'aucun département universitaire, et se retrouvent donc souvent isolés. Cependant, il s'agit d'une communauté qui possède ses propres modes de communication et les nouvelles pratiques liées aux nouvelles technologies les incitent de plus en plus à utiliser les médias sociaux pour le partage et la diffusion des données d'où le terme "open" (access, data, peer review, commentary). Avec ces espaces plus ouverts et l'apparition du "publish first, filter later" ce sont les lecteurs qui évaluent désormais la qualité des textes déjà publiés. Les humanités numériques ont amené, par l'intermédiaire du web, les pratiques traditionnelles scientifiques à des mouvements plus actuels que sont les THATCamp.
Le site Centernet[6] créé par Neil Fraistat[7] fonctionne comme un réseau, sur lequel les centres d'humanités numériques vont pouvoir s'enregistrer librement, il en compte d'ailleurs plus de 300 à ce jour.
En Europe
En Europe, des centres d'humanités numériques se sont développés en Allemagne (Cologne et Gottingen), en Grande-Bretagne, en Italie (Rome et Pise), en Espagne et en Suisse qui rattrape largement son retard à Zurich et Bern mais de manière plus importante à Lausanne avec une restructuration de la bibliothèque en learning center et la création d'un centre spécialisé en 2013.
Des associations se sont crées à l'échelle nationale en Allemagne, en Espagne et en Italie (lors de la manifestation THATCamp à Florence) après l'échec de la création d'une association européenne en raison du manque d'implication des partenaires. Ces associations sont pourtant dans une optique d'internationalisation de part la composition des équipes constituées de chercheurs allemands et suisses. Dans le cadre des humanités numériques, des événements sont créés à l'exemple de "Dia de las humanidades Digitales"[8] en Espagne, des colloques en Italie ou des conférences.
Aux États-Unis
Ces centres apparaissent dans les universités qui ne sont pas les mieux classées dans le domaine académique américain. Ceci s'explique en partie par l'environnement de compétitivité qui règne dans le milieu universitaire aux États-Unis. De plus, les centre d'humanités numériques ne sont pas dépendants d'un département au sein des universités, ils sont à l'intersection de plusieurs services, et très souvent en association avec les bibliothèques qui assurent une certaine structuration. Il collaborent également avec d'autres centres d'humanités numériques dans le but d'obtenir des nouvelles compétences puisque chacun développe le domaine dans lequel il excelle en fonction des départements qui le soutiennent.
Dans le monde
Au Canada
Au japon
En nouvelle-Zélande
En Australie
Cyberinfrastructure
Les projets liés aux humanités numériques ne sont que temporaires mais les moyens technologiques utilisés nécessitent des infrastructures permanentes pour le partage des données et l'accumulation des connaissances, d'où le lien avec les bibliothèques universitaires. Cependant, le soutien des bibliothèques ne répond pas à tous les critères liés aux humanités numériques notamment lorsque cela concerne l'accès aux données ainsi que leur pérennité à long terme, nombre de documents ont été perdus en raison de l'obsolescence des formats et des supports numériques utilisés dans les années 1970-1980.
C'est ainsi qu'est apparu le terme de "cyberinfrastructure" par l'American Council for Learned Societies(ACLS) en 2006 dans le rapport Our Cultural Commonwealth[9]. Ainsi selon l'ACLS, une cyberinfrastructure doit être publique, pérenne, interopérable, valorisant la collaboration entre chercheurs et prenant en charge l'expérimentation. C'est donc un espace hybride entre matériel et non-matériel. La mise en place de cyberinfrastructures pour les centres de recherche en sciences humaines et sociales est pourtant plus aisée en Europe qu'au Etats-Unis, en raison des politiques nationales et européennes.
A l'échelle européenne, deux infrastructures ont été mises en place, Clarin (Common Language Ressources and Technology Infrastructure) et Dariah (Digital Research Infrastructure for the Arts and Humanities). A l'exemple de l'Allemagne avec l'infrastructure Textgrid qui propose aux chercheurs en sciences humaines et sociales une "boite à outils" constitués de logiciels pour étudier et analyser les corpus. Au Pays-Bas c'est le projet DANS qui représente un modèle de réussite avec des possibilités d'archivage à long terme et de diffusion des données grâce à un système d'indexation et de structuration sémantique des informations.
Il faut aussi évoquer les structures issues d'investissements d'avenir lancés en 2009. Les laboratoires d'excellence comportent pour la plupart une dimension numérique, et les équipements d'excellence représentent les infrastructures de moyenne échelle financées jusqu'en 2020 et qui sont un appui important dans le domaine des humanités numériques. On peut penser à Biblissima qui a pour objectif de construire une bibliothèque numérique qui donne accès au patrimoine écrit du Moyen-âge et de la Renaissance et qui fournit à la communauté une palette d'outils et de méthodes qualitatives et quantitatives pour la collecte, la diffusion et l'enrichissement des données en sciences humaines et sociales.
Huma-num
Huma-num est une très grande infrastructure qui permet aux sciences humaines et sociales de s'adapter aux évolutions numériques. Pour atteindre ses objectifs, elle conjugue la partie humaine avec des concertation collective et la partie technologique avec la pérennité des services numériques grâce à la communauté au niveau national et européen. Cette structure met à disposition une grille de services dédiés, une plateforme d'accès unifié aux données et documents numérisés appelée ISIDORE[10] et une système d'archivage à long terme. Elle propose également des formations pour améliorer les pratiques des chercheurs en sciences humaines et sociales.
En France, ce qui structure fortement les humanités numériques, ce sont les infrastructures Huma-Num qui constitue une force du modèle français et intégré au niveau national. On observe que trois types d'activités définissent l'infrastructure, à savoir une activité de structuration des communautés scientifiques en consortium avec le consortium cahier rassemble les équipes qui travaillent sur des projets de mise en ligne de corpus organisés autour d'un auteur ou d'une thématique ; le développement d'une "grille de services" qui offre l'hébergement, la diffusion et l'archivage à long terme des sources numérisées, ainsi plus de 120 projets sont hébergés ; enfin Huma-Num a développé une plateforme de recherche spécialisée dans les données et publications numériques en sciences humaines et sociales avec plus de 2,5 millions de ressources indexées.
OpenEdition
Cette infrastructure est dédiée à la publications et la communication des résultats de recherche, elle est librement accessible et propose quatre plateformes : OpenEdition Books [11] qui compte plus de 1600 ouvrages ; Revues.org[12] qui diffuse près de 690 revues de sciences humaines et sociales ; Calenda [13] qui est un agenda des sciences humaines et sociales et permet aux organisateurs d'événement scientifique la diffusion de l'annonce, en tout 22 000 programmes ont été partagés depuis 2000 ; et pour finir Hypothèses [14] qui est une plateforme dédiée aux carnets de recherche, des sites web pour la diffusion de l'information sur leurs recherches, cette plateforme accueille plus de 660 carnets de recherche, 800 livres et un programme de mise en ligne de 16 000 ouvrages d'ici 2020.
Ce sont au total plus de 200 000 documents qui sont accessibles librement sur internet. De plus, OpenEdition vient apporter des réponses aux problèmes de pérennité des documents, la diffusion en ligne et la valorisation des contenus. Ce site web compte plus de 35 millions de visites annuelles ce qui propulse la publication des sciences humaines francophones dans un espace ouvert, international et multilingue.
Quelques projets français emblématiques
Hyperprince
Il a pour objectif la numérisation et l'encodage en XML TEI les quatre traductions du texte de Machiavel sur le texte original en italien. Il est accompagné d'un thésaurus et d'un index qui permettent d'observer l'évolution du vocabulaire historique et politique de la réception du Prince à travers les siècles. Ce projet a été développé à l'ENS de Lyon.
E-diasporas
Ce projet phare est dirigé par Dana Diminescu qui établit des cartographies des réseaux des sites web publiés par les communautés de migrants. Ce projet a été développé au sein d'un programme scientifique au FMSH (Fondation Maison des Sciences Humaines) et s'appuie sur l'utilisation d'outils développés en France (Navicrawler ou Gephi qui sont des outils de construction d'un corpus web) afin de faire des comparaisons et de créer un dialogue scientifique. Ce projet constitue le rapprochement réussi entre sciences sociales et sciences du numérique.
PhotoNormandie
C'est une base de données de photos numérisées avec une mise à disposition et partage par l'intermédiaire de la plateforme FlickR et, est composée de 3000 photos prises par les services documentaires américains. Le site donne des fiches documentaires sur chaque objet et les internautes peuvent librement enrichir la base de données.
Criminocorpus
Ce projet est dirigé par Marc Renneville, depuis 2005. Il a pour objectif de créer un corpus de documents et de données sur l'histoire pénale en France, et propose une revue, un blog, 11 expositions virtuelles, une bibliothèque numérique, une bibliographie, deux éditions historiques de textes de loi et dix chronologies. Ainsi, toute une communauté peut consulter et commenter les documents par le biais d'une plateforme.
Digital Studies
Aujourd'hui, toutes les disciplines académiques sont influencées par les nouvelles technologies numériques et l'analyse de ces évolutions dans le cadre scolaire ou universitaire sont traduites comme des "études numériques".
Les humanités numériques se trouvent même dépassées par les études menées à l'IRI (Institut de Recherche et d'Innovation), ainsi il s'agirait d'une véritable rupture dans les modes d'apprentissage en raison des recherches contributives (en lien avec des personnes qui ne sont pas nécessairement des chercheurs) et la numérisation. Par conséquent les humanités numériques représenteraient une branche des digital studies puisqu'elles concernent toutes les formes de savoir (savoir-faire, savoir-vivre et savoir théorique). De plus, la technologie numérique touche aussi bien les sciences humaines, que les sciences "dures" telles que la physique et les sciences expérimentales.
Aujourd'hui, le réseau des digital studies rassemble de nombreuses écoles et universités dans les pays suivants : Ireland, États-Unis, Equateur, Canada, Japon, Uruguay, Suisse, Angleterre, Allemagne et France.
Un texte d'Appel au digital studies a été rédigé par Bernard Stiegler dans le cadre du nouveau monde industriel (2012). Les technologies numériques révolutionnent notre manière d'accéder à l'écriture et donc notre manière de l'éditer, de la diffuser et de la partager et ces données sont accessibles dans l'immédiat par la rapidité que propose internet et les outils web.
Dans ce contexte, huit séminaires ont été organisés entre le 25 mars 2014 et 27 janvier 2015 au Centre Pompidou à Paris. Les comptes-rendus et vidéos des conférences sont disponibles en ligne.[15]
Notes
- ↑ Marin Dacos et Pierre Mounier, Humanités numériques - État des lieux et positionnement de la recherche française dans le contexte international, Institut Français, Paris, 2014, pp. 89. Accéder au rapport (en pdf).
- ↑ Accéder au texte du Manifeste des Digital Humanities sur hypothese.org.
- ↑ Mélissa Terras, Un regard jeté sous le chapiteau, OpenEdition Press, 2012, traduit par Pierre Mounier.
- ↑ Accéder au Brown Corpus Manual
- ↑ Accéder au texte Susan Schreibman, John Unsworth et Ray Siemens, A Companion to Digital Humanities
- ↑ Accéder à Centernet
- ↑ Accèder à la page personnelle de Neil Fraistat du Maryland Institute for Technology in the Humanities
- ↑ Accèder au site
- ↑ American Council for Learned Societies, Our Cultural Commonwealth, New York, 2006, pp. 44. Accéder au rapport (en pdf)
- ↑ Accéder à la plateforme d'accès unifié ISIDORE
- ↑ Accéder aux livres en sciences humaines et sociales accessible sur OpenEdition
- ↑ Accèder aux revues numériques dans OpenEdition
- ↑ Accèder aux événements recensés par OpenEdition
- ↑ Accéder aux carnets de recherche publiés dans OpenEdition
- ↑ Accéder aux comptes-rendus et vidéos sur le site Digital studies.