CIDE (2007) Hufschmitt

De CIDE

Un projet d’édition numérique autour du Discours de la Méthode de Descartes


 
 


 
Titre
Un projet d’édition numérique autour du Discours de la Méthode de Descartes
Auteurs
Benoit Hufschmitt, Daniel Mercier, Jean-Marc Leblanc, Ioan Roxin et Clément Borel.
hufschmitt.benoit@wanadoo.fr
mercier.d@club-Internet.fr
leblanc.jeanmarc@gmail.com
ioan.roxin@univ-fcomte.fr
clement.borel@gmail.com
Affiliation
Université de Franche-Comté, LASELDI Montbéliard
In
CIDE'10 (Nancy 2007)
En ligne
 :http://lodel.irevues.inist.fr/cide/index.php?id=261
Mots-clés
XML ; Hypertexte ; Descartes ; Discours de la Méthode ; Philosophie ; Lien ; Edition ; Métadonnée ; Indexation ; Corpus.

Sommaire

Résumé 
Nous apportons ici quelques réponses, empiriques, à la question de savoir ce que l’informatique (hypertexte, gestion des données et indexation) peut apporter à l’étude rationnelle et critique d’un texte classique de la philosophie. L’exemple du Discours de la Méthode de Descartes permet d’illustrer diverses approches : comparaison des éditions, lecture arborescente, gestion des notes dans diverses éditions, présentation des ouvrages qui ont pu inspirer l’auteur ou qui commentent le texte, extraction d’autres passages du corpus proches par le lexique, etc. Par ailleurs, l’informatique ouvre des possibilités inédites de gérer les conditions d’accès au texte : mises en page et autres modes de présentation rendant le lecteur maître de l’édition

Présentation

Au début de 2000, quelques membres du Centre de Documentation et Bibliographie Philosophiques (CDBP) et du laboratoire LASELDI de l'Université de Franche-Comté décident de mener en commun une réflexion sur l’édition numérique d’un texte de philosophie en usant au mieux des possibilités offertes par les outils disponibles pour le Web[1]. Le texte choisi est, après bien des discussions, Le Discours de la Méthode de Descartes pour diverses raisons dont avant tout : son caractère emblématique, sa taille réduite, l’existence d’un commentaire fouillé et très référencé par Etienne Gilson[DESC,GILS], et enfin la présomption que nombre de droits d’auteurs sur les ouvrages utilisés ont disparu ou disparaîtront rapidement[2].


Le projet est très vite organisé selon deux axes complémentaires[3] :

Une présentation hypertextuelle du Discours et des textes liés qui auraient pu inspirer l’auteur, avec optimisation des fonctionnalités : respect ou non de la présentation des ouvrages sur papier princeps, variation de la taille des caractères, ergonomie poussée de l'interface et simplification des usages. Dans cette configuration, l’application se contente de proposer, sur simple pointage d’un passage du Discours, les références d’ouvrages d’abord, puis les textes des ouvrages eux-mêmes, cités par les commentateurs (Gilson presque exclusivement) dans leurs notes concernant le passage[4]. Les objectifs sont :

  • Construction d’une base de références sur les sources certaines, probables ou possibles du Discours ;
  • Construction d’une banque contenant l'intégralité des ouvrages référencés ;
  • Construction des liens multi-référentiels distingués en grandes classes dont l’activation dépend des options de lecture de l’utilisateur ;
  • Exploitation des métadonnées afin d’assurer une présentation hypertextuelle optimisée fondée sur des liens multiples.

Sans écarter les considérations esthétiques et ergonomiques, l’équipe de Montbéliard s’est orientée vers l’utilisation des langages de déclaration de la sémantique des contenus (XML et RDF). L’équipe travaille sur la double problématique de l'édition numérique et de la navigation dans de grands corpus textuels numériques. La mise en ligne (en mode image ou en mode texte) des ouvrages rassemblés dans les bibliothèques traditionnelles ne constitue que la première étape d'une véritable édition numérique. En effet, ce nouveau mode de publication offre des possibilités beaucoup plus riches que la seule mise à disposition des contenus textuels sur le Web, ce à quoi se limitent actuellement les opérations d'édition en ligne (la « google-isation » des bibliothèques numériques et de l’information sur Internet). Parmi ces possibilités, la création de liens hypertextuels permettant au lecteur d'accéder instantanément à des contenus sémantiquement liés au texte qu'il consulte constitue un enrichissement considérable.

La mise en œuvre d’un maximum de fonctionnalités permettant l’étude du Discours : d'abord la présentation précédente, évidemment ; puis son équivalent pour des textes de commentaires ; des présentations inversées allant des textes référencés vers le Discours ; une présentation parallèle de l’édition princeps, de l’édition latine, de diverses traductions ; des outils de recherche par lexique et par mots-clés ; sans oublier une base bibliographique et un minimum d’informations biographiques, contextuelles, etc. (Cf. les deux cdroms consacrés à Descartes et publiés dans les années 95, ainsi que les nombreuses réalisations de même type).

On a distingué principalement ici les objectifs suivants :

  • Construction d’une base de références sur les sources possibles du Discours et d’un corpus des ouvrages référencés ainsi que des liens (Cf. infra), avec mise en place des liens inversés ;
  • Idem pour les commentaires ;
  • Numérisation et mise en parallèle des éditions du Discours [5] ;
  • Construction de programmes de gestion du lexique ;
  • Construction d’une base et de programmes de gestion de mots clés.

Ajoutons que ces deux projets ont toujours été compris dans une perspective de généralisation, elle-même double :

  • Possibilité de construire le même type d’application sur n’importe quel autre ouvrage de philosophie, ce qui demande, à l’opposé des modes récentes de programmation, une séparation claire entre les données et les procédures de traitement.
  • Mise en place graphique d’un espace indiquant "cartographiquement" les corrélations de tous ces ouvrages ainsi saisis (sur le modèle des cartes du moteur Kartoo).

De nombreuses difficultés, pratiques plutôt que théoriques, se sont présentées et empêchent actuellement le projet de dépasser le niveau d’un prototype.

La base des références sur les sources possibles s’est révélée être un travail énorme de numérisation, avec des moyens plutôt dérisoires pour cette entreprise (matériels et logiciels personnels). La banque des textes eux-mêmes est loin d'être complète. Elle s’est limitée à la récupération sur le WEB de quelques ouvrages en libre accès (issus de Gallica, ABU, Bibliothèque des Sciences Sociales etc.), à la récupération de l’édition numérisée sur cdrom par Past-Master des Œuvres Complètes de Descartes dans l’édition Adam-Tannery[6], et à la numérisation personnelle de divers ouvrages. Les références issues des notes au Discours de la Méthode de Gilson (plus de 1200), de Alquié (environ 300), celles que l’on peut extrapoler de l’Index Scolastico-cartésien (environ 250) et les citations ponctuelles d’un certain Minos du début du XXème (environ 850) ont été introduites dans une base de données. Les liens vers les textes proposés ont été installés au mieux des numérisations disponibles ou réalisées.

Les réalisations informatiques n’ont été qu’ébauchées. Le premier axe relève encore de l’esquisse. Pour pallier l’absence d’application réelle concernant le second axe – généraliser au maximum les approches informatiques du texte – dont la logique est de s’inscrire dans la continuité des réalisations du premier axe, une application très empirique a finalement été produite par B. Hufschmitt, en utilisant des outils du WEB 1 : en EasyPHP sur des bases MY_SQL. Si l’ensemble fonctionne, l’ergonomie laisse à désirer. L’automatisation des procédures pourrait être bien meilleure et l’interfaçage de modifications des informations est tout à fait rudimentaire.

Pour que le lecteur puisse juger de la pertinence de la poursuite du travail, cet article rappellera d'abord, en reprenant partiellement un article antérieur [HUFS2], ce que l'on peut espérer de la numérisation d'un texte de philosophie en général ; puis il présentera rapidement l'état de réalisation du projet.

Généralités sur ce que peut apporter la numérisation d'un texte de philosophie

Présenter un ouvrage de philosophie, classique de plus, en format numérique et comme hypertexte appelle de nombreuses objections et critiques de principe, surtout lorsqu’il s’agit de l’ouvrage par excellence : le Discours de la Méthode de Descartes. Nous ne discuterons pas de la pertinence de ces critiques, si ce n'est pour dire qu'elles occultent systématiquement les possibilités nouvelles d'approche d'un texte (philosophique). Ce sont ces usages, que l'informatique seule permet, ou du moins améliore, que nous voulons dégager ici.

Le principe général de ce projet est assez simple : optimiser les aides à la lecture du texte par les moyens de l’informatique et surtout ceux de la présentation hypertextuelle. On peut penser que l’hypertexte promet des bouleversements de même nature que ceux que le codex, puis l’imprimerie, ont provoqués : un élargissement des manières de parcourir cette suite linéaire de signes graphiques que représente un texte, au détriment, sans les annuler cependant, des fonctionnalités anciennement établies. De plus, à l’instar d’une encyclopédie, mais pour d’autres raisons, le texte de type argumentatif trouve dans l’hypertexte un moyen d’approcher l’idéal des conditions pour sa lecture, à savoir une mise à disposition optimisée des moyens pour l’évaluer de manière rationnellement critique[7]. Voici les fonctionnalités que nous avons dégagées :

Modifier les styles et conditions de présentation

En regard de la fixité d’un texte écrit sur support papier, où les conditions de variations de lectures sont externes et posées comme accessoires (intensité lumineuse, usage de loupes et lunettes), on peut proposer sur un support informatique une multitude d’affichages par bascules d’options de présentation du texte ou par action directe sur ce qui est présenté à l’écran : changement de police, grossissement, modification de taille des lignes, choix des marqueurs différentiels tels gras ou guillemets, coupure ou non des mots en fin de ligne, présentation et type de présentation des images et dessins, accès aux seuls titres et sous-titres etc.[8]. Ces variations sont accessibles par simple usage d’un traitement de texte, pour autant que le document puisse y être soumis, mais elles peuvent être également intégrées dans le cadre d’un logiciel spécifique de présentation. Fort spectaculaire est l’utilisation de pages de texte en approche graphique vectorielle permettant au lecteur de choisir sans aucune difficulté le format des pages sans modifications autres de présentation.

Ces fonctionnalités qui relèvent du traitement de texte n’ont guère été travaillées, sinon que, dans le projet de Montbéliard, le texte est proposé dans un environnement Flash, afin de permettre de modifier sans efforts ni désagréments la taille des caractères et des fenêtres de lecture.

Reproduire les éditions “ marquantes ” dans leur matérialité

Le format image, voire un patient travail de mise en forme du texte ASCII peut permettre au lecteur d’approcher l’ouvrage dans l’essentiel des particularités de la réception primitive. Certes une approche informatique semble inutile pour cela : la mise en page, le respect des graphies ou la pagination ont été reproduits au mieux dès l’édition Adam-Tannery de notre texte, et les reproductions offset, telles celles de l’éditeur Olms dans les années 70, semblent meilleures, ne serait-ce que par la conservation d’un support papier[9].

Ce que permet ici le support informatique est autre : d’une part la facilité d’accès à ces formes par la modestie de leur coût de réalisation (et de leur appréhension), la possibilité de les multiplier rapidement et de mettre un grand nombre de reproductions intéressantes à disposition de tout public (les différentes éditions initiales, les éditions princeps, et encore des exemplaires annotés par tel ou tel grand nom de la philosophie) ; d’autre part, et surtout, l’accès comparé immédiat de ces formes. Alors que le document papier est pris ici dans une alternative lourde à manipuler, la numérisation permet un basculement immédiat, à volonté, des formes graphiques utilisées, et peut en proposer la multiplication. Par exemple, pour le Discours de la Méthode, le lecteur pourrait choisir une police similaire à l’édition originale (Adam-Tannery), une police approximativement similaire (Gilson) ou une police moderne.

Il n’empêche cependant que l’avantage reste modeste et qu’une copie sur support papier mérite d’être privilégiée pour de telles opérations, sans oublier cependant que ce dernier lui-même ne peut récupérer la moindre miette de la magie de tenir entre ses mains un original, nécessaire à une approche, philosophico-artistique, de l’œuvre.

En résumé, la numérisation du texte peut permettre d’installer le lecteur comme responsable de ses conditions d’édition, de ce qu’il juge ou non important pour la réception de l’ouvrage.

Adam et Tannery se sont penchés de près sur les variations que l’on peut autoriser dans la reproduction du Discours sans risquer de le dénaturer [AT 1, avertissement] ; Gilson pense préférable de rectifier un peu la typographie (afin d’éviter la confusion entre les « s » et les « f » et n’hésite pas non plus à rectifier l’orthographe selon les règles modernes [DESC, p. xiv], en citant Descartes lui-même pour se justifier. De manière générale, les variations liées à l’usage ou au confort du lecteur sont nombreuses ; outre la typographie et l’orthographe, on rappellera : la mise en page, les coupures de mots, l’indication explicite des parties, le respect des paragraphes, le respect de la ponctuation, sans parler du titre lui-même « Discours de la méthode suivi de… » (Cf. l’édition de V. Cousin) etc.

Proposer les diverses éditions, variantes et textes préparatoires

Un peu différente est la facilité d’accéder aux différentes éditions d’un texte ou encore aux formes préparatoires, manuscrites ou non [LEBR,HUFS1 ]. Il en est de même pour les différentes traductions le cas échéant. Certes, les éditions papier savantes fournissent un tel produit, mais toujours figé dans une perspective de lecture précise : les variantes sont mentionnées entre crochets ou autres signes du même genre, à moins que ce ne soit en notes en bas de page ou en fin d’ouvrage, ou bien les textes sont disposés grossièrement en parallèle sur des verso et des recto (page gauche pour le texte de référence, page droite pour une traduction ou une révision) à moins que ce ne soit entre haut et bas de page ; de plus, la prise en compte de plus d’une variante entraîne vite la confusion.

Le multi-fenêtrage permet ici des variations claires à l’infini, qu’il faut laisser à la responsabilité de l’utilisateur, par la mise en page des présentations parallèles et par le choix d’options préalables de lecture, par exemple : notes activées en fenêtre temporaire par passage de souris, telle option activée par clic droit etc… Une appréhension parallèle des traductions semble particulièrement intéressante (un exemple est réalisé dans un cdrom qui présente diverses traductions et l’original latin de l’Ethique de Spinoza).

Le Discours est exceptionnellement pauvre sur ce point[10], mais il est intéressant de pouvoir disposer, en parallèle, de l’édition latine postérieure, que Descartes n’a pas écrite lui-même, mais qu’il a contrôlée et approuvée[11] (de nombreuses éditions modernes marquent en notes quelques points jugés cruciaux pour la compréhension[12]). De même, alors qu’un éditeur papier aurait du mal à faire accepter un jeu de notes exposant les choix des traductions anglaises pour un public francophone, la possibilité par libre choix du lecteur de les activer ne saurait être critiquée, surtout si le texte français et la traduction peuvent être prises également comme référence de travail : qui critiquera que l’on ajoute, sans moyens supplémentaires, à la possibilité pour l’anglophone de se référer à l’original, celle de consulter la traduction anglaise pour le francophone ? Ce multi-usage dilue la responsabilité éditoriale, voire traductrice, sans la supprimer, au profit de la responsabilité du lecteur lui-même.

Proposer une approche arborescente du texte

Cette fonctionnalité est bien connue et souvent utilisée ; il n’est donc guère utile d’en parler ici de manière générale, si ce n’est pour en signaler l’importance dans le cas d’un texte de nature argumentative, permettant de contrôler précisément son organisation.

Le Discours ne semble guère intéressant sur ce point, puisque son organisation explicite se limite à six parties[13]. Mais c’est justement ce qui rend particulièrement utile cette présentation car cela permet de présenter la diversité des organisations fines qui peuvent être proposées comme plans par les commentateurs.

Laisser au lecteur l’accès aux notes et commentaires

La note et le texte papier

L’organisation des notes est délicate dans le cas d’une édition papier. Placée en bas de page, la note tend à casser la lecture du texte, disposée en fin d’ouvrage, elle pose au lecteur l’alternative d’une rupture de lecture encore plus grande ou de sa négligence. De plus sa diversité générique est difficile à représenter[14]. L’éditeur y parvient cependant un peu en différenciant deux types d’appel de notes (auteur et autres) et en les positionnant différemment. Mais prétendre à des nuances plus fines se révèle à peu près impossible ou du moins rend la lecture très complexe. Si les éditions mélangent le plus souvent tout, certaines opèrent selon un choix spécifique éventuellement très précis, ou du moins le tentent. C’est le cas de Gilson dans son édition commentée du Discours où il expose essentiellement (mais non exclusivement) les sources possibles du Discours, en accord avec la thèse qu’il développe ailleurs que la rupture cartésienne d’avec la Scolastique est quelque peu surfaite.

La note dans un contexte informatique

Quiconque a manipulé ne serait-ce qu’une fois un hypertexte pensera immédiatement à utiliser le lien hypertexte pour appeler les notes d’un texte [HERM]. La discrétion de sa présence peut être paramétrée à volonté par l’utilisateur (pour autant que la programmation sous-jacente l’y autorise), d’une agressive surbrillance d’une portion de texte à son camouflage total. Si l’appel de note peut être indiqué de manière ponctuelle (comme dans un livre), il peut aussi être étendu sur toute la partie du texte concernée. De plus, la diversité des types de notes peut être organisée et contrôlée avec à propos, d’une part en distinguant par exemple la note activée par passage de souris sur l’appel, celle qui l’est par clic souris gauche etc., d’autre part en mettant en place des options envers les notes activables lors d’une consultation, que ce soit avant ou en cours de travail. Enfin, elle peut être aisément construite sur différents niveaux, une note appelée pouvant à son tour permettre d’autres appels ; s’il semble douteux qu’une pratique anarchique de cette possibilité ait de l’intérêt, une gestion mieux organisée peut permettre par exemple de fournir successivement une référence textuelle, le texte lui-même, voire ensuite des commentaires supplémentaires.

Le Discours de la Méthode a été édité initialement sans notes, ni de l’auteur, ni de l’éditeur (à une seule exception, surprenante : la référence au de Motu Cordis de Harvey en marge dans la cinquième partie), mais les rééditions n’ont pas manqué de joindre de multiples notes de commentaires, l’exemple le plus impressionnant étant celui de l’édition critique de Gilson chez Vrin. Ces notes présentent une grande qualité dans leur contenu et l’on doit reconnaître que les éditions ultérieures n’ajoutent guère de notes originales. Mais cette édition est aussi remarquable au niveau de la forme :

Il n’y a pas d’appels de notes au niveau du texte lui-même. Gilson a respecté la pagination et la mise en forme de l’édition Adam-Tannery qui en avait fait de même avec l’édition originale[15]. Les notes sont en fin d’ouvrage et le lecteur ignore s’il y a ou non appel. Par contre, les notes elles-mêmes sont référencées par les numéros de page et de ligne et par l’indication de quelques mots du texte. On voit bien sur cet exemple que le papier ne peut trouver de compromis entre deux extrêmes : les appels de notes qui polluent le texte original et leur absence, Gilson marquant en creux l’idée de lien hypertextuel comme médian, sans pouvoir le réaliser évidemment (en 1926 ?).

Ces notes sont assez homogènes, se répartissant en quatre types principaux, sans que ce soit systématique. Pour l’essentiel, elles fournissent : soit des sources possibles du propos cartésien, soit d’autres références cartésiennes sur le même sujet, soit des références de textes à peu près contemporains, soit enfin des références d’autres auteurs postérieurs qui sont censés eux aussi clarifier le vocabulaire et la problématique cartésienne.

L’analogie avec les hypertextes est encore plus nette quand le lecteur a la chance ou l’idée de consulter un autre ouvrage de Gilson : l’Index Scolastico-cartésien.[GILS] où cet auteur relie sous un même mot/concept des références au corpus cartésien (tome, page et ligne de l’édition Adam-Tannery) à des extraits de textes de la scolastique qui peuvent rendre compte des sources scolaires des notions mises en place par Descartes.

Le projet de mise à disposition en hypertexte des sources du Discours de la Méthode ne propose donc que l’aboutissement effectif des travaux de Gilson, en permettant :

  • L’implantation des appels de notes, sans que ceux-ci n’envahissent le texte. Pour cela, il sera proposé au lecteur de choisir son mode de manifestation des appels : entre des appels invisibles qui ne se manifestent qu’au clic souris (le cas échéant), jusqu’au surligné habituel (voire des boutons numéros de notes), en passant par la proposition qui nous semble la plus judicieuse : manifestation de l’appel au passage du curseur.
  • Le choix des types de notes activées, le Discours de la Méthode permettant une partition fine sur le thème de sources du propos de l’auteur : sources directes (ouvrages antérieurs) ou témoignages (dictionnaires d’époque ou compte-rendu des biographes par exemple), sources internes ou sources externes au corpus cartésien, sources explicites, probables ou possibles etc. Le lecteur pouvant déterminer quelle combinaison de ces types de notes il désire (sans omettre le choix de refuser les notes).

Fournir au lecteur un accès aisé aux documents cités en référence

Rendre disponibles les ouvrages de référence

Dans le principe, l’idée est simple : la numérisation des textes permet à chacun un accès beaucoup plus aisé aux sources. La mise à disposition progressive gratuite (mais pas toujours) sur Internet des ouvrages rares engagée par les bibliothèques (Gallica de la Bibliothèque Nationale pour la France), les Universités (site Athéna de l’Université de Genève) ou autres (site ABU, site Les classiques en sciences sociales de l’université Chicoutini du Québec), le développement parallèle des éditions d’œuvres sur cdrom (Past-Masters qui fournit en particulier une édition un peu réduite d’Adam-Tannery : absence de la Dissertatio), sans parler des tentatives commerciales, fournissent une masse d’ouvrages de références qui déborde déjà les limites d’une bibliothèque universitaire.

Cependant les politiques de numérisation sont étrangères, évidemment, au thème que nous avons choisi (lecture érudite du Discours de la Méthode) et la recherche ponctuelle d’une référence sur la toile peut être longue et se révéler souvent infructueuse. C’est pourquoi les liaisons aux sites pertinents ou l’importation des fichiers eux-mêmes doivent être rendues disponibles au lecteur, l’idéal étant d’atteindre une mise à disposition totale de sources par simple appel de liens.

Se proposer un tel projet apparaît cependant aussitôt extrêmement lourd et délicat :

  • Lourd car une recherche orientée de textes numérisés aboutit, pour l’heure, à une pauvreté extrême des résultats. Certes des programmes importants de numérisation de textes sont en cours. Mais c’est une grande illusion liée à l’Internet que de déduire de l’énormité des documents disponibles, la probabilité de trouver le document recherché, d’une part en raison de la faiblesse des moteurs de recherche (qui accumulent aussi bien les bruits que les silences), d’autre part, parce que la proportion des ouvrages classiques numérisés est très faible en regard des ouvrages classiques en général (Google print n’ayant rien arrangé !).
  • Délicat car une alternative est difficile à maîtriser : celle du choix entre politique « cdrom » ou « Internet ». La première, qui consiste à importer les références et à les remanier pour que les liens aboutissent bien et pour qu’il y ait unité de présentation des documents, limite le projet pour des raisons de mémoire et par son aspect statique. La seconde, qui consiste à renvoyer l’utilisateur sur un site absolument non maîtrisé, demandant un calcul sans cesse réitéré des liens, doit accepter des présentations diverses, et surtout est à la merci des actions imprévisibles des maîtres des lieux. C’est évidemment toute la difficulté des normalisations et de la stabilité des adresses de sites sur l’Internet qui réapparaît.

Informer les références

La possibilité d’activation optionnelle ou temporaire de fenêtres permet de systématiser et optimiser les présentations des documents appelés. L’observation des notes de Gilson permet de distinguer, outre la référence précise, la présence de deux commentaires assez distincts : l’un qui introduit la référence et la présente, l’autre qui la discute et la commente effectivement. On trouve parfois, enfin, une indication de méta-référence, consistant à dire que cette liaison est proposée par X (dont en particulier Descartes lui-même dans sa correspondance), Gilson se contentant de la reprendre à son compte. Rares chez Gilson qui a fait œuvre d’initiateur sur les recherches des sources, elles sont multiples à sa suite.

Mode image ou mode texte ?

Rappelons le choix de complexité du mode de numérisation des textes. La numérisation image est aisée mais coûteuse en mémoire et très pauvre en fonctionnalités de manipulation. Le mode texte exige en outre un traitement en OCR initial qui demande toujours du temps de corrections et modifications. Ce dernier produit, faut-il ignorer l’image, faire une synthèse (sur le mode PDF) ou conserver les options séparées ? Conformément à ce qui précède, une présentation image de l’édition de référence , au moins, mérite cependant d’être proposée. Un tel fichier du Discours de la Méthode n’est pas actuellement disponible, le site Gallica ne fournit que l’image de l’édition Victor Cousin.

Accumuler les ouvrages de référence

Macintosh, puis Windows, ont construit leur renommée sur le principe de la simulation sur écran d’un bureau associant le multi-fenêtrage à l’ouverture physique de documents, rapports ou ouvrages sur une table.

L’utilisation d’une version informatique des ouvrages dans n’importe quel environnement à fenêtres et à répartition des tâches permet de simuler cette pratique aussi courante qu’indispensable pour toute recherche. Elle l’améliore évidemment en ce que la mise à disposition des ouvrages est plus aisée, mais elle produit généralement un désordre encore plus grand que celui d’un bureau physique : par équivalence des fenêtres, instabilité des superpositions, indifférence à l’accumulation et mauvaise maîtrise des fermetures. Les réponses par la conservation des chemins et les historiques sont assez efficaces, mais ne peut-on pas faire plus et mieux ?

Une augmentation des contraintes liée à la spécificité des tâches est utile. Ainsi une dissymétrie doit être établie entre le texte de base et les textes qui l’expliquent, le plus simple étant de maintenir le premier en fond d’écran. Mais cela ne doit pas empêcher l’utilisateur de décider d’intervertir le cas échéant le texte de base et un texte d’étude.

Dans notre application, l’ouvrage étudié est maintenu, en fond d’écran, sur une moitié de l’écran. Des fenêtres temporaires peuvent se superposer, en particulier celles qui indiquent les références concernées par un passage sélectionné.

  • Leur titre complet, l’édition de référence, l’édition utilisée ici (traduction en particulier), éventuellement les lieux de consultation possibles.
  • Le commentateur qui a pris la responsabilité de poser cette liaison (ici essentiellement Gilson).
  • Un commentaire introductif exposant la pertinence de l’appel.
  • Un commentaire discutant cet appel, ces deux points étant ou non tirés de la note du commentateur.

Le texte référé lui-même, de préférence l’ouvrage entier, ouvert à la page concernée, avec ou non (au choix) marque plus précise de localisation du lien, se positionne sur l’autre moitié de l’écran. Les divers textes appelés sont superposés en cascade. Le lecteur peut parcourir à volonté le texte, et y opérer toutes les fonctionnalités d’un traitement de texte, sans que le fichier source soit affecté, les modifications étant éventuellement sauvegardées à part (permettant de retrouver, si désiré, le texte source soumis aux modifications lors de séances suivantes de travail personnel). le lecteur peut aussi décider que ce texte devient son nouvel objet d’étude, prenant alors la place dévolue au Discours de la Méthode.

Appréhender la contribution des ouvrages appelés comme référence à l’explication ou au commentaire du texte

Ce n’est rien d’autre que l’inversion de la démarche précédente : depuis un ouvrage cité, appréhender les différents passages où il sert d’explication ou de commentaire. Si la mise en œuvre est aisée dans un contexte informatique, les réalisations proposées sous forme papier restent succinctes et difficiles à manier : en général, chaque élément de la bibliographie est suivi des numéros de pages où le document a été cité ; on trouve parfois ces indications dans le cadre plus général d’un index.

Pour le Discours, cette approche est particulièrement intéressante dans la mesure où la répartition des usages est très irrégulière. On peut s’y attendre parfois : appel au Ratio Studiorum dans la première partie du Discours presque exclusivement ; mais c’est d’autres fois plus surprenant : peu d’appels à Saint Augustin par exemple, et ailleurs que là où on l’attend (le cogito) ! C’est surtout, une bonne manière d’appréhender ces références d’une manière moins hachée et parcellaire que par la démarche directe. A terme, le projet devrait temporairement permettre de substituer, par empilement, le texte d’étude au texte d’origine (dans notre exemple, le Ratio prenant la place du Discours comme texte étudié, jusqu’à abandon de cette option).

Fournir les contextes où l’ouvrage étudié est appelé comme référence

Cette démarche, différente de la récollection des notes, consiste à fournir les références de documents, puis les documents eux-mêmes, qui citent le texte étudié en certains passages particuliers dans le cadre de leur problématique propre. Pour des raisons matérielles, mais aussi afin de limiter l’ensemble des textes concernées, il est prudent de limiter le champ de recherche de ces références aux documents qui traitent de l’auteur de l’ouvrage étudié, voire son école ou sa postérité ; mais on peut envisager un recensement plus général, avec une mise en place de possibilités de sélections thématiques par l’utilisateur… Pour bien marquer la séparation entre cette approche et celle des notes, on n’inscrira dans le domaine des notes que les ouvrages qui analysent explicitement l’ouvrage étudié. Resteront certes quelques cas où il faudra décider, au cas par cas, s’il s’agit d’un commentaire de l’ouvrage ou d’une utilisation de l’ouvrage comme référence ; par exemple un chapitre isolé à valeur de commentaire.

Seront recensés les ouvrages qui citent le Discours en note ou comme appui pour une argumentation qui ne relève pas d’une explication générale du Discours : soit que le Discours est lui-même explicatif d’autre chose, soit que cela explique ou commente le Discours, mais de manière ponctuelle. Par exemple Léon Brunschvicg : Descartes et Pascal lecteurs de Montaigne, La Baconnière, 1945 ; Geneviève Rodis-Lewis : Descartes, biographie, Calman-Lévy1995…

Pour clarifier cette différence d’approche, l’exemple de Baillet : La Vie de M. Descartes, est très clair. Il fonctionne comme texte référé à certains passages du Discours, dans la mesure où Gilson, Rodis-Lewis… ont mentionné dans leurs notes qu’il est intéressant, pour comprendre tel ou tel passage du Discours, de consulter tel ou tel passage du Baillet ; mais cet ouvrage est également utilisé dans la rubrique présente dans la mesure où, en marges de son texte, Baillet a parfois indiqué qu’il fallait aller voir à tel ou tel endroit du Discours afin d’appuyer son propos.

On a limité ici le champ de recherche de ces références aux documents qui concernent Descartes, voire le cartésianisme ; mais un recensement plus général pourrait inclure les textes de médecine où le Discours est cité, ou d’astronomie, ou d’histoire des techniques…

Multiplier les approches par index, mots clés et présence d’occurrences dans le texte

Les index sont un élément important des ouvrages sous leur forme papier. Leur utilité est apparue avec les codex, de même que les tables des matières ; la présence des index nominum et rerum est généralement considérée comme une nécessité de toute édition sérieuse, les premiers en particulier qui ne posent pas (ou peu) de problèmes théoriques. Si ces outils ne sont pas ceux de la documentation (ils pointent des fragments internes à un texte, la documentation sélectionne un texte dans un vaste corpus), les méthodes de construction et de manipulation peuvent être rapprochées.

Or l’informatisation a totalement renouvelé les indexations à deux niveaux :

  • Les descripteurs peuvent être utilisés de manière composée dans des équations logiques et avec des marges d’indétermination (troncatures) et des transferts contrôlés de pertinence (hiérarchie), ce qui, en retour, modifie leur conception et leur implantation sur les textes eux-mêmes. La pratique des thésaurus est l’illustration la plus simple de ce renouveau, qui est loin de s’y réduire.
  • La constitution des listes de descripteurs et de leur organisation sur les textes est grandement facilitée par la numérisation. Si leur réduction à une sélection parmi les occurrences (lemmatisées) permet une automatisation presque complète, c’est au prix de quelques confusions sémantiques. Par contre, l’extraction automatisée des concepts se révèle être un projet fort complexe, irréalisable pour certains. Entre les extrêmes, la construction semi automatisée est sans doute la voie la plus prometteuse. C’est sur cette difficulté que s’oriente maintenant notre travail, par la manipulation, éventuellement détournée, des logiciels disponibles et en réfléchissant sur les caractéristiques, quasi-terminologiques, des textes philosophiques.

Pour notre projet, il apparaît que les index constitués, qu’ils soient lexicaux ou conceptuels, ouvrent alors un vaste champ d’appréhensions nouvelles de l’ouvrage, par exemple :

Lecture, depuis un passage quelconque (que l’on désire expliquer par exemple), de l’ensemble en glissant vers les passages associés aux mêmes descripteurs, et récursivement aussi loin que l’on désire.

Détermination automatisée, par statistiques et analyse des données, d’ossatures de l’ouvrage à partir des seuls descripteurs, ce qui peut conforter les organisations apparentes ou les contester, ouvrant alors de nouvelles hypothèses d’interprétation.

De même production d’hypothèses sur les conditions d’écriture de l’ouvrage, depuis la chronologie, jusqu’à l’établissement d’une paternité d’œuvre (Cf. les œuvres douteuses de Platon ou les signatures des articles de l’Encyclopédie de Diderot et d’Alembert).

Présentation des proximités des formes lexicales, canoniques ou conceptuelles par analyse factorielle (dynamique).

Détermination semblable de concepts opératoires par classification automatique.

Détermination différentielle de l’ouvrage par rapport à un corpus plus général, voire mise en place de coupures internes autres que les ouvrages dans un corpus unifié (organisation et segmentation de la correspondance de Descartes par exemple). En réciproque, mise en place de descripteurs pertinents pour la recherche documentaire.

Les index nominum et rerum n'ont pas manqué en complément de l'édition des œuvres cartésiennes, ceux d'Adam et Tannery sont particulièrement fournis, l'index nominum de l'édition des lettres par Adam et Milhaud est remarquable, mais le plus curieux vient encore de Gilson qui a publié comme thèse au début du siècle précédent un Index scolastico-cartésien (déjà cité) dans lequel plus de cent notions souvent identifiées à un mot, mais pas toujours, lient, chacune, une liste de références du corpus cartésien à quelques textes scolastiques qui auraient inspiré Descartes.

Depuis la numérisation, opérer une indexation lexicale ou faire des recherches sur chaîne de caractères est une démarche devenue tout à fait familière dont l’utilité est considérable, mais dont l’usage est souvent minoré.

Par contre, nous ne connaissons pas de travail sérieux d'extraction de concepts ou de classification opéré sur le Discours de la Méthode[16], pas plus que d'analyse différentielle permettant de juger des étapes d’une composition qui aurait été très progressive, ou plus généralement délimitant des époques dans la doctrine.

Rendre le lecteur maître de l’environnement de lecture du texte

Enfin, cette profusion de moyens d’étude, associée à la possibilité de les activer ou non, peut être totalement maîtrisée par l’utilisation, et la reproduction, de brouillons de travail sur lesquels tout peut être fait ; couper-coller, mélanges, notes personnelles, soulignés… de manière simple, pour autant que ce soit prévu (ou plutôt non empêché) sur des copies de fichiers, les sources restant intouchées ou restituables. C’est dans cet ordre d’idées que le plus grand nombre des logiciels actuels qui manipulent les textes fournissent déjà des blocs notes et des dossiers personnels de travail. On peut espérer une généralisation, en distinguant en particulier :

Les modifications à des fins de lecture personnelle

En ce cas toutes les possibilités de présentation, d’édition, de présence de notes, de présence des ouvrages auxiliaires sont totalement contrôlées par le lecteur en fonction de ses projets, connaissances ou lubies [VAND. p. 90]. De plus, libre à lui de rectifier les notes et les références, d’en ajouter, d’en éliminer, d’introduire de nouveaux commentaires ; un ensemble de fichiers personnels rectifiant pour lui seul le travail initial et le conservant autant qu’il le désire [VUIL, p. 101 sq].

Les modifications à des fins d'amélioration du produit accessible à la communauté

Sous réserve, évidemment, de contrôles institutionnalisés, chacun peut proposer d’enrichir le produit destiné à la communauté, participant au développement d’un environnement foisonnant, mais organisé, de l’ouvrage.

Extension : une toile d’études similaires

On peut espérer alors, puisque chaque ouvrage peut être l’occasion d’un tel environnement de lecture, et, parce que tous sont reliés entre eux par appels de référence, qu’un réseau général se constitue où chaque ouvrage est un nœud, un point de vue, pour saisir la diversité des productions intellectuelles, le lecteur possédant ainsi les informations de la communauté des spécialistes et l’essentiel des savoir-faire (déposé dans les liens) qui permettent à ces spécialistes de ne pas se perdre.

Résumé et conclusion

Notre projet prend acte de la tendance à la numérisation des textes. Il s’intéresse plutôt à celle qui porte sur les ouvrages à prétention rationnellement discursive (que nous réduisons un peu abusivement aux textes philosophiques, car il faudrait y inclure les textes de droit, les textes de présentation des arts et techniques, et tous ceux dont la prétention à la rationalité scientifique est fragile).

Il se propose, pour un quelconque de ces ouvrage (ici le Discours de la Méthode sert d’illustration), de fournir à un lecteur, muni des moyens informatiques capables de gérer une masse importante de fichiers textuels (par support cdrom et alii ou par accès au web), les conditions optimisées pour qu’il puisse juger lui-même de ce texte selon les règles de la rationalité discursive : un esprit critique et bienveillant, proche du surmoi intellectuel que décrit Bachelard. Il fournit des conditions optimisées de lecture ; laisse ouvertes toutes les considérations de ce qui est signifiant ; fournit un accès discret mais très organisé des notes ; propose, de manière organisée aussi, les passages d’autres textes susceptibles d’aider à la compréhension, eux-mêmes inclus dans le contexte des ouvrages dont ils sont tirés. S’il permet une recherche textuelle rudimentaire, on peut espérer des possibilités de recherches indexatives plus élaborées ; enfin, il offre la possibilité au lecteur d’inscrire sa propre lecture à titre personnel ou de manière publique. Hors la recherche documentaire, tout cela n’est qu’une question de liens et de fenêtres, des liens pour lesquels on exige une organisation en types, des fenêtres que l’on contraint à être hiérarchisées et ordonnées.

Cet ensemble de liaisons a pour finalité de fournir toutes les informations disponibles sur chaque parcelle du texte, avec comme seul a priori sélectif les choix de l’utilisateur lui-même (par exemple, options : n’indiquer que les sources, que les textes cartésiens…).

L’originalité du produit ne tient ni au travail lexical ou documentaire, ni aux informations globales fournies, ni à la présentation hyper textuelle des notes mais :

  • à la mise à disposition des sources, de leurs références et, dans la mesure du possible, des textes référés eux-mêmes (en général peu accessibles) ;
  • à la mise à disposition simultanée de toutes les possibilités d’approche du texte (ce qui précède n’étant pas exhaustif) ;
  • à la possibilité par l’utilisateur d’enrichir les bases de données ;
  • à la possibilité à terme de naviguer d’un texte à l’autre, avec retour récursif possible, évidemment ;
  • à la mise en place de qualités ergonomiques nouvelles

L'état des applications

Les réalisations pratiques se sont faites à 3 niveaux.

  • Constitution d’une base des données.
  • Mise en place générale « bricolée » des fonctionnalités proposées ci-dessus.
  • Présentation ergonomique des données, limitée à la présentation des liens hypertextuels.

Il n’est pas possible de les décrire ici avec précision. Tout au plus, pouvons-nous en présenter une esquisse.

Les données (B. Hufschmitt et D. Mercier)

Les textes

Les textes que l’on peut consulter ont été diversement implantés, sous forme de fichiers textes ou sous forme de fichiers images.

Des fichiers textes numérisés par ailleurs :

  • La plus grande partie du corpus cartésien,
  • Les Essais de Montaigne,
  • De la Sagesse de Charron,
  • Divers textes de Cicéron, Sénèque, Epictète, Platon…,
  • Les Confessions de Saint Augustin,
  • La Somme théologique et la Somme contre les Gentils de Saint Thomas,
  • Le Novum Organum de Bacon.
  • Les Idylles d’Ausone
  • Le livre I de la Vie de Descartes de Baillet…

Des fichiers textes numérisés par nos soins :

  • Les notes de commentaire au Discours de Gilson,
  • Les notes sur le Discours de Alquié
  • Les extraits mis en note au Discours dans l’édition de Minos.
  • Le Ratio Studiorum des pères Jésuites
  • La Dissertatio de Descartes
  • De multiples extraits de textes plus ou moins longs : Métaphysique, Ethique de Nicomaque, Seconds Analytiques d’Aristote ; livre II de la Vie de Descartes de Baillet, Descartes et Pascal lecteurs de Montaigne de Brunschvicg, La découverte métaphysique de l’homme chez Descartes de Alquié, une partie du Petit Glossaire des Classiques Français de Huguet

Des fichiers images numérisés par nos soins :

  • Environ 170 extraits d’œuvres de la scolastique tardive (Saint Thomas, Les pères de Coimbre, Eustache de saint Paul, Suarez…) proposées par Gilson dans son Index Scolastico-Cartésien.
  • 44 pages de la Defensio Cartesiana de Clauberg.

La base de données des liens entre le Discours et les autres ouvrages

Il s’agit d’une base relationnelle dont les fichiers principaux définissent les liens (6115 enregistrements), les notices ou textes au sens logique (618 enregistrements), les documents ou ouvrages au sens matériel (367 enregistrements), les références tirées de la BNF (335 enregistrements)… Nous mentionnerons seulement un thesaurus cartésien d’environ trois cents entrées élaboré par nos soins il y a quelques années à partir d’une compilation des divers index,listes d’autorités… issus des éditeurs cartésiens.

Autres données

Nous mentionnerons seulement un thesaurus cartésien d’environ trois cents entrées élaboré par nos soins il y a quelques années à partir d’une compilation des divers index,listes d’autorités… issus des éditeurs cartésiens.

La présentation générale provisoire (B. Hufschmitt)

Figure 1 : Page d’entrée

Elle présente l’essentiel des fonctionnalités présentées ci-dessous, mais de manière rudimentaire. Elle gère l’ensemble de la base des données.

Cette présentation est destinée à être abandonnée au profit de la présentation suivante, la base des données étant non seulement conservée, mais corrigée et améliorée : récupération de textes et liaisons, amélioration des présentations images, intégrations de nouveaux liens à partir de notes d’autres commentateurs.

La présentation ergonomique des liens (C. Clément et I. Roxin)

Pour l’implémentation des liens hypertextuels, afin d’assurer un mécanisme de codification universel, nous avons choisi le langage XML - langage de balisage extensible.

Figure 2 : Représentation graphique du modèle défini par le schéma XML (avec XMLSpy)

XML, la nouvelle base du document électronique, est une technique de modélisation normalisée qui assure modularité, interopérabilité, pérennité et navigation évoluée pour les applications complexes. De plus, le modèle DOM permet de définir assez facilement des implémentations du noyau XML dans tous les langages de programmation.Les noms de procédures, méthodes et fonctions étant normalisés, il est assez facile de passer d'un langage à un autre.

La plupart des mécanismes techniques utilisés aujourd'hui sur le Web (meta-moteurs, robots, agents intelligents, interfaces auto-adaptatives, cartographie dynamique, visualisation 3D, web dynamique,...) font grand usage de flux de données XML afin d’assurer la plus grande efficacité possible à la coopération et la participation collaborative entre systèmes fonctionnels distincts. Ce qui nous conforte dans notre choix.

Figure 3 : Interface de navigation dans le projet Descartes

Dans une navigation hypertextuelle, le lecteur a souvent une sensation de désorientation[17]. Les éléments qui génèrent cette désorientation « sont son aspect non désiré ; le caractère limité de la mémoire des individus ; les métaphores de la spatialité pour expliquer l'effet produit ; la dimension de perte et le manque d'acculturation de l'usager-lecteur » [FRID]. Pour éviter dans notre projet cet effet de désorientation, le texte du Discours, colonne vertébrale de l’application et source des liens hypertextuels, est toujours présent sur la moitié gauche de l’écran (proposé en format vectoriel, ce texte peut être réduit et agrandi à volonté). Sur la partie droite de l’écran apparaissent les textes liés après activation des liens par le lecteur. Tous ces textes sont présents en version intégrale dans la base de données, mais ils apparaissent « ouverts » à la page dont le contenu fait référence au lien activé. L’utilisateur peut alors se contenter de consulter le passage concerné ou parcourir l’intégralité du texte dans lequel il se déplace classiquement grâce à un ascenseur.

La suite envisagée

La réalisation aux normes du web2 (I. Roxin)

Pour valoriser cette expérience dans l’étape suivante du projet Descartes, nous nous efforcerons de proposer plusieurs métaphores pour l’interface de navigation. Nos recherches vont se diriger vers des représentations en 3D avec possibilité de zoom et de déplacements semblables à ceux que peut offrir un monde virtuel.

A partir des métadonnées enregistrées pour différents textes (et pas seulement ceux de Descartes) plusieurs visualisations interactives permettront de naviguer à différents niveaux d’abstraction. Ainsi, on peut imaginer une véritable cartographie des idées. Les idées évoluant, migrant et contaminant de nouveaux espaces, il n’est pas interdit de projeter des cartographies synchroniques et diachroniques pour figurer des états à des instants donnés ou, au contraire représenter les glissements et les filiations qui définissent l’histoire des idées.

Une telle réalisation suppose l’utilisation d’une ou plusieurs ontologies. Par ailleurs, des outils de recherche et d'analyse lexicométriques peuvent être appliqués à ce corpus pour mettre en évidence des convergences ou des corrélations qu'une simple lecture laisserait dans l'ombre. Sachant que toute la sémantique ne sera pas nécessairement exprimée dans ces ontologies, nous proposerons aussi des techniques d’analyse conceptuelle reposant sur la création et l’exploitation de treillis de concepts (treillis de Galois). Ensuite, pour regrouper les concepts nous pourrons faire appel aux techniques de clustering (regroupement des concepts) ou de filtrage (sélection des concepts les plus pertinents).

Dans ce contexte, nos perspectives de recherche vont s’orienter vers :

  • a) l’utilisation des langages de déclaration de la sémantique des contenus : comment peut-on articuler des langages de type XML, RDF, MPEG-7/DDL avec des ressources ontologiques (OWL) ?
  • b) l’automatisation de la construction de représentations conceptuelles et d’ontologies : comment combiner et valoriser les techniques semi-automatiques d’ingénierie des connaissances travaillant à partir de corpus, les techniques de data mining, les techniques basées sur des analyses statistiques de thesaurus ?
  • c) la gestion des connaissances et la navigation « intelligente » : comment valoriser les services rendus par le Web sémantique en liaison avec les différents usages qu’il suscite ? (faire le pont entre indexation et annotation)

L’approche lexicométrique (J.M. Leblanc)

L’étape que nous proposons ensuite consiste en une analyse lexicométrique du Discours de la méthode puis de l’œuvre de Descartes dans son ensemble, si tant est que l’on puisse prétendre à l’exhaustivité. Une série d’outils logiciels[18] sera éprouvée, comparée, appliquée à ce volumineux corpus dans le but d’en tirer la substantifique moelle mais aussi de mettre en place des procédures automatisées que nous reproduirons par la suite au corpus Descartes mais aussi à d’autres données textuelles, de préférence d’ordre philosophique.

L’utilisation du logiciel Alceste[19], nous permettra par exemple d’identifier les thématiques saillantes de l’ensemble de l’œuvre puis de chaque sous corpus. (On entendra par sous corpus les différentes partitions que l’on prendra en compte comme les correspondances, le discours de la méthode, les méditations philosophiques…) D’autres procédures portant sur la proximité entre les énoncés pourraient être envisagées à partir de ce premier traitement statistique et adaptés à notre problématique particulière.

On se posera ensuite la question des proximités et éloignements, des grandes oppositions qui sous tendent le corpus, dans les différentes parties que l’on a énumérées précédemment. Analyse factorielle des correspondances portant sur le tableau lexical entier (Lexico 3), calcul de la distance lexicale ou de connexion intertextuelle (Hyperbase), classifications automatiques, nous permettront de poser les premiers jalons d’une typologie de l’œuvre cartésienne.

Ces analyses multidimensionnelles portant sur le lexique pourront également faire apparaître les formes les plus contributives que l’on pourrait envisager par la suite sous la forme de représentations tri-dimensionnelles. On s’attachera également à comparer Descartes à d’autres philosophes afin de disposer d’une norme exogène.

Les mots les plus contributifs de ces représentations et les classes sémantiques établies par Alceste nous fourniront les pôles de cooccurrents essentiels de l’étape suivante.

L’approche cooccurrentielle est en effet le point primordial de cette phase lexicométrique. Elle pourra être contrastive et porter sur la comparaison des cooccurrents d’un même pôle dans les différentes parties du corpus Descartes mais aussi chez d’autres philosophes. (Lexico 3 et les cooccurrents spécifiques, tri croisé sous Alceste, lexicogrammes sous Weblex). De cette approche pourrait naître une ébauche de cartographie des idées, du moins sur le principe. Il conviendra de réfléchir à l’unité minimale appropriée et d’opter pour des données lemmatisées ou non, voire d’envisager une procédure d’annotation. Tropes pourrait ici être mobilisé, à condition d’en modifier les ontologies. Ses sorties pourraient éventuellement être redirigées vers d’autres outils ou analyses multidimensionnelles.

C’est également vers la recherche de cooccurrences multiples[20] que nous nous orienterons, pour la production automatique de liens ainsi que pour l’automatisation des l’annotation. C’est cet aspect en particulier qui nous permettra de lever l’ambiguïté sur certain emplois mais aussi d’assurer le passage vers la phase suivante de notre étude en termes de web sémantique.

L’analyse textuelle automatisée achevée - pour ne pas parler ici de la seule lexicométrie au sens strict - la dernière phase pourra être engagée, celle de la modélisation et de l’automatisation des procédures.

Conclusion

Nonobstant toutes les insuffisances de cette réalisation, nous soutenons que le projet même est d’un intérêt réel pour l’étude d’un texte classique de philosophie, et plus généralement d’un texte argumentatif quelconque à prétention argumentative, d’un intérêt moindre pour d’autres types de textes. En effet, si une part des fonctionnalités vaut pour tout texte (présentation, comparaison des éditions…), la confrontation aux sources possibles, aux remarques explicatives ou commentatives, au contexte lexical ou conceptuel du corpus permet avant tout de juger de la valeur argumentative du texte (ou des textes de commentaire) dans sa cohérence propositionnelle et sa rigueur terminologique. L’informatique, et plus particulièrement les liaisons hypertextuelles mettent à disposition des instruments de travail nouveaux, dont le manque se manifeste à l’évidence lors de la lecture des ces remarquables « proto-hypertextes » que sont le Commentaire au Discours de la Méthode et l’Index scolastico-cartésien de Gilson.

Références bibliographiques

Ouvrages

[CHAR] CHARTIER Roge,  « Lecteur et lecture à l’âge de la textualité électronique » in ORIGGI Gloria et ARIKHA Noga (dir) : Text-e. Le texte à l’heure de l’Internet. B.P.I ; 2003.

[AT] DESCARTES : Oeuvres complètes, 11 volumes ; Paris, Vrin, 1996.

[DESC] DESCARTES René : Discours de la Méthode, texte et commentaire par Etienne GILSON, Vrin, 1967.

[ERTZ] ERTZCHEID, O et ,  « De la note de bas de page au lien hypertexte : philosophie de l’identique et stylistique de l’écart », in http://archivesic.ccsd.cnrs.fr/sic_00000998/en/. 2004

[FRID] FRIDMAN, Viviana,  Hypertexte et écriture de la désorientation, Journées d’étude Franco-Canadiennes sur les écritures électroniques, 15-17 mai 2002, Université de Paris 8

[GENE] GENETTE, G,  Palimpsestes. La littérature au second degré, Seuil, 1982

[GHIT] GHITALLA Frank, BOULLIER Dominique, GKOUSKOU-GIANNAKOU Pergia, LE DOUARIN Laurence et NEAU Aurélie,  L’Outre-Lecture, manipuler, s’approprier, interpréter le Web. BPI, Paris, 2003.

[GILS] GILSON Etienne,  Index Scolastico-cartésien, Paris, Alcan, 1912

[HERM] HERMAN Jan,  « Quand un texte se dé-livre. Romans et préfaces du XVIIIème face à l’ordinateur » in FERRAND Nathalie (dir) : Banques de données et hypertexte pour l’étude du roman, PUF, 1997

[HUFS1] HUFSCHMITT Benoit,  « Univocité documentaire en philosophie, une piste de recherche » in GRISELIN, M. et alii (dir.) : Multimédia et construction des savoirs ; Besançon, PUFC, 2000.

[HUFS2] Hufschmitt, Benoit,  Du Texte à l’hypertexte argumentatif. Colloque Besançon, Mars 2003 ; http://www.utbm.fr/index.php : liens : publications, colloques, technologie et formation.

[IORI] IORIO Paolo d’ (dir),  HyperNietzche ; PUF ; 2000.

[LEBR] LEBRAVE Jean-Louis,  « Hypertexte et édition génétique : l’exemple d’Hérodias de Flaubert » in FERRAND Nathalie (dir) : Banques de données et hypertexte pour l’étude du roman, PUF, 1997.

[VAND] VANDENDORPE Christian,  Du papyrus à l’hypertexte. Essai sur les mutations du texte et de la lecture. La Découverte, 1999.

[VUIL] VUILLEMIN Alain,  « La lecture interactive et ‘l’écri-lecture’ » in VUILLEMIN Alain et LENOBLE Michel (dir) : Littérature, informatique, lecture, PULIM, 1994.

Sites

[HYPE] HYPERNIETZSCHE : http://www.hypernietzsche.org/

[AGOR] AGORA PHILOSOPHIQUE : http://www.agora.qc.ca/mot.nsf/Dossiers/Rene_Descartes (page consacrée à Descartes)

cdroms

[PAST] PAST MASTERS : Oeuvres complètes de Descartes ; 2002 InteLex Corporation. Présentation in http://www.nlx.com/titles/titlrdod.htm

[GUEH] GUEHO, Fabrice et NOVAL, Fabrice,  DESCARTE. Vie, philosophie et œuvres, CD-ROM DESCARTE. Vie, philosophie et oeuvres. Une édition électronique complète des oeuvres de Descartes avec une introduction vivante à sa vie et à sa pensée. Joliciel, Noisel, 1996.

[CHRE] CHRETIEN, Claude (dir.),  Descartes construire la connaissance, la pensée d’un précurseur de la science moderne et l’Europe du XVIIème, Ed. COSEI 1996.

[SPIN] SPINOZA : Lire l'Ethique de Spinoza (5 versions sur cdrom : Boulainvilliers 18ème, Elwes 1883, Gebhardt 1924, Guérinot 1930, Saisset 1842), Phronesis, 1998.

Notes

  1. Les remarques générales sur ce sujet sont fréquentes [ VAND],[CHAR, 19 sq.]. Les illustrations sur le Web ou sur cdrom de certaines approches sont légion (arborescence, aide lexicale, éditions comparées). Notre originalité se réduit à la mise à disposition simultanée de toutes les approches repérées (dans le contexte d’un ouvrage philosophique) et à la gestion des références explicatives et commentatives. Aucun site, à notre connaissance, ne dépasse les quelques pages de présentation de l’auteur (celui de l’Agora Philosophique par exemple [AGOR]). Un site, cependant, nous a été signalé récemment, HyperNietzsche [HYPE], qui semble proche de notre projet. Une étude un peu attentive indique que ce n’est pas le cas, relevant avant tout d’un projet éditorial ambitieux autant que salutaire et de la volonté de restituer au plus près la réalité de l’écriture chaotique de Nieszche, alors que notre texte est clairement fixé depuis ses origines. Il relève de même d’une conception très différente du texte philosophique (fournir le texte même et le contexte précis de production de l’auteur) , alors que nous proposons des auxiliaires à l’analyse raisonnée et critique d’un texte qui prétend à la rigueur argumentative. Il n’empêche que ce site propose à sa marge certaines des fonctionnalités que nous avons placées au centre de notre projet (accès aux notes de commentaires et aux textes référés), et réciproquement (présentation en mode image de l’édition originale du Discours). Pour une présentation un peu plus théorique de notre projet cf.[HUFS1 ], de celui de l’Hypernietzsche cf. [IORI] et les divers documents fournis en ligne sur le site.
  2. Edition Adam-Tannery des Œuvres de Descartes [AT ] : 1897-1913, Index Scolastico-cartésien de Gilson [GILS] : 1912, édition du Discours par Gilson [DESC ] : 1926, Correspondance de Descartes par Adam et Milhaud : 1936-1941. Outre le cdrom Past master [PAST] qui fournit la plus grande partie de l’œuvre cartésienne (avec des possibilités de recherche lexicale par formules booléennes), deux cdrom hypertextuels concernant Descartes ont été produits au milieu des années 90 [GUEH,CHRE], dans une approche habituelle des hypertextes.
  3. Cette complémentarité est notée dans l’introduction de [GHIT , p. 21] et compose la plus grande partie de sa conclusion [GHIT, p. 217 sq.].
  4. Par exemple, Gilson indiquant à propos des mots « Le bon sens est la chose au monde… » que Montaigne (Essais, livre II, chap. XVII, tome II, p. 443 de l’édition Strowski) est sans doute une source d’inspiration pour Descartes, une action de la souris sur ce passage doit fournir la référence, une autre action afficher le texte lui-même, correctement positionné dans l’ouvrage.
  5. Cf. le cdrom : Lire l’Ethique de Spinoza [SPIN].
  6. Se pose ici le problème du droit à user de ces numérisations. Pour tempérer, nous avons dégradé volontairement les fichiers de Past-Master en éliminant tous les dessins et images.
  7. En quelques mots, outre évidemment l’exactitude du texte et la présentation des diverses versions, nous retenons avant tout l’aide à la compréhension du vocabulaire par appel aux autres contextes d’usage dans le corpus, aux choix de traductions, aux usages d’époque (dictionnaires et textes littéraires), aux usages dans d’autres ouvrages que l’auteur pourrait avoir en tête… ; ainsi que l’aide à l’appréciation de la rigueur argumentative, en utilisant outre les possibilités précédentes, les propositions de plan et la présentation des commentaires ponctuels.
  8. Christian VANDENDORPE indique que les responsabilités d’édition sont transférées vers le lecteur [VAND,p 90.
  9. Gallica propose un large éventail de numérisation image de textes originaux, mais pas le Discours de la Méthode lui-même.
  10. Encore que des détails distinguent l’édition Cousin et l’édition A.T. De même, Alquié corrige l’édition A.T.
  11. Il s’agit de la traduction de E. de Courcelles qui a également traduit les deux premiers essais.
  12. On soutiendra peut-être qu’il s’agit d’une autre œuvre, mais c'est oublier que l’auteur a pris la décision de conserver le titre et de nommer le texte traduction. Il y a cependant une alternative : soit la traduction relève d’une édition remaniée et elle doit être considérée comme édition nouvelle, soit elle prétend respecter au mieux l’original, et son intérêt tient alors aux clarifications que permettent les variations de contraintes linguistiques.
  13. On peut soutenir que la distinction faite entre les séparations des paragraphes fournit un niveau supplémentaire d’organisation, surtout si l’on se souvient de l’importance que Descartes accordait à la forme paragraphe.
  14. Nous avons développé ailleurs [ HUFS2] l’ébauche d’une typologie des notes : selon qu’elles viennent de l’auteur, d’un éditeur, d’un traducteur, d’une commentateur…, selon l’édition où elles apparaissent, selon leur finalité… Christian VANDENDORPE ébauche cette analyse en distinguant les notes de contenu et les notes de citation [VAND, p. 167]. O. Ertscheid propose une étude approfondie sur les rapports entre la note en bas de page et le lien hypertextuel [ERTS]. Il est en outre tentant, à partir de la catégorisation issue de l’analyse sans cesse rappelée de Genette [ GENE, p.8-14], de distinguer entre les liaisons fournies par les notes selon les genre para-textuel (plan, voire conditions de présentation), méta-textuel (commentaires), hyper-textuel (variantes comme hypo-textes), et inter-textuel (sources). Par contre l’archi-textuel y est fort discret, et les très nombreuses clarifications lexicales et conceptuelles sont dispersées sur trois genres.
  15. Avec les réserves indiquées ci-dessus.
  16. Nous avons entrepris un tel travail de conceptualisation et de catégorisation avec M. Alain Lelu et son logiciel Neuronav (publication à venir). Les résultats se sont révélés certes prometteurs (cette analyse syntaxique rejoint des remarques de commentateurs), mais inexploitables et inutiles (ils restent grossiers et en partie inacceptables, même au prix d'une importante bonne volonté interprétative). M. Jean-Marc LEBLANC reprend ce type de travail à l'aide d'une batterie fournie de divers logiciels d'analyse factorielle adaptée à la lexicologie.
  17. « La désorientation peut ne pas être considérée comme un problème, mais comme un espace de stimulation et même une source de plaisir. La désorientation peut être ainsi vécue comme une expérience esthétique, expérience qui produirait un effet cognitif positif lié aux effets de contradiction, de discontinuité, de hasard. La désorientation apparaît comme un effet propre à l'hypertexte, souvent perçu comme conséquence de l'application des mêmes paramètres de lecture des livres aux hypertextes. » [FRID ]
  18. Les outils : Neuronav, certes mais aussi Tropes, Alceste, Lexico3, Hyperbase, Weblex. Nous serons probablement amenés à construire certains outils ou fonctionnalités complémentaires.
  19. Segmentant le corpus en énoncés, Alceste classe ces derniers en fonction de la distribution de leur vocabulaire, selon une procédure de classification descendante hiérarchique. On obtient ainsi des « mondes lexicaux » selon la terminologie de Max Reinert, concepteur du logiciel. L’originalité de la démarche est que les classes sont identifiées de façon inductive, indépendamment de partitions préétablies, comme c’est le cas en « lexicométrie classique ».
  20. On pourra considérer que la démarche Alceste relève de la recherche de cooccurrences multiples.