CIDE (2009) Slodzian : Différence entre versions

De CIDE
imported>Abdelhakim Aidene
imported>Jacques Ducloy
(Notes)
 
(38 révisions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
 
{{Titre page article
 
{{Titre page article
  |titre=Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes.
+
  |titre=Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes
 
}}
 
}}
 
{{CIDE boîte bibliographique|texte=
 
{{CIDE boîte bibliographique|texte=
;titre: [[A pour titre::Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes.]]
+
;titre: [[A pour titre::Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes]]
 
;auteurs: [[A pour premier auteur::Monique Slodzian]] (1), [[A pour auteur::Mathieu Valette ]] (2).
 
;auteurs: [[A pour premier auteur::Monique Slodzian]] (1), [[A pour auteur::Mathieu Valette ]] (2).
;Affiliations:
+
;Affiliations :
: (1):[[A pour affiliation auteur:: CRIM-ERTIM (EA 2520) INaLCO]], [[Paris]]
+
: (1) [[A pour affiliation auteur:: CRIM-ERTIM (EA 2520) INaLCO]], [[Paris]]
: (2) :[[A pour affiliation auteur:: ATILF (UMR 7118) CNRS]], [[A pour affiliation auteur::Art Diagnosis Centre]], [[A pour affiliation auteur::63071 Ormylia]], [[Greece]]
+
: (2) [[A pour affiliation auteur:: ATILF (UMR 7118) CNRS]], [[A pour affiliation auteur::Art Diagnosis Centre]], 63071 [[Ormylia]], [[Grèce]]
 
;In:[[Est dans les actes::CIDE 2009 Montréal|CIDE.12 (Montréal)]], 2009
 
;In:[[Est dans les actes::CIDE 2009 Montréal|CIDE.12 (Montréal)]], 2009
 
;En PDF : [[Media:CIDE (2009) Slodzian.pdf|CIDE (2009) Slodzian.pdf]]
 
;En PDF : [[Media:CIDE (2009) Slodzian.pdf|CIDE (2009) Slodzian.pdf]]
Ligne 26 : Ligne 26 :
  
 
}}
 
}}
 +
{{CIDE travaux|texte=article à améliorer}}
 
{{CIDE début corps}}
 
{{CIDE début corps}}
  
Ligne 51 : Ligne 52 :
  
  
3 Faire parler les textes
+
==Faire parler les textes==
  
3.1 La pertinence en jeu
+
=== La pertinence en jeu===
 
La dichotomie objectivité vs subjectivité qui présuppose l’existence de
 
La dichotomie objectivité vs subjectivité qui présuppose l’existence de
 
« normes scientifiques » actualisées par des méthodes, des standards et des pratiques devient à son tour un critère déterminant de démarcation entre « bonne » et « mauvaise » science. Au-delà des enjeux juridiques et économiques sous-jacents à ce débat, nous nous intéressons à sa dimension épistémologique. Cette dernière est en effet déterminante si l’on considère les textes comme lieux de production de l’information. Plus particulièrement, la catégorisation des genres textuels (par exemple scientifique vs vulgarisé) pose directement la question de la possibilité de discriminer les textes scientifiques et pseudo-scientifiques. Autrement dit, y a-t-il des caractéristiques formelles stables et généralisables qui permettent de distinguer un texte scientifique d’un texte pseudo- scientifique? A priori, la présence de tableaux statistiques ou d’indices de quantification et de bibliographie (parmi d’autres traits) semble caractérisante de textes présentant une valeur de vérité forte. Or, la fabrication d’une argumentation pseudo-scientifique consistera précisément à exhiber ces indices, parmi d’autres, de telle sorte qu’il sera impossible de trancher tant la conformité à la forme attendue est confondante. La question du vrai/faux, qu’on la considère comme pastiche ou sorte de spam, invite à prendre la textualité au sérieux. Le cas limite du « faux » – problème général posé aujourd’hui au Web – impose que l’on s’appuie sur une sémantique des textes élaborée, tant il est vrai qu’une liste finie de mots clés (concepts homologués du domaine) et de procédés rhétoriques externes (figures de style obligées) ne suffisent pas pour produire une analyse des textes suffisamment pertinente.
 
« normes scientifiques » actualisées par des méthodes, des standards et des pratiques devient à son tour un critère déterminant de démarcation entre « bonne » et « mauvaise » science. Au-delà des enjeux juridiques et économiques sous-jacents à ce débat, nous nous intéressons à sa dimension épistémologique. Cette dernière est en effet déterminante si l’on considère les textes comme lieux de production de l’information. Plus particulièrement, la catégorisation des genres textuels (par exemple scientifique vs vulgarisé) pose directement la question de la possibilité de discriminer les textes scientifiques et pseudo-scientifiques. Autrement dit, y a-t-il des caractéristiques formelles stables et généralisables qui permettent de distinguer un texte scientifique d’un texte pseudo- scientifique? A priori, la présence de tableaux statistiques ou d’indices de quantification et de bibliographie (parmi d’autres traits) semble caractérisante de textes présentant une valeur de vérité forte. Or, la fabrication d’une argumentation pseudo-scientifique consistera précisément à exhiber ces indices, parmi d’autres, de telle sorte qu’il sera impossible de trancher tant la conformité à la forme attendue est confondante. La question du vrai/faux, qu’on la considère comme pastiche ou sorte de spam, invite à prendre la textualité au sérieux. Le cas limite du « faux » – problème général posé aujourd’hui au Web – impose que l’on s’appuie sur une sémantique des textes élaborée, tant il est vrai qu’une liste finie de mots clés (concepts homologués du domaine) et de procédés rhétoriques externes (figures de style obligées) ne suffisent pas pour produire une analyse des textes suffisamment pertinente.
 +
 
S’il est vrai, comme le suggère Gloria Origgi, que « la vérification directe de l’information n’est tout simplement pas possible à des coûts raisonnables », ce passage à une ère d’informations de vérité faible est porteur de risques socioculturels incommensurables. Face à la crise annoncée, des outils opératoires nouveaux doivent être proposés,  faisant
 
S’il est vrai, comme le suggère Gloria Origgi, que « la vérification directe de l’information n’est tout simplement pas possible à des coûts raisonnables », ce passage à une ère d’informations de vérité faible est porteur de risques socioculturels incommensurables. Face à la crise annoncée, des outils opératoires nouveaux doivent être proposés,  faisant
  
 
appel à des approches transdisciplinaires demeurées à la lisière des travaux sur l’ingénierie des connaissances. En proposant la description de parcours interprétatifs assignant un ou plusieurs sens à un texte, la sémantique des textes, ouverte au document dans la perspective du numérique (RTP.DOC, 2006), affirme sa capacité à tracer et hiérarchiser les subjectivités qui traversent les textes et, en cela, à assumer leur part d’objectivation.
 
appel à des approches transdisciplinaires demeurées à la lisière des travaux sur l’ingénierie des connaissances. En proposant la description de parcours interprétatifs assignant un ou plusieurs sens à un texte, la sémantique des textes, ouverte au document dans la perspective du numérique (RTP.DOC, 2006), affirme sa capacité à tracer et hiérarchiser les subjectivités qui traversent les textes et, en cela, à assumer leur part d’objectivation.
 +
 
Par objectivation nous ne supposons pas une extraction immédiate de connaissances déliées des textes et de leurs interprétations possibles, comme le suggèrent les approches prescriptives en produisant des listes de mots censés livrer sans médiation les connaissances d’un texte. Nous posons au contraire la nécessité de passer par des procédures d’analyse pour faire émerger et caractériser les connaissances d’un texte en tenant compte de ses conditions de production et d’interprétation (ordre herméneutique), si l’on veut assurer leur pertinence par rapport à une tâche donnée.
 
Par objectivation nous ne supposons pas une extraction immédiate de connaissances déliées des textes et de leurs interprétations possibles, comme le suggèrent les approches prescriptives en produisant des listes de mots censés livrer sans médiation les connaissances d’un texte. Nous posons au contraire la nécessité de passer par des procédures d’analyse pour faire émerger et caractériser les connaissances d’un texte en tenant compte de ses conditions de production et d’interprétation (ordre herméneutique), si l’on veut assurer leur pertinence par rapport à une tâche donnée.
 +
 
Cette approche impliquant l’ordre herméneutique est incompatible avec  la philosophie sous-jacente à l'Internet des objets qui se réduit à l'ordre référentiel ou, au mieux, à l'ordre communicationnel. Il y a là un débat de fond à mener.
 
Cette approche impliquant l’ordre herméneutique est incompatible avec  la philosophie sous-jacente à l'Internet des objets qui se réduit à l'ordre référentiel ou, au mieux, à l'ordre communicationnel. Il y a là un débat de fond à mener.
  
3.2 La sémantique du document dans les SOC
+
=== La sémantique du document dans les SOC===
 +
 
 
La notion de document, défini comme "une artefact médiateur à dominante sémiotique inséré dans des flux transactionnels" qui nous vient des STIC (Zacklad et al., 2007) s’accompagne d’une vision ouverte de l’ingénierie des systèmes d’information à partir d’une réflexion nouvelle sur le processus de documentarisation. La théorie du document qui en émane met en avant « la recherche d’une complémentarité entre SOC hétérogènes, impliquant un rapprochement plus grand entre champs et secteurs différents ». On y trouve une invitation à construire  une approche unifiée des espaces sémiotiques ouverts par les TIC, à partir de la notion de co-production sémiotique.
 
La notion de document, défini comme "une artefact médiateur à dominante sémiotique inséré dans des flux transactionnels" qui nous vient des STIC (Zacklad et al., 2007) s’accompagne d’une vision ouverte de l’ingénierie des systèmes d’information à partir d’une réflexion nouvelle sur le processus de documentarisation. La théorie du document qui en émane met en avant « la recherche d’une complémentarité entre SOC hétérogènes, impliquant un rapprochement plus grand entre champs et secteurs différents ». On y trouve une invitation à construire  une approche unifiée des espaces sémiotiques ouverts par les TIC, à partir de la notion de co-production sémiotique.
 +
 
Le processus de documentarisation ainsi décrit propose un couplage texte/document où les approches de la sémantique interprétative peuvent trouver leur légitimité, en même temps qu’elles s’y verront confrontées à une dimension sémiotique nouvelle susceptible de renouveler le concept de texte. Il s’agira en particulier de voir comment des approches relevant respectivement d’une sémiotique du document et d’une sémantique du texte peuvent converger.
 
Le processus de documentarisation ainsi décrit propose un couplage texte/document où les approches de la sémantique interprétative peuvent trouver leur légitimité, en même temps qu’elles s’y verront confrontées à une dimension sémiotique nouvelle susceptible de renouveler le concept de texte. Il s’agira en particulier de voir comment des approches relevant respectivement d’une sémiotique du document et d’une sémantique du texte peuvent converger.
Nous tenterons maintenant de démontrer la possibilité de cette convergence en soumettant quelques propositions méthodologiques susceptibles d’intéresser ceux qui, dans la communauté STIC, partagent avec nous une vision « constructiviste » des connaissances et confèrent au
 
  
texte/document un statut herméneutique en rupture avec les descriptions strictement référentielles.
+
Nous tenterons maintenant de démontrer la possibilité de cette convergence en soumettant quelques propositions méthodologiques susceptibles d’intéresser ceux qui, dans la communauté STIC, partagent avec nous une vision « constructiviste » des connaissances et confèrent au texte/document un statut herméneutique en rupture avec les descriptions strictement référentielles.
  
  
4 Le texte comme système d’organisation des connaissances ?
+
==Le texte comme système d’organisation des connaissances ?==
 +
 
 
Dire que le texte est un SOC introduit un débat entre linguistique et ingénierie des connaissances. En effet, si la pratique de l’extraction de terminologies ou d’ontologies à partir de textes donne à penser que le texte est un espace de collecte privilégié, il serait faux de le considérer seulement comme le terrain d’actualisation des concepts : les concepts ne préexistent pas aux textes, ils sont des îlots, des zones stables de sens construits, élaborés dans les textes et par les textes. C’est pourquoi la textualité exerce des contraintes fortes sur l’élaboration des concepts.
 
Dire que le texte est un SOC introduit un débat entre linguistique et ingénierie des connaissances. En effet, si la pratique de l’extraction de terminologies ou d’ontologies à partir de textes donne à penser que le texte est un espace de collecte privilégié, il serait faux de le considérer seulement comme le terrain d’actualisation des concepts : les concepts ne préexistent pas aux textes, ils sont des îlots, des zones stables de sens construits, élaborés dans les textes et par les textes. C’est pourquoi la textualité exerce des contraintes fortes sur l’élaboration des concepts.
 +
 
D’une manière générale, la production et l’interprétation des textes sont soumises à des contraintes tant linguistiques que socioculturelles. Ainsi, les discours et les genres textuels configurent les textes en constituant des ensembles de règles de production et d’interprétation acquises ou apprises, parfois de manière inconsciente.
 
D’une manière générale, la production et l’interprétation des textes sont soumises à des contraintes tant linguistiques que socioculturelles. Ainsi, les discours et les genres textuels configurent les textes en constituant des ensembles de règles de production et d’interprétation acquises ou apprises, parfois de manière inconsciente.
Par exemple, les chercheurs en médecine, eux-mêmes médecins, sont susceptibles de produire, à partir du même contenu informationnel, différents discours : le discours scientifique  (à  l’attention  des chercheurs) ; le discours de la presse médicale (à l’attention des praticiens) et le discours de prévention (à l’attention des patients). Ainsi, au syntagme subtantival « prise de poids », on opposera dans certains textes    institutionnels    « la    forme    verbale    « grossir ».    Plutôt que
 
« surcharge pondérale », on lira par exemple sur un forum de  discussion
 
« être ronde ». En bref, les genres textuels organisent différemment la connaissance et à chaque pratique correspondent des genres particuliers. La prévention contre le tabagisme est fortement médicalisée dans les textes institutionnels, elle ne l’est que marginalement dans les forums de discussion dont l’objectif est pourtant identique3.
 
Dans les textes spécialisés, le genre choisi sélectionne les concepts et les organise en fonction de contraintes textuelles précises. D’une certaine manière, il décide de son niveau de spécialisation en éliminant certains concepts et en en privilégiant d’autres. Par exemple, un texte médical sur le tabagisme utilisera le concept hyperonymique tabac pour « cigarette »,
 
« pipe », « cigare », « narghilé », etc. tandis qu’un texte de vulgarisation privilégiera  les  hyponymes  en  fonction  de  leur  cible    (« cigarette »,
 
  
3 Ces observations proviennent d’études réalisées dans le cadre du projet ANR-07- MDCO-002 C-MANTIC destiné à élaborer des méthodologies et des outils pour l’application de la sémantique de corpus au filtrage des masses documentaires.
+
Par exemple, les chercheurs en médecine, eux-mêmes médecins, sont susceptibles de produire, à partir du même contenu informationnel, différents discours : le discours scientifique  (à  l’attention  des chercheurs) ; le discours de la presse médicale (à l’attention des praticiens) et le discours de prévention (à l’attention des patients). Ainsi, au syntagme subtantival « prise de poids », on opposera dans certains textes    institutionnels    « la    forme    verbale    « grossir ».    Plutôt que « surcharge pondérale », on lira par exemple sur un forum de  discussion « être ronde ». En bref, les genres textuels organisent différemment la connaissance et à chaque pratique correspondent des genres particuliers. La prévention contre le tabagisme est fortement médicalisée dans les textes institutionnels, elle ne l’est que marginalement dans les forums de discussion dont l’objectif est pourtant identique <ref>Ces observations proviennent d’études réalisées dans le cadre du projet ANR-07- MDCO-002 C-MANTIC destiné à élaborer des méthodologies et des outils pour l’application de la sémantique de corpus au filtrage des masses documentaires.</ref>.
  
« tabac à rouler ») et de l’ethos du lecteur supposé (un fumeur de cigarette n’est pas un fumeur de cigare). D’une manière générale, des analyses statistiques révèlent que le texte institutionnel construit un discours distancié, intellectuel quand le texte informel est davantage incarné ; en forçant le trait, on peut dire qu’il faut de la volonté pour s’arrêter dans un texte institutionnel (c’est-à-dire une faculté intellectuelle) et du courage dans un texte informel (c’est-à-dire une actualisation sensible  de la volonté)
+
Dans les textes spécialisés, le genre choisi sélectionne les concepts et les organise en fonction de contraintes textuelles précises. D’une certaine manière, il décide de son niveau de spécialisation en éliminant certains concepts et en en privilégiant d’autres. Par exemple, un texte médical sur le tabagisme utilisera le concept hyperonymique tabac pour « cigarette »,
 +
« pipe », « cigare », « narghilé », etc. tandis qu’un texte de vulgarisation privilégiera  les  hyponymes  en  fonction  de  leur  cible    (« cigarette », « tabac à rouler ») et de l’ethos du lecteur supposé (un fumeur de cigarette n’est pas un fumeur de cigare). D’une manière générale, des analyses statistiques révèlent que le texte institutionnel construit un discours distancié, intellectuel quand le texte informel est davantage incarné ; en forçant le trait, on peut dire qu’il faut de la volonté pour s’arrêter dans un texte institutionnel (c’est-à-dire une faculté intellectuelle) et du courage dans un texte informel (c’est-à-dire une actualisation sensible  de la volonté)
 
De ces exemples rapides, on conclura que les textes relèvent d’une planification de l’information. Cette planification est différentielle dans la mesure où les textes explicitent et organisent des connaissances apparentées de manières différentes. On peut en conséquence se risquer à allouer au textuel le statut de système d’organisation des connaissances.
 
De ces exemples rapides, on conclura que les textes relèvent d’une planification de l’information. Cette planification est différentielle dans la mesure où les textes explicitent et organisent des connaissances apparentées de manières différentes. On peut en conséquence se risquer à allouer au textuel le statut de système d’organisation des connaissances.
  
4.1 Textes, informations et connaissances différentielles
+
===Textes, informations et connaissances différentielles===
 
Pour illustrer notre propos, nous proposons d’étudier brièvement différents discours de prévention contre le tabagisme. Le projet général vise notamment les tabacologues et a pour objectif de mieux connaître les pratiques tabagiques. Pour cela, nous étudierons ici un corpus composé  de deux ensembles : (a) un discours institutionnel composé de sites médicaux (Ligue contre le cancer), de sites de lobbying (OFT) et de site de prévention du tabagisme (Pataclope, qui s’adresse aux adolescents) ou d’aide au sevrage (OFT) et (b) un discours informel, constitué de blog et de forums contre le tabac, sur le sevrage tabagique (Atoute).
 
Pour illustrer notre propos, nous proposons d’étudier brièvement différents discours de prévention contre le tabagisme. Le projet général vise notamment les tabacologues et a pour objectif de mieux connaître les pratiques tabagiques. Pour cela, nous étudierons ici un corpus composé  de deux ensembles : (a) un discours institutionnel composé de sites médicaux (Ligue contre le cancer), de sites de lobbying (OFT) et de site de prévention du tabagisme (Pataclope, qui s’adresse aux adolescents) ou d’aide au sevrage (OFT) et (b) un discours informel, constitué de blog et de forums contre le tabac, sur le sevrage tabagique (Atoute).
 
Sans entrer dans le détail d’une analyse textométrique qui n’est pas ici notre propos, nous tâcherons dans les paragraphes suivant de proposer  des grilles interprétatives générales destinées à mieux circonscrire d’un point de vue linguistique les différences de traitement de l’information et d’organisation ou de production des connaissances, pour une thématique semblable, dans ces deux types de discours. Nous aborderons tour à tour les statuts macroscopiques du texte, de l’information et de la connaissance.
 
Sans entrer dans le détail d’une analyse textométrique qui n’est pas ici notre propos, nous tâcherons dans les paragraphes suivant de proposer  des grilles interprétatives générales destinées à mieux circonscrire d’un point de vue linguistique les différences de traitement de l’information et d’organisation ou de production des connaissances, pour une thématique semblable, dans ces deux types de discours. Nous aborderons tour à tour les statuts macroscopiques du texte, de l’information et de la connaissance.
  
4.1.1 Le statut du texte
+
====Le statut du texte====
  
 +
{| class="wikitable centre" width="80%"
  
 +
|+
  
Sites institutionnels
+
|-
Blogs et forums
+
! scope=col |
Statut
+
! scope=col | Sites institutionnels
 +
! scope=col | Blogs et forums
 +
|-
 +
| width="33%"  align="center"|
 +
Statut  
 +
| width="34%"  align="center"|
 
Objectif (« les fumeurs »)
 
Objectif (« les fumeurs »)
 +
| width="33%"  align="center"|
 
Subjectif (« moi je »)
 
Subjectif (« moi je »)
 +
|-
 +
| width="33%"  align="center"|
 
Zone anthropique
 
Zone anthropique
 +
| width="34%"  align="center"|
 
Distal (« le tabac »)
 
Distal (« le tabac »)
Identitaire et proximal (« une cigarette »)
+
| width="34%"  align="center"|
Fonction
+
Identitaire et proximal(«une cigarette »)
Exposition
+
|-
Construction
+
| width="33%"  align="center"|
 +
Fonction
 +
|width="34%"  align="center"|
 +
Exposition  
 +
| width="34%"  align="center"|
 +
Construction  
 +
|}
 +
 
 +
 
 
Figure 1. Statut différentiel des textes des deux sous-corpus
 
Figure 1. Statut différentiel des textes des deux sous-corpus
  
On observe que les sites institutionnels adoptent une perspective qui se présente comme objective. Ils mettent à distance l’objet. Ainsi, les différents actants des textes sont par exemple « les fumeurs »,  « le  fumeur », « le tabac », « la nicotine », des entités abstraites  correspondant éventuellement à des positions ontologiques. A l’inverse, les forums privilégient la subjectivité. On y relève de nombreux marqueurs identitaires et de coordonnées spatiotemporelles, tels que les pronoms personnels, des déictiques (« moi », « je »). Le tabac ou les substances sont peu actualisées, on leur préfère les objets « clope » ou
+
 
« cigarette » qui correspondent à une pratique concrète (après le repas, on fume une cigarette, pas du tabac). La cigarette, enfin, est un objet personnel qui relève de l’identitaire ou, dans le cas du tabagisme socialisant, du proximal (la relation de soi à l’autre). Le tabac est à l’inverse vu comme une plante, une substance, sa conceptualisation est scientifique donc distale – elle ressortit à une mise à distance.
+
On observe que les sites institutionnels adoptent une perspective qui se présente comme objective. Ils mettent à distance l’objet. Ainsi, les différents actants des textes sont par exemple « les fumeurs »,  « le  fumeur », « le tabac », « la nicotine », des entités abstraites  correspondant éventuellement à des positions ontologiques. A l’inverse, les forums privilégient la subjectivité. On y relève de nombreux marqueurs identitaires et de coordonnées spatiotemporelles, tels que les pronoms personnels, des déictiques (« moi », « je »). Le tabac ou les substances sont peu actualisées, on leur préfère les objets « clope » ou « cigarette » qui correspondent à une pratique concrète (après le repas, on fume une cigarette, pas du tabac). La cigarette, enfin, est un objet personnel qui relève de l’identitaire ou, dans le cas du tabagisme socialisant, du proximal (la relation de soi à l’autre). Le tabac est à l’inverse vu comme une plante, une substance, sa conceptualisation est scientifique donc distale – elle ressortit à une mise à distance.
 +
 
 
Enfin, la fonction des textes institutionnels est exposante. Ils exposent les risques  liés  au  tabagisme  sur  un  mode  dysphorique  (« cancer »,
 
Enfin, la fonction des textes institutionnels est exposante. Ils exposent les risques  liés  au  tabagisme  sur  un  mode  dysphorique  (« cancer »,
 
« maladie », etc.) tandis que les textes informels sont davantage dans la construction d’un savoir, l’élaboration d’une connaissance à partager.
 
« maladie », etc.) tandis que les textes informels sont davantage dans la construction d’un savoir, l’élaboration d’une connaissance à partager.
  
4.1.2 Le statut de l’information
+
====Le statut de l’information====
  
 +
{| class="wikitable centre" width="80%"
  
 +
|+
  
Sites institutionnels
+
|-
Blogs et forums
+
! scope=col |
Statut
+
! scope=col | Sites institutionnels
 +
! scope=col | Blogs et forums
 +
|-
 +
| width="33%"  align="center"|
 +
Statut  
 +
| width="34%"  align="center"|
 
Sanctionnée Haut niveau
 
Sanctionnée Haut niveau
 +
| width="33%"  align="center"|
 
Débattue Bas niveau
 
Débattue Bas niveau
 +
 +
|}
 +
 
Figure 2. Statut différentiel de l’information dans les deux sous-corpus
 
Figure 2. Statut différentiel de l’information dans les deux sous-corpus
 +
  
 
L’information des sites institutionnels est sanctionnée par le corps médical, elle est dite de « haut niveau », les produits de substitution présentés sont par exemple ceux valider par la recherche médicale (ou pharmaceutique) : « substitut nicotinique », « patch » ; « aide médicale »,
 
L’information des sites institutionnels est sanctionnée par le corps médical, elle est dite de « haut niveau », les produits de substitution présentés sont par exemple ceux valider par la recherche médicale (ou pharmaceutique) : « substitut nicotinique », « patch » ; « aide médicale »,
 
« consultation tabacologique », etc. Dans les forums et les blogues, l’information est débattue, dialectisée, les classes sémantiques produites sont davantage liées à des pratiques de sevrage qu’à des catégories générales. On pourrait y trouver pêle-mêle « chewing-gum », « coup de fil à une copine », « verre d’eau », « footing », etc.). L’information n’est pas sanctionnée et peut-être considérée comme de bas niveau (par exemple, un internaute rapporte avoir recouru au cannabis comme substitut nicotinique).
 
« consultation tabacologique », etc. Dans les forums et les blogues, l’information est débattue, dialectisée, les classes sémantiques produites sont davantage liées à des pratiques de sevrage qu’à des catégories générales. On pourrait y trouver pêle-mêle « chewing-gum », « coup de fil à une copine », « verre d’eau », « footing », etc.). L’information n’est pas sanctionnée et peut-être considérée comme de bas niveau (par exemple, un internaute rapporte avoir recouru au cannabis comme substitut nicotinique).
  
4.1.3 Le statut des connaissances
+
====Le statut des connaissances====
  
 +
{| class="wikitable centre" width="80%"
  
 +
|+
  
Sites institutionnels
+
|-
Blogs et forums
+
! scope=col |
Statut
+
! scope=col | Sites institutionnels
 +
! scope=col | Blogs et forums
 +
|-
 +
| width="33%"  align="center"|
 +
Statut  
 +
| width="34%"  align="center"|
 
Exposées
 
Exposées
 +
| width="33%"  align="center"|
 
Produites
 
Produites
 +
|-
 +
| width="33%"  align="center"|
 
Modèle
 
Modèle
 +
| width="34%"  align="center"|
 
Ontologique
 
Ontologique
 +
| width="34%"  align="center"|
 
Praxéologique
 
Praxéologique
 +
|-
 +
| width="33%"  align="center"|
 
Représentation des connaissances
 
Représentation des connaissances
 +
|width="34%"  align="center"|
 
Mots-clés, concepts
 
Mots-clés, concepts
 +
| width="34%"  align="center"|
 
Passages-clés, formes sémantiques
 
Passages-clés, formes sémantiques
 +
|}
 +
 
Figure 3. Statut différentiel des connaissances dans les deux sous-corpus
 
Figure 3. Statut différentiel des connaissances dans les deux sous-corpus
 +
  
 
Dans les textes institutionnels, les connaissances existent en amont de la production textuelles, elles relèvent de savoirs scientifiques, médicaux voire encyclopédiques construit dans d’autres situations énonciatives, d’autres pratiques sociales (par exemple, dans des articles scientifiques). Les connaissances sont des concepts déjà lexicalisés, des termes (qui correspondent à des mots-clés) et la textualité a pour fonction  l’exposition et la mise en relation de ces connaissances. Les textes institutionnels « déploient » des ontologies, ou des mondes conceptuels similaires aux connaissances ontologiques. Dans les textes informels, blogs et forums, les connaissances sont produites par le texte. Elles n’existent pas préalablement aux textes mais résultent de l’élaboration ou de la collaboration des auteurs qui construisent des connaissances partagées En rendant compte de pratiques tabagiques et de scénarii de sevrage par exemple, les textes relèvent d’une praxéologie. Les connaissances dès lors ne sont pas données comme préalables à la mise  en texte, elles sont élaborées par la textualité et n’accèdent pas à proprement parler au statut de concepts, mais de préconcepts ou de connaissances préconceptuelles suivant des modalités textuelles particulières que nous décrirons dans le paragraphe suivant.
 
Dans les textes institutionnels, les connaissances existent en amont de la production textuelles, elles relèvent de savoirs scientifiques, médicaux voire encyclopédiques construit dans d’autres situations énonciatives, d’autres pratiques sociales (par exemple, dans des articles scientifiques). Les connaissances sont des concepts déjà lexicalisés, des termes (qui correspondent à des mots-clés) et la textualité a pour fonction  l’exposition et la mise en relation de ces connaissances. Les textes institutionnels « déploient » des ontologies, ou des mondes conceptuels similaires aux connaissances ontologiques. Dans les textes informels, blogs et forums, les connaissances sont produites par le texte. Elles n’existent pas préalablement aux textes mais résultent de l’élaboration ou de la collaboration des auteurs qui construisent des connaissances partagées En rendant compte de pratiques tabagiques et de scénarii de sevrage par exemple, les textes relèvent d’une praxéologie. Les connaissances dès lors ne sont pas données comme préalables à la mise  en texte, elles sont élaborées par la textualité et n’accèdent pas à proprement parler au statut de concepts, mais de préconcepts ou de connaissances préconceptuelles suivant des modalités textuelles particulières que nous décrirons dans le paragraphe suivant.
  
4.2    Entre le texte et le concept, la forme sémantique
+
===Entre le texte et le concept, la forme sémantique===
 
La tradition linguistique et terminologique privilégie le lexique, et plus particulièrement les groupes nominaux, dans la détermination des concepts. Or, la linguistique, depuis Saussure, pose que le versant psychique d’un signe, le signifié, ne se confond pas avec le concept. Un concept, au sens linguistique proposé ici, n’est donc pas systématiquement lié à un signe particulier, il peut s’actualiser dans une forme sémantique, c’est-à-dire un ensemble de valeurs sémantiques systématiquement cooccurrentes et groupées dans différents textes, relativement stabilisées, mais non nécessairement lexicalisé.
 
La tradition linguistique et terminologique privilégie le lexique, et plus particulièrement les groupes nominaux, dans la détermination des concepts. Or, la linguistique, depuis Saussure, pose que le versant psychique d’un signe, le signifié, ne se confond pas avec le concept. Un concept, au sens linguistique proposé ici, n’est donc pas systématiquement lié à un signe particulier, il peut s’actualiser dans une forme sémantique, c’est-à-dire un ensemble de valeurs sémantiques systématiquement cooccurrentes et groupées dans différents textes, relativement stabilisées, mais non nécessairement lexicalisé.
Par exemple, si les mots « tabac » et « choix » sont en cooccurrence dans un texte et « fumer » et « liberté » dans un autre, on peut avoir deux fois la    même    forme   sémantique    composée    minimalement    des traits
+
Par exemple, si les mots « tabac » et « choix » sont en cooccurrence dans un texte et « fumer » et « liberté » dans un autre, on peut avoir deux fois la    même    forme sémantique    composée    minimalement    des traits
  
 
sémantiques /fumer/ et /liberté/ (à considérer que ces traits sémantiques sont contenus dans les signifiés de ces différentes unités lexicales). Ainsi dans les deux extraits ci-dessous, la forme sémantique /fumer/+/liberté/ est actualisée de façon différentes :
 
sémantiques /fumer/ et /liberté/ (à considérer que ces traits sémantiques sont contenus dans les signifiés de ces différentes unités lexicales). Ainsi dans les deux extraits ci-dessous, la forme sémantique /fumer/+/liberté/ est actualisée de façon différentes :
Opter pour la consommation du tabac/fumer/ relève du choix/liberté/ personnel de l’individu. (http://www.orinfor.gov.rw/DOCS/Sante47.htm)
+
 
Le citoyen est libre/liberté/ de fumer/fumer/ ou de ne pas fumer,  de manger de la salade si ça lui chante et des rillettes s’il en a envie (http://www.le-tigre.net/Fumer-ne-tue-pas.html)
+
*Opter pour la consommation du tabac/fumer/ relève du choix/liberté/ personnel de l’individu. (http://www.orinfor.gov.rw/DOCS/Sante47.htm)
 +
*Le citoyen est libre/liberté/ de fumer/fumer/ ou de ne pas fumer,  de manger de la salade si ça lui chante et des rillettes s’il en a envie (http://www.le-tigre.net/Fumer-ne-tue-pas.html)
 
On  pourrait  évidemment  enrichir  cette  forme  sémantique  des  traits
 
On  pourrait  évidemment  enrichir  cette  forme  sémantique  des  traits
 
/personne/ ou /humain/ mais cette cooccurrence simple est en soi suffisante. Il ne s’agit pas d’un concept à proprement parler mais d’une connaissance préconceptuelle non lexicalisée susceptible de se stabiliser. Cette stabilisation peut mener à un figement lexical (par exemple le syntagme « liberté de fumer ») ou à la constitution de connaissances communes partagées.
 
/personne/ ou /humain/ mais cette cooccurrence simple est en soi suffisante. Il ne s’agit pas d’un concept à proprement parler mais d’une connaissance préconceptuelle non lexicalisée susceptible de se stabiliser. Cette stabilisation peut mener à un figement lexical (par exemple le syntagme « liberté de fumer ») ou à la constitution de connaissances communes partagées.
 
Selon (Rastier 2008), ce que nous appelons ici connaissance préconceptuelle (ou préconnaissance) constitue une connaissance :
 
Selon (Rastier 2008), ce que nous appelons ici connaissance préconceptuelle (ou préconnaissance) constitue une connaissance :
 
Une connaissance est un ensemble de passages de textes (éventuellement multimédia) : dans leurs récurrences, le contenu de ces passages (les fragments) et leurs expressions (les extraits) sont en relation de transformation, ne serait-ce que par changement de position.
 
Une connaissance est un ensemble de passages de textes (éventuellement multimédia) : dans leurs récurrences, le contenu de ces passages (les fragments) et leurs expressions (les extraits) sont en relation de transformation, ne serait-ce que par changement de position.
 +
 
Résultant de figements et de réductions de syntagmes, les mots sont une sorte très particulière de ces passages, et comme les autres passages, ils restent impossibles  à interpréter sans recontextualisation.
 
Résultant de figements et de réductions de syntagmes, les mots sont une sorte très particulière de ces passages, et comme les autres passages, ils restent impossibles  à interpréter sans recontextualisation.
 +
 
En somme, la connaissance est issue d’une décontextualisation de certaines  formes sémantiques saillantes et des expressions qui leur correspondent.
 
En somme, la connaissance est issue d’une décontextualisation de certaines  formes sémantiques saillantes et des expressions qui leur correspondent.
  
 
On peut donc avancer qu’un concept est une forme sémantique lexicalisée. Mais un concept, au sens textuel que nous défendons ici, ne correspond pas forcément à une unité lexicale. La lexicalisation d’une forme sémantique, qui aboutit à la formation du concept, ne doit pas être envisagée exclusivement comme sa naissance, ni même comme l’aboutissement de la conceptualisation. Elle s’apparente davantage à un état de stabilisation provisoire, correspondant à un usage circonscrit d’un point de vue socioculturel et temporel.
 
On peut donc avancer qu’un concept est une forme sémantique lexicalisée. Mais un concept, au sens textuel que nous défendons ici, ne correspond pas forcément à une unité lexicale. La lexicalisation d’une forme sémantique, qui aboutit à la formation du concept, ne doit pas être envisagée exclusivement comme sa naissance, ni même comme l’aboutissement de la conceptualisation. Elle s’apparente davantage à un état de stabilisation provisoire, correspondant à un usage circonscrit d’un point de vue socioculturel et temporel.
  
 +
==Conclusion==
  
5 Conclusion
 
 
En tant que Système d’Organisation des Connaissances, les textes ne permettent pas de niveler les connaissances ni des les laisser indifférenciées. Les ontologies, en globalisant les connaissances, les dé- situent, au détriment de la pertinence.
 
En tant que Système d’Organisation des Connaissances, les textes ne permettent pas de niveler les connaissances ni des les laisser indifférenciées. Les ontologies, en globalisant les connaissances, les dé- situent, au détriment de la pertinence.
  
Ligne 167 : Ligne 224 :
  
  
Remerciements : Nous remercions toute l’équipe du projet  C-MANTIC, ainsi que Manuel Zacklad et Alain Giboin qui ont sollicité ce débat en organisant l’atelier Modèles, méthodes, pratiques pour la conception de logiciels basés sur des SOC à la plateforme AFIA 2009.
+
'''Remerciements''' : Nous remercions toute l’équipe du projet  C-MANTIC, ainsi que Manuel Zacklad et Alain Giboin qui ont sollicité ce débat en organisant l’atelier Modèles, méthodes, pratiques pour la conception de logiciels basés sur des SOC à la plateforme AFIA 2009.
  
  
6 Références bibliographiques
+
==Références bibliographiques==
 
Barlow, J.P., 1994, A taxonomy of information, in Bulletin of the American Society for Information Science, 20, 13-17
 
Barlow, J.P., 1994, A taxonomy of information, in Bulletin of the American Society for Information Science, 20, 13-17
 
Coates, E.J., 1978, Classification in Information Retrieval : Headings and Structure. London, Library Association
 
Coates, E.J., 1978, Classification in Information Retrieval : Headings and Structure. London, Library Association
Ligne 193 : Ligne 250 :
 
{{CIDE fin corps}}
 
{{CIDE fin corps}}
 
{{Clr}}
 
{{Clr}}
[[Catégorie:référence bibliographique, article de conférence]]
+
[[Catégorie:Article de conférence]]
 
[[Catégorie:Article avec PDF]]
 
[[Catégorie:Article avec PDF]]
 
__SHOWFACTBOX__
 
__SHOWFACTBOX__

Version actuelle datée du 7 octobre 2016 à 10:12

Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes


 
 

 
titre
Connaissances prescrites ou connaissances décrites ? L’apport de la sémantique des textes
auteurs
Monique Slodzian (1), Mathieu Valette (2).
Affiliations 
(1) CRIM-ERTIM (EA 2520) INaLCO, Paris
(2) ATILF (UMR 7118) CNRS, Art Diagnosis Centre, 63071 Ormylia, Grèce
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Slodzian.pdf
Mots-clés 
Connaissances prescrites, Vérité forte/vérité faible, Systèmes d’organisation des connaissances, Sémantique des textes, Parcours interprétatif, Planification de l’information, Forme sémantique, Thématisation, Lexicalisation.
Keywords
Prescriptive knowledge, Strong/weak truth, Knowledge Organisation Systems, Text Semantics, Interpretative path, Information planification, Semantic form, thematisation, lexicalisation.
Résumé
L’article vise à montrer que le modèle collaboratif de communication des connaissances revendiqué par le Web 2.0 ne rompt pas de manière significative avec le modèle épistémologique antérieur, issu du positivisme logique, notamment par son primat référentialiste prescriptif. En postulant in fine l’existence de concepts primitifs partagés, il est conduit à reproduire les mêmes limites que le Web sémantique fondé sur un socle de métadonnées réputées universelles. Par ailleurs, une acceptabilité indiscutée des connaissances de vérité faible pose des problèmes de fiabilité et de garantie susceptibles de compromettre le succès du modèle. L’article entend démontrer dans une deuxième partie en quoi la sémantique des textes peut contribuer à objectiver les connaissances par la description de parcours interprétatifs. Considérant que les textes relèvent d’une planification de l’information, l’article explicite la notion de forme sémantique, entre le texte et le concept, et envisage la possibilité de faire émerger des préconnaissances non encore lexicalisées. Cette proposition théorique est illustrée à partir de discours de prévention contre le tabagisme issus du Web.