Discussion utilisateur:Cléo Boninsegna

De Wicri Belgique

Echchaimaa el-gharbaoui et moi même intervenons dans le cadre du Master 2 Information et Communication option Documentation Numérique pour le cours ressources documentaires sur le sujet " Exploration autour du libre accès en Belgique".


                                       Synthèse d'étonnement sur le serveur d'exploration autour du libre accès en Belgique  


Réflexion sur le sujet

Le serveur d'exploration sur le libre accès en Belgique est lié au Wiki Belgique, au Wiki TICRI et au Wiki CIDE grâce à ISTEX] (plus de 16 000 000 documents en texte intégral) qui permet de télécharger de vastes corpus dans tous les domaines de la science. Ces corpus sont ici explorés, sous la forme de serveurs d'exploration pour alimenter une activité éditoriale dans un mode « wiki sémantique ».

Première serveur d'exploration

Le premier serveur d'exploration sur le libre accès en Belgique composé de 3696 documents a suscité de premières interrogations en termes de pertinence des résultats.

Pourquoi les projections géographiques concernant notre sujet ne font pas un focus géographique plus spécifique sur la Belgique, bien que les principales affiliations auteurs, régions et villes en soient issues ? 
Pourquoi les principaux mots clés des titres sont en anglais alors que les universités d'affiliations principales sont francophones ? Il est étonnant de voir que la bibliographie est majoritairement composée d'affiliations autres que françaises malgré une proximité géographique et frontalière. 

Ces premières interrogations soulèvent des difficultés en termes de curation du corpus. Pertinence auteur ? Pertinence sujet ? Pertinence revues ?


A titre d'exemple, pourquoi les articles de la revue dont l'ISSN est 1367-2630 ont-ils été sélectionnés ?:

Les articles de la revue dont l'ISSN est 1367-2630 ont été sélectionnés car The New Journal of Physics est une revue en accès libre, le texte comprend donc les mentions "open access" que le contenu propre de l'article n'aborde pas les notions du libre accès en Belgique. De plus, l’affiliation à une Université Belge d'un auteur perturbe également la curation car le contenu du texte ne parle pas de la Belgique.

Ainsi, suite à ces remarques, il est évident que Le premier serveur d'exploration sur le libre accès en Belgique est inexploitable car le bruit empêche l'exploitation de la thématique. Le nombre d'auteurs sélectionnés notamment dans le domaine de la physique est colossal, les collaborations sont fortuites, les articles n'ont aucun rapport avec le sujet mais sont publiés par des belges, ce qui rend le traitement du corpus difficile, notamment pour chercher les associations.

Second serveur d'exploration

Le second serveur d'exploration sur le libre accès en Belgique permet d'étudier les mécanismes de nettoyage du corpus. En effet, grâce à la curation le nombre d'articles pertinent est passé de 3696 à 186 par l'élimination d'un certain nombre de revues dont l'objet n'est pas "le libre accès en Belgique". En effet, dans un contexte de valorisation de la recherche scientifique, les revues en "open access" se développent et conduisent les portails à valoriser cette démarche par les mentions "open access" dans le corps de l'article ou directement sur leur portail car ISTEX alimente son corpus et donne accès à la ressource grâce à son DOI. Ainsi,dans le but d'obtenir des ressources pertinentes, seules les ressources contenant explicitement « open access » dans les métadonnées (description du document) ont été conservées. Les comparaisons entre les deux serveurs sont notamment visibles sur cette page Discussion:Serveur d'exploration autour du libre accès en Belgique. Cependant, le corpus prend toujours en compte

Les projections géographiques à partir du Zoom Open Access., qui montrent les affiliations des auteurs et le mot clé "open access" de cette version du serveur renvoient ici vers des ressources pertinentes.


Ainsi, grâce au second serveur d'exploration sur le libre accès en Belgique il est désormais possible d'identifier les grands acteurs du domaine (personnes ou institutions). A titre d'exemple on peut citer comme auteurs :

  • Peter Gölitz [1]
  • Mark J. Costello [2]
  • Mark Baker [3]

Cependant, il reste des auteurs qui ne sont pas pertinents pour notre thématique de recherche. Pour identifier la pertinence, notamment des revues, il serait plus aisé de mentionner le nom de la revue plutôt que son numéro ISSN.


Ainsi, bien que le serveur d'exploration soit généré à 9/10 par un ordinateur, la présence d'un documentaliste est indispensable pour évaluer la pertinence des ressources et jouer sur les tables de résultats et les zooms.

Possibilité d'évolution du sujet

Les explorations sur Le premier serveur d'exploration sur le libre accès en Belgique et sur Le second serveur d'exploration sur le libre accès en Belgique sont cependant très intéressantes car elles permettent d'identifier d'autres thématiques.

Quels sont les auteurs belges qui publient dans les revues en open access? Quels sont les domaines dans lesquels les auteurs belges publient en open access ? 

De plus, l'exploration sur le serveur d'exploration montre l'importance d'intégrer des utilisateurs dans la conception du serveur d'exploration pour améliorer l'ergonomie et la navigation entre les wikis et au sein de la base de consultation des ressources.


Réflexion d'ordre méthodologique

Index Titre(en)

  • En explorant la page d’index Titre (en), on remarque qu’il y a des termes de plus forte occurrence. On peut se baser sur ces termes afin de repérer les articles qui ne doivent plus figurer sur le corpus. Des termes comme : cancer, surgery, patients, clinical, etc.
  • Par exemple avec le terme « clinical » The EADGENE Microarray Data Analysis Workshop (Open Access publication), le premier article affiché correspond à une revue de psychiatrie où il y a une rubrique (Open-Access). Cette revue dont l'ISSN est 2220-3206 ne doit plus apparaître sur le corpus et on aura donc 2 articles à supprimer.

Revue à éliminer

En parlant des revues qui ne répondent pas pertinemment à notre sujet, plusieurs revues qui devront être supprimer du corpus, ci-dessous leur ISSN:

  • 2076-2615 [4]: Animals : an Open Access Journal from MDPI (14 articles à supprimer)
  • 2164-7844 [5] et 2164-7860 [6] : BioResearch Open Access (20 articles à supprimer)
  • 0999-193X [7]: Genetics, Selection, Evolution : GSE (6 articles à supprimer)
  • 0138-9130 [8] : Scientometrics (En effet, cette revue traite de la science de l’information et du open access mais pas seulement en Belgique, les articles récoltés s’adressent à un contexte Chinois qui sont écris parfois par des belges. On aura donc 6 articles à supprimer. On peut conserver la revue tant qu'elle rentre dans les critères de recherche de notre sujet mais à condition de changer la requête pour avoir plus de pertinence)
  • 1932-6203 [9] : PloS one (4 articles à supprimer)
  • 0264-1615 [10] : Interlending & Document Supply (4 articles à supprimer)

Requête de recherche

  • En interrogeant des moteurs de recherche par la requête: "open access" AND belg* , on a eu des résultats sur des revues qui sont en libre accès dans tout domaine confondu et ce n’est pas du tout pertinent pour notre sujet. Ce qui explique le cas de notre serveur qui repère des revues en libre accès mais dans des domaines non appropriés.
  • Par contre en modifiant la requête en: "article sur open access" AND belg*, on remarque que les résultats sont différents aux autres, par exemple, on a des articles sur : la promotion de l’open access en Belgique, l’open access en Belgique francophone, etc.
  • Dans la même requête on peut prendre en considération « libre accès » autant que terme francophone pour avoir plus de résultats. La requête pourrait devenir : "article sur open access" OR " libre accès" AND belg*, elle nous permet d’avoir des articles très pertinents sur le libre accès en Belgique.

Les mots clés et du titre

  • Les mots clés ne décrivent pas notre sujet avec pertinence mais aussi les articles repérés, à travers ces mots clés, ne s’intéressent pas vraiment au libre accès en Belgique. Exemple de mots clés : Humans [11], Project [12], Female [13], Animals [14]
  • La même remarque sur les mots du titre. Il en faut encore du travail surtout qu’on peut trouver un article ou 2, parmi plusieurs qui sont hors sujet, qui traite du libre accès dans un contexte belge.

Les auteurs:

  • On remarque que certains auteurs écrivent dans des revues qui sont en libre accès mais qui ne traitent pas le libre accès en Belgique.
  • Donnant l’exemple des auteurs : Magali San Cristobal et Michael Watson. Ils écrivent dans une revue en libre accès avec comme sujet de recherche les animaux et ils sont réunit dans les mêmes références The EADGENE Microarray Data Analysis Workshop (Open Access publication).