Wikipedia, A quantitative analysis (thèse)

De Artist
(Redirigé depuis TP)
LogoWikipediaWaitCoupe.png
LogoWikipediaWaitCoupe.png
Essai d'exercice collectif
amélioration d'une traduction Google
La galaxie Wikipédia
Extensions
Semantic MediaWiki (Wiki sémantique)

Cette page est le résultat d'un exercice collectif consistant à améliorer la traduction proposée par Google sur un texte concernant Wikipédia (le résumé d'une thèse).

Ce travail est terminé mais vous pouvez continuer à améliorer la page du wiki Wicri/Ticri

Le cadre de l'exercice

Les premiers pas sur un wiki ne sont pas toujours évidents quand il faut à la fois concevoir un texte ou un message et apprendre à se servir d'un outil informatique. Nous vous proposons donc un exercice à la fois assez simple et malgré tout utile. Il devrait être simple du côté des interactions car il ne demande que des interventions ponctuelles : des corrections de traductions approximatives sur un texte initialement bien construit.

Objectif

Nous vous proposons donc d'améliorer la traduction du résumé de la thèse de José Felipe Ortega Soto.

Titre
Wikipedia: A quantitative analysis (Wikipédia, une analyse quantitative).

En effet, cette thèse, qui interpelle sur la baisse de participation des contributeurs de Wikipédia, fait l'objet de nombreux commentaires dans la presse. Elle fait l'objet d'un signalement sur la page consacrée à Wikipédia de Wicri.

Pour consulter :

Pour suivre le travail collectif

  • si vous souhaitez suivre ce travail, utilisez l'onglet "Historique" en haut de page pour obtenir la trace des interventions.
  • si vous voulez être alerté sur les futures interventions :
    1. utilisez l'onglet "Suivre" (en haut à droite)
    2. pensez à vérifier/mettre à jour votre profil pour demander à être alerté par courriel (en allant sur "Pages spéciales / Préférences" ou en suivant ce lien).

Pour participer / conditions pratiques

  1. Vous devez être enregistré comme utilisateur sur ce wiki
    • Pour savoir si vous êtes inscrit vous pouvez consulter la liste des utilisateurs :
      • en cliquant sur l'onglet "Pages spéciales" puis "liste des utilisateurs"
      • en suivant ce lien
  2. Si vous êtes enregistré, et débutant sur les wikis :
    • Utilisez bien vos prénom et nom comme identifiant, tels qu'ils apparaissent dans la liste
    • Un mot de passe vous sera automatiquement envoyé, à votre adresse électronique, si vous l'avez oublié
  3. Si vous n'êtes pas enregistré, et si vous êtes un professionnel de la recherche ou de l'innovation, vous pouvez nous demander un mot de passe (Jacques.Ducloy@loria.fr).

Pour participer / règles du jeu

Pour laisser la place au jeu collectif, nous vous demandons de limiter vos interventions à une seule amélioration et d'attendre d'autres contributions pour intervenir à nouveau (ceci pour permettre aux débutants d'intervenir sur un texte bourré de coquilles où il leur sera plus facile de trouver une intervention simple à réaliser).

Résumé à traduire

Premier paragraphe

Présentation

Le tableau qui suit donne un exemple du résultat attendu sur le premier paragraphe du résumé.

Le texte original La traduction proposée par Google Un essai d'amélioration

Presently, the Wikipedia project lodges the largest collaborative community ever known in the history of mankind. Due to the large number of contributors, along with the amazing popularity level of Wikipedia in the Web, it has soon become a topic of interest for researchers of many academic disciplines. However, in spite of the increasing significance of Wikipedia in scholar publications over the past years, we oftenly find studies concentrating either on very specific aspects of the project, or else, on a specific language version.

Actuellement, le projet Wikipedia dépose la plus grande communauté de collaboration jamais connu dans l'histoire de l'humanité. En raison du grand nombre de cotisants, ainsi que le niveau de popularité incroyable de Wikipedia dans le Web, il est très vite devenu un sujet d'intérêt pour les chercheurs de nombreuses disciplines universitaires. Toutefois, en dépit de l'importance croissante de Wikipedia dans les publications de l'intellectuel sur les années passées, nous trouvons oftenly études axées tant sur les aspects très spécifiques du projet, ou bien, sur une version spécifique du langage.

Le projet Wikipédia rassemble actuellement la plus large communauté participant à un projet collaboratif depuis l'histoire de l'humanitité. En raison de son gigantesque réseau de contributeurs, associé à sa popularité croissante sur le Web, il est bientôt devenu un sujet d'intérêt pour de nombreuses communautés académiques. Cependant, en dépit de la progression significative des publications autour de Wikipédia, nous ne trouvons très souvent que des études dédiées à un aspect très spécifique du projet ou à une version linguistique.

Texte du paragraphe 1 à améliorer collectivement


Le projet collaboratif Wikipédia rassemble actuellement la plus large communauté jamais réunie, dans toute l'histoire de l'humanité, autour d'une œuvre commune. Son gigantesque réseau de contributeurs, associé à sa popularité croissante sur le Web, en ont rapidement fait un sujet d'intérêt pour de nombreuses communautés académiques. Cependant, en dépit de la progression significative des publications autour de Wikipédia, nous ne trouvons, la plupart du temps, que des études dédiées à un aspect très spécifique du projet ou à une version linguistique.


Deuxième paragraphe

Le texte original

Le texte original La traduction proposée par Google

As a result, there is a need of broadening the scope of previous research works to present a more complete picture of the Wikipedia project, its community of contributors and the evolution of this project over time. This doctoral thesis offers a quantitative analysis of the top ten language editions of Wikipedia, from different perspectives. The main goal has been to trace the evolution in time of key descriptive and organizational parameters of Wikipedia and its community of authors. The analysis is focused on logged authors (those editors who created a personal account to participate in the project). The comparative study encompasses general evolution parameters, a detailed analysis of the inner social structure and stratification of the Wikipedia community of logged authors, a study of the inequality level of contributions (among authors and articles), a demographic study of the Wikipedia community and some basic metrics to analyze the quality of Wikipedia articles and the trustworthiness level of individual authors. This work concludes with the study of the influence of the main findings presented in this thesis for the future sustainability of Wikipedia in the following years.

En conséquence, il est nécessaire d'élargir le champ des recherches précédentes oeuvres à présenter une image plus complète du projet Wikipédia, sa communauté de contributeurs et l'évolution de ce projet dans le temps. Cette thèse propose une analyse quantitative des dix éditions linguistiques de Wikipedia, à partir de perspectives différentes. L'objectif principal a été de retracer l'évolution dans le temps des principaux paramètres descriptifs et d'organisation de Wikipédia et de sa communauté d'auteurs. L'analyse est axée sur les auteurs connecté (ces éditeurs qui ont créé un compte personnel à participer au projet). L'étude comparative englobe paramètres évolution générale, une analyse détaillée de la structure sociale interne et la stratification de la communauté Wikipedia des auteurs connecté, une étude du niveau de l'inégalité des cotisations (entre les auteurs et articles), une étude démographique de la communauté de Wikipédia et certains paramètres de base pour analyser la qualité des articles de Wikipedia et le niveau de fiabilité des auteurs individuels. Ce travail se termine par l'étude de l'influence des principaux résultats présentés dans cette thèse pour la viabilité future de Wikipedia dans les années suivantes.

Texte du paragraphe 2 à améliorer collectivement


Par voie de conséquence, si l'on veut donner une vision plus complète du projet Wikipédia, de sa communauté de contributeurs et de son évolution dans le temps, il est nécessaire de dépasser le champ des travaux de recherche existants. Cette thèse de doctorat propose une analyse quantitative, menée sous différents angles, des dix langues d'édition les plus importantes de Wikipédia. Le principal objectif a été de retracer l'évolution, dans le temps, des principaux paramètres descriptifs et organisationnels de Wikipédia et de sa communauté d'auteurs. L'analyse est axée sur les auteurs enregistrés (les contributeurs qui ont créé leur compte personnel pour participer au projet). L'étude comparative englobe l'évolution générale des paramètres, une analyse détaillée de la structure sociale interne et la stratification de la communauté des auteurs enregistrés sur Wikipédia, une étude des disparités des contributions (entre les auteurs et entre les articles), une étude démographique de la communauté de Wikipédia et certains paramètres de base pour analyser la qualité des articles de Wikipédia et le niveau de crédibilité des auteurs individuels. Ce travail s'achève avec une réflexion sur l'impact que les principaux résultats présentés dans cette thèse pourrait avoir sur la viabilité de Wikipédia dans les années à venir.

Troisième paragraphe

Le texte original

Le texte original La traduction proposée par Google

The analysis of the inequality level of contributions over time, and the evolution of additional key features identified in this thesis, reveals an untenable trend towards progressive increase of the effort spent by the most active authors, as time passes by. This trend may eventually cause that these authors will reach their upper limit in the number of revisions they can perform each month, thus starting a decreasing trend in the number of monthly revisions, and an overall recession of the content creation and reviewing process in Wikipedia. Finally, another important contribution for the research community is WikiXRay, the software tool we have developed to perform the statistical analyses included in this thesis. This tool completely automates the process of retrieving the database dumps from the Wikimedia public repositories, massaging it to obtain key metrics and descriptive parameters, and loading them in a local database, ready to be used in empirical analyses.

L'analyse du niveau de l'inégalité des contributions au fil du temps, et l'évolution des fonctionnalités supplémentaires clés identifiés dans cette thèse, révèle une tendance vers l'accroissement insoutenable progressive de l'effort dépensé par les auteurs les plus actifs, comme le temps passe. Cette tendance mai éventuellement provoquer que ces auteurs atteindront leur limite supérieure du nombre de révisions qu'ils peuvent effectuer chaque mois, commençant ainsi une tendance à la baisse du nombre de révisions mensuelles, et une récession globale de la création de contenu et l'examen des processus dans Wikipédia. Enfin, une autre contribution importante pour la communauté de recherche est WikiXRay, l'outil logiciel que nous avons développé pour effectuer les analyses statistiques inclus dans cette thèse. Cet outil permet d'automatiser complètement le processus de récupération des dépôts de la base de données depuis les dépôts publics Wikimedia, la masser pour obtenir des indicateurs clés et les paramètres descriptifs, et leur chargement dans une base de données locale, prête à être utilisée dans les analyses empiriques.

Texte du paragraphe 3 à améliorer collectivement


L'analyse de l'inégalité des contributions dans le temps et de l'évolution des nouvelles fonctionnalités fondamentales identifiées dans cette thèse met en évidence une tendance à l'augmentation progressive, mais non soutenable à terme, de l'implication des auteurs les plus actifs. Si ce mouvement se maintient, il pourrait amener ces auteurs expérimentés à atteindre le nombre maximum de révisions qu'ils peuvent matériellement effectuer en un mois, ce qui se traduirait alors par une inversion de tendance dans le sens d'une diminution du nombre des révisions mensuelles, ce qui marquerait l'amorce d'une régression globale de la création de contenu et du processus de validation de l'information de Wikipedia. Enfin, WikiXRay, un outil logiciel développé pour mener à bien les analyses statistiques nécessaires à cette thèse, constitue une autre contribution importante pour les communautés de la recherche. Cet outil permet d'automatiser entièrement le processus de récupération des dépôts de la base de données depuis les dépôts publics Wikimedia, de les agréger afin d'obtenir des indicateurs clés et des paramètres descriptifs, et de les charger dans une base de données locale, qui peut alors être utilisée pour réaliser des analyses empiriques.


Quatrième paragraphe

Le texte original

Le texte original La traduction proposée par Google

As far as we know, this is the first research work implementing a comparative analysis, from an quantitative point of view, of the top ten language editions of Wikipedia, presenting complementary results from different research perspectives. Therefore, we expect that this contribution will help the scientific community to enhance their understanding of the rich, complex and fascinating working mechanisms and behavioral patterns of the Wikipedia project and its community of authors. Likewise, we hope that WikiXRay will facilitate the hard task of developing empirical analyses on any language version of the encyclopaedia, boosting in this way the number of comparative studies like this one in many other scientific disciplines.

Pour autant que nous savons, c'est le travail de recherche première mise en œuvre d'une analyse comparative, d'un point de vue quantitatif, des dix premières éditions linguistiques de Wikipedia, la présentation des résultats complémentaires à partir de perspectives de recherche différents. Par conséquent, nous prévoyons que cette contribution aidera la communauté scientifique à renforcer leur compréhension des mécanismes riche, complexe et fascinant travail et des modèles de comportement du projet Wikipédia et sa communauté d'auteurs. De même, nous espérons que WikiXRay facilitera la dure tâche de développer des analyses empiriques sur n'importe quelle version linguistique de l'encyclopédie, renforçant de cette manière le nombre d'études comparatives comme celle-ci dans de nombreuses autres disciplines scientifiques.

Texte du paragraphe 4 à améliorer collectivement


Pour autant que nous le sachions, cette thèse constitue le premier travail de recherche incluant une analyse quantitative comparant les dix premières éditions linguistiques de Wikipedia et présentant des résultats complémentaires issus de différentes perspectives de recherche. Par conséquent, nous souhaitons que cette contribution permette à la communauté scientifique de renforcer sa compréhension des mécanismes de travail et des modèles de comportement riches, complexes et fascinants qui ont cours dans le cadre du projet Wikipédia et dans sa communauté d'auteurs. De même, nous espérons que WikiXRay facilitera la tâche complexe qui consiste à développer des analyses empiriques sur les différentes versions linguistiques de l'encyclopédie, contribuant ainsi à augmenter, dans le cadre de diverses disciplines scientifiques, le nombre d'études comparatives comme celle-ci.