Wikipedia, A quantitative analysis (thèse) : Différence entre versions

De Wicri SIC
imported>Jacques Ducloy
imported>Jacques Ducloy
 
(2 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
{{Avertissement|texte=page en cours de mise en place}}
 
 
{{Wikipédia galaxie}}  
 
{{Wikipédia galaxie}}  
 
;Titre:Wikipedia: A quantitative analysis
 
;Titre:Wikipedia: A quantitative analysis
Ligne 21 : Ligne 20 :
  
 
{{Artist cadre à droite
 
{{Artist cadre à droite
  |Texte=Ce résumé fait l'objet d'un [[artist.fr:Wikipedia, A quantitative analysis (thèse)|exercice collectif de traduction sur le wiki Artist]].
+
  |Texte=Ce résumé a fait l'objet d'un [[artist.fr:Wikipedia, A quantitative analysis (thèse)|exercice collectif de traduction sur le wiki Artist]].<br/> Le résumé original figure sur la page anglaise correspondante.
 
}}
 
}}
Presently, the Wikipedia project lodges the largest collaborative community ever known in the history of mankind. Due to the large number of contributors, along with the amazing popularity level of Wikipedia in the Web, it has soon become a topic of interest for researchers of many academic disciplines. However, in spite of the increasing significance of Wikipedia in scholar publications over the past years, we oftenly find studies concentrating either on very specific aspects of the project, or else, on a specific language version.  
+
Le projet collaboratif Wikipédia rassemble actuellement la plus large communauté jamais réunie, dans toute l'histoire de l'humanité, autour d'une œuvre commune. Son gigantesque réseau de contributeurs, associé à sa popularité croissante sur le Web, en ont rapidement fait un sujet d'intérêt pour de nombreuses communautés académiques. Cependant, en dépit de la progression significative des publications autour de Wikipédia, nous ne trouvons, la plupart du temps, que des études dédiées à un aspect très spécifique du projet ou à une version linguistique.
  
As a result, there is a need of broadening the scope of previous research works to present a more complete picture of the Wikipedia project, its community of contributors and the evolution of this project over time. This doctoral thesis offers a quantitative analysis of the top ten language editions of Wikipedia, from different perspectives. The main goal has been to trace the evolution in time of key descriptive and organizational parameters of Wikipedia and its community of authors. The analysis is focused on logged authors (those editors who created a personal account to participate in the project). The comparative study encompasses general evolution parameters, a detailed analysis of the inner social structure and stratification of the Wikipedia community of logged authors, a study of the inequality level of contributions (among authors and articles), a demographic study of the Wikipedia community and some basic metrics to analyze the quality of Wikipedia articles and the trustworthiness level of individual authors. This work concludes with the study of the influence of the main findings presented in this thesis for the future sustainability of Wikipedia in the following years.  
+
Par voie de conséquence, si l'on veut donner une vision plus complète du projet Wikipédia, de sa communauté de contributeurs et de son évolution dans le temps, il est nécessaire de dépasser le champ des travaux de recherche existants. Cette thèse de doctorat propose une analyse quantitative, menée sous différents angles, des dix langues d'édition les plus importantes de Wikipédia. Le principal objectif a été de retracer l'évolution, dans le temps, des principaux paramètres descriptifs et organisationnels de Wikipédia et de sa communauté d'auteurs. L'analyse est axée sur les auteurs enregistrés (les contributeurs qui ont créé leur compte personnel pour participer au projet). L'étude comparative englobe l'évolution générale des paramètres, une analyse détaillée de la structure sociale interne et la stratification de la communauté des auteurs enregistrés sur Wikipédia, une étude des disparités des contributions (entre les auteurs et entre les articles), une étude démographique de la communauté de Wikipédia et certains paramètres de base pour analyser la qualité des articles de Wikipédia et le niveau de crédibilité des auteurs individuels. Ce travail s'achève avec une réflexion sur l'impact que les principaux résultats présentés dans cette thèse pourrait avoir sur la viabilité de Wikipédia dans les années à venir.  
  
The analysis of the inequality level of contributions over time, and the evolution of additional key features identified in this thesis, reveals an untenable trend towards progressive increase of the effort spent by the most active authors, as time passes by. This trend may eventually cause that these authors will reach their upper limit in the number of revisions they can perform each month, thus starting a decreasing trend in the number of monthly revisions, and an overall recession of the content creation and reviewing process in Wikipedia. Finally, another important contribution for the research community is WikiXRay, the software tool we have developed to perform the statistical analyses included in this thesis. This tool completely automates the process of retrieving the database dumps from the Wikimedia public repositories, massaging it to obtain key metrics and descriptive parameters, and loading them in a local database, ready to be used in empirical analyses.  
+
L'analyse de l'inégalité des contributions dans le temps et de l'évolution des nouvelles fonctionnalités fondamentales identifiées dans cette thèse met en évidence une tendance à l'augmentation progressive, mais non soutenable à terme, de l'implication des auteurs les plus actifs. Si ce mouvement se maintient, il pourrait amener ces auteurs expérimentés à atteindre le nombre maximum de révisions qu'ils peuvent matériellement effectuer en un mois, ce qui se traduirait alors par une inversion de tendance dans le sens d'une diminution du nombre des révisions mensuelles, ce qui marquerait l'amorce d'une régression globale de la création de contenu et du processus de validation de l'information de Wikipedia. Enfin, WikiXRay, un outil logiciel développé pour mener à bien les analyses statistiques nécessaires à cette thèse, constitue une autre contribution importante pour les communautés de la recherche. Cet outil permet d'automatiser entièrement le processus de récupération des dépôts de la base de données depuis les dépôts publics Wikimedia, de les agréger afin d'obtenir des indicateurs clés et des paramètres descriptifs, et de les charger dans une base de données locale, qui peut alors être utilisée pour réaliser des analyses empiriques.  
  
As far as we know, this is the first research work implementing a comparative analysis, from an
+
Pour autant que nous le sachions, cette thèse constitue le premier travail de recherche incluant une analyse quantitative comparant les dix premières éditions linguistiques de Wikipedia et présentant des résultats complémentaires issus de différentes perspectives de recherche. Par conséquent, nous souhaitons que cette contribution permette à la communauté scientifique de renforcer sa compréhension des mécanismes de travail et des modèles de comportement riches, complexes et fascinants qui ont cours dans le cadre du projet Wikipédia et dans sa communauté d'auteurs. De même, nous espérons que WikiXRay facilitera la tâche complexe qui consiste à développer des analyses empiriques sur les différentes versions linguistiques de l'encyclopédie, contribuant ainsi à augmenter, dans le cadre de diverses disciplines scientifiques, le nombre d'études comparatives comme celle-ci.
quantitative point of view, of the top ten language editions of Wikipedia, presenting complementary results from different research perspectives. Therefore, we expect that this contribution will help the scientific community to enhance their understanding of the rich, complex and fascinating working mechanisms and behavioral patterns of the Wikipedia project and its community of authors. Likewise, we hope that WikiXRay will facilitate the hard task of developing empirical analyses on any language version of the encyclopaedia, boosting in this way the number of comparative studies like this one in many other scientific disciplines.
 
  
 
==Réactions dans la presse==
 
==Réactions dans la presse==

Version actuelle datée du 17 avril 2010 à 17:23

La galaxie Wikipédia
Extensions :
Semantic MediaWiki (Wiki sémantique)
Titre
Wikipedia: A quantitative analysis
Titre traduit
Wikipédia, une analyse quantitative
Auteur
José Felipe Ortega Soto
Université
Universidad Rey Juan Carlos, Madrid, (Espagne)
La thèse
Pour la consulter :
> dans son intégralité (228 pages),
> dans une version de 19 pages.

Quelques résultats

évolution des wikipédiens de langue française
évolution des wikipédiens de langue anglaise

Cette thèse a bénéficié d'une forte audience en raison d'un résultat qui peut paraitre étonnant : le nombre de nouveaux utilisateurs actifs (contributeurs) diminue. Plus exactement, le nombre de départs devient inférieur au nombre de nouveaux arrivants.

Le document contient de très nombreuses statistiques dont nous avons extrait deux courbes (départ et nouveaux entrants) pour 2 langues (français et anglais). On constate que les courbes se croisent en 2007.

Résumé

Artist Logo 1.png

Ce résumé a fait l'objet d'un exercice collectif de traduction sur le wiki Artist.
Le résumé original figure sur la page anglaise correspondante.

Le projet collaboratif Wikipédia rassemble actuellement la plus large communauté jamais réunie, dans toute l'histoire de l'humanité, autour d'une œuvre commune. Son gigantesque réseau de contributeurs, associé à sa popularité croissante sur le Web, en ont rapidement fait un sujet d'intérêt pour de nombreuses communautés académiques. Cependant, en dépit de la progression significative des publications autour de Wikipédia, nous ne trouvons, la plupart du temps, que des études dédiées à un aspect très spécifique du projet ou à une version linguistique.

Par voie de conséquence, si l'on veut donner une vision plus complète du projet Wikipédia, de sa communauté de contributeurs et de son évolution dans le temps, il est nécessaire de dépasser le champ des travaux de recherche existants. Cette thèse de doctorat propose une analyse quantitative, menée sous différents angles, des dix langues d'édition les plus importantes de Wikipédia. Le principal objectif a été de retracer l'évolution, dans le temps, des principaux paramètres descriptifs et organisationnels de Wikipédia et de sa communauté d'auteurs. L'analyse est axée sur les auteurs enregistrés (les contributeurs qui ont créé leur compte personnel pour participer au projet). L'étude comparative englobe l'évolution générale des paramètres, une analyse détaillée de la structure sociale interne et la stratification de la communauté des auteurs enregistrés sur Wikipédia, une étude des disparités des contributions (entre les auteurs et entre les articles), une étude démographique de la communauté de Wikipédia et certains paramètres de base pour analyser la qualité des articles de Wikipédia et le niveau de crédibilité des auteurs individuels. Ce travail s'achève avec une réflexion sur l'impact que les principaux résultats présentés dans cette thèse pourrait avoir sur la viabilité de Wikipédia dans les années à venir.

L'analyse de l'inégalité des contributions dans le temps et de l'évolution des nouvelles fonctionnalités fondamentales identifiées dans cette thèse met en évidence une tendance à l'augmentation progressive, mais non soutenable à terme, de l'implication des auteurs les plus actifs. Si ce mouvement se maintient, il pourrait amener ces auteurs expérimentés à atteindre le nombre maximum de révisions qu'ils peuvent matériellement effectuer en un mois, ce qui se traduirait alors par une inversion de tendance dans le sens d'une diminution du nombre des révisions mensuelles, ce qui marquerait l'amorce d'une régression globale de la création de contenu et du processus de validation de l'information de Wikipedia. Enfin, WikiXRay, un outil logiciel développé pour mener à bien les analyses statistiques nécessaires à cette thèse, constitue une autre contribution importante pour les communautés de la recherche. Cet outil permet d'automatiser entièrement le processus de récupération des dépôts de la base de données depuis les dépôts publics Wikimedia, de les agréger afin d'obtenir des indicateurs clés et des paramètres descriptifs, et de les charger dans une base de données locale, qui peut alors être utilisée pour réaliser des analyses empiriques.

Pour autant que nous le sachions, cette thèse constitue le premier travail de recherche incluant une analyse quantitative comparant les dix premières éditions linguistiques de Wikipedia et présentant des résultats complémentaires issus de différentes perspectives de recherche. Par conséquent, nous souhaitons que cette contribution permette à la communauté scientifique de renforcer sa compréhension des mécanismes de travail et des modèles de comportement riches, complexes et fascinants qui ont cours dans le cadre du projet Wikipédia et dans sa communauté d'auteurs. De même, nous espérons que WikiXRay facilitera la tâche complexe qui consiste à développer des analyses empiriques sur les différentes versions linguistiques de l'encyclopédie, contribuant ainsi à augmenter, dans le cadre de diverses disciplines scientifiques, le nombre d'études comparatives comme celle-ci.

Réactions dans la presse