Pour une politique ambitieuse des données publiques (2011) chapitre 2
Les données publiques au service de l’innovation et de la transparence Partie 1 - « Open Data » : Contexte et enjeux d’une question sociétale Chapitre II. La libre réutilisation des données publiques à l'international |
Le sujet de la réutilisation des données publiques et l’appel à la mise à disposition d’informations publiques sous forme brute a émergé dans le contexte des ruptures technologiques et économiques de ces dernières années.
C’est pourtant par deux ruptures politiques, au plus haut niveau de l’État, d’abord aux États-Unis puis en Grande-Bretagne, chaque fois dans un contexte d’alternance politique, qu’il a été concrétisé par une politique ambitieuse d’ouverture des données publiques.
Le chapitre suivant présente un tour d’horizon de ce mouvement d’ouverture des données publiques, et l’historique récent de ces deux principales initiatives gouvernementales, qui l’ont concrétisée à l’international.
Le rapport
École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données publiques : Les données publiques au service de l’innovation et de la transparence. Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie, de l’Énergie et de l’Économie numérique le 13 juillet 2011. Les auteurs
Table des matières
La réédition Wicri
Ce rapport fait l'objet d'une réédition et de réutilisations dans le réseau Wicri. Le texte a été importé dans son intégralité et mis en forme dans un contexte hypertexte. Ce travail a été réalisé par l'équipe Wicri et par des volontaires de l'INIST et du SGAR de Lorraine. Quelques adaptations légères ont du être opérées et figurent dans les pages de discussion. Les principales réutlisations de parties de document sont mentionnées en fin des pages correspondantes. |
Le mouvement Open Data
Le terme Open Data, littéralement « données ouvertes » ou « données libres » (au sens « libres de droits »), est utilisé pour désigner des données en libre accès et ouvertes à la réutilisation. Il trouve son origine en 1995 dans une publication du Comité sur les Données géophysiques et environnementales du Conseil national de la Recherche aux États-Unis intitulée « De l’échange complet et ouvert des données scientifiques »[1] :
« Les programmes internationaux de recherche sur le changement global et la surveillance environnementale dépendent du principe d’un échange complet et ouvert des données (i.e. les données et les informations sont rendues disponibles sans restriction, sur une base non discriminatoire, pour un coût réduit à celui des besoins de reproduction et de distribution). »
Le terme, qui désigne donc à l’origine le processus de collaboration des scientifiques autour de données d’expériences partagées afin de multiplier les chances de détecter des erreurs, se tenir mutuellement au courant des nouvelles évolutions, et collaborer à la rédaction d’articles scientifiques, se répand largement au sein de la communauté des chercheurs. Il trouve ensuite un écho dans la communauté des développeurs, notamment parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des données est philosophiquement proche.
Des développeurs, des chercheurs et des économistes de l’information créent ainsi l’Open Knowledge Foundation (OKFN) en 2003 et l’Open Data Foundation (ODaF)[2] en 2006 – organismes à but non lucratif qui cherchent à promouvoir l’adoption de normes mondiales de formats et de métadonnées (description des jeux de données), et le développement de solutions open source pour mutualiser les outils de mise en ligne de données.
Les promoteurs de l’Open Data ont ainsi développé des définitions formelles des critères qui caractérisent des données « ouvertes ». Un groupe de travail « Open Government Data » (OGD) d’experts du Web s’est fixé huit critères assez larges de définition des données publiques ouvertes[3]. L’Open Knowledge Foundation (OKFN), pour sa part, propose onze critères[4], plus axé sur les conditions juridiques acceptables qui doivent se retrouver dans la licence de réutilisation.
Les deux ensembles de critères, qui établissent une première définition des données ouvertes, sont détaillés ci-dessous.
Données complètes : toutes les données sont mises à disposition, sauf exceptions de bon sens.
Données brutes : les données sont telles que collectées à la source. Elles ont la plus fine granularité possible et ne se présentent pas sous des formes agrégées ou modifiées.
Données récentes : les données sont mises en ligne aussi rapidement que possible.
Données accessibles : les données sont accessibles au plus grand nombre d’utilisateurs possible, et réutilisables pour des usages les plus variés.
Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial.
Formats exploitables : les données sont structurées pour permettre le traitement automatisé, et disponibles sous une forme pratique et modifiable.
Formats non-propriétaires : les données sont accessibles dans un format sur lequel aucune entité n’a de contrôle exclusif.
Conditions non discriminatoires : les données sont accessibles à quiconque sans aucune obligation préalable ni inscription, et sans discrimination entre les domaines d’application. Les données sont notamment disponibles aussi bien pour des réutilisations commerciales que personnelles.
Paternité : la licence peut exiger, comme condition pour la redistribution et la réutilisation des données, d’identifier clairement les créateurs de l’oeuvre ou les contributeurs initiaux. Si cette condition est imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des contributeurs à citer doit être clairement indiquée.
Distribution de la licence : les droits attachés aux données s’appliquent à tous ceux à qui elles sont distribuées.
Non-transitivité de la licence : la licence ne peut exiger que toute donnée distribuée conjointement avec une donnée sous licence libre soit aussi elle-même sous licence libre, ce qui serait un frein à la réutilisation de ces données.
Droit d’extraction : si les données sont extraites d’un jeu de données, les utilisateurs de l’extrait doivent bénéficier des mêmes droits que ceux qui sont accordés au jeu de données dans son ensemble.
Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public ou non, l’importance démocratique de l’accès aux informations publiques a conduit à focaliser le débat sur l’Open Government Data, ou la réutilisation des données publiques.
Les évolutions technologiques, le cadre réglementaire (notamment les lois sur le droit à l’information et la Directive européenne sur la réutilisation des informations du secteur public) et l’opportunité politique ont mené au lancement, aux États-Unis, en Grande-Bretagne et ailleurs en Europe notamment, d’initiatives majeures d’ouverture et de réutilisation des données publiques.