Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Pour une politique ambitieuse des données publiques (2011) chapitre 2

De Wicri France
Révision datée du 23 août 2011 à 15:40 par imported>Thierry Daunois
Logo ponts paristech.png
Pour une politique ambitieuse des données publiques :
Les données publiques au service de l’innovation et de la transparence


Partie 1 - « Open Data » : Contexte et enjeux d’une question sociétale
Chapitre II. La libre réutilisation des données publiques à l'international
RapportDonnéesPubliques2011.png
logo travaux page en cours d'importation

Le sujet de la réutilisation des données publiques et l’appel à la mise à disposition d’informations publiques sous forme brute a émergé dans le contexte des ruptures technologiques et économiques de ces dernières années.

C’est pourtant par deux ruptures politiques, au plus haut niveau de l’État, d’abord aux États-Unis puis en Grande-Bretagne, chaque fois dans un contexte d’alternance politique, qu’il a été concrétisé par une politique ambitieuse d’ouverture des données publiques.

Le chapitre suivant présente un tour d’horizon de ce mouvement d’ouverture des données publiques, et l’historique récent de ces deux principales initiatives gouvernementales, qui l’ont concrétisée à l’international.

 

Le mouvement Open Data

Le terme Open Data, littéralement « données ouvertes » ou « données libres » (au sens « libres de droits »), est utilisé pour désigner des données en libre accès et ouvertes à la réutilisation. Il trouve son origine en 1995 dans une publication du Comité sur les Données géophysiques et environnementales du Conseil national de la Recherche aux États-Unis intitulée « De l’échange complet et ouvert des données scientifiques »[1] :

« Les programmes internationaux de recherche sur le changement global et la surveillance environnementale dépendent du principe d’un échange complet et ouvert des données (i.e. les données et les informations sont rendues disponibles sans restriction, sur une base non discriminatoire, pour un coût réduit à celui des besoins de reproduction et de distribution). »

Le terme, qui désigne donc à l’origine le processus de collaboration des scientifiques autour de données d’expériences partagées afin de multiplier les chances de détecter des erreurs, se tenir mutuellement au courant des nouvelles évolutions, et collaborer à la rédaction d’articles scientifiques, se répand largement au sein de la communauté des chercheurs. Il trouve ensuite un écho dans la communauté des développeurs, notamment parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des données est philosophiquement proche.

Des développeurs, des chercheurs et des économistes de l’information créent ainsi l’Open Knowledge Foundation (OKFN) en 2003 et l’Open Data Foundation (ODaF)[2] en 2006 – organismes à but non lucratif qui cherchent à promouvoir l’adoption de normes mondiales de formats et de métadonnées (description des jeux de données), et le développement de solutions open source pour mutualiser les outils de mise en ligne de données.

Les promoteurs de l’Open Data ont ainsi développé des définitions formelles des critères qui caractérisent des données « ouvertes ». Un groupe de travail « Open Government Data » (OGD) d’experts du Web s’est fixé huit critères assez larges de définition des données publiques ouvertes[3]. L’Open Knowledge Foundation (OKFN), pour sa part, propose onze critères[4], plus axé sur les conditions juridiques acceptables qui doivent se retrouver dans la licence de réutilisation.

Les deux ensembles de critères, qui établissent une première définition des données ouvertes, sont détaillés ci-dessous.

Données complètes : toutes les données sont mises à disposition, sauf exceptions de bon sens.

Données brutes : les données sont telles que collectées à la source. Elles ont la plus fine granularité possible et ne se présentent pas sous des formes agrégées ou modifiées.

Données récentes : les données sont mises en ligne aussi rapidement que possible.

Données accessibles : les données sont accessibles au plus grand nombre d’utilisateurs possible, et réutilisables pour des usages les plus variés.

Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial.

Formats exploitables : les données sont structurées pour permettre le traitement automatisé, et disponibles sous une forme pratique et modifiable.

Formats non-propriétaires : les données sont accessibles dans un format sur lequel aucune entité n’a de contrôle exclusif.

Conditions non discriminatoires : les données sont accessibles à quiconque sans aucune obligation préalable ni inscription, et sans discrimination entre les domaines d’application. Les données sont notamment disponibles aussi bien pour des réutilisations commerciales que personnelles.

Paternité : la licence peut exiger, comme condition pour la redistribution et la réutilisation des données, d’identifier clairement les créateurs de l’oeuvre ou les contributeurs initiaux. Si cette condition est imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des contributeurs à citer doit être clairement indiquée.

Distribution de la licence : les droits attachés aux données s’appliquent à tous ceux à qui elles sont distribuées.

Non-transitivité de la licence : la licence ne peut exiger que toute donnée distribuée conjointement avec une donnée sous licence libre soit aussi elle-même sous licence libre, ce qui serait un frein à la réutilisation de ces données.

Droit d’extraction : si les données sont extraites d’un jeu de données, les utilisateurs de l’extrait doivent bénéficier des mêmes droits que ceux qui sont accordés au jeu de données dans son ensemble.

Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public ou non, l’importance démocratique de l’accès aux informations publiques a conduit à focaliser le débat sur l’Open Government Data, ou la réutilisation des données publiques.

Les évolutions technologiques, le cadre réglementaire (notamment les lois sur le droit à l’information et la Directive européenne sur la réutilisation des informations du secteur public) et l’opportunité politique ont mené au lancement, aux États-Unis, en Grande-Bretagne et ailleurs en Europe notamment, d’initiatives majeures d’ouverture et de réutilisation des données publiques.

États-Unis : initiatives locales, puis démarche fédérale

logo travaux importation en cours à partir de ce point

Grande Bretagne : une impulsion transpartisane du gouvernement

Situations contrastées en Europe